內容簡介
近年,很多研究集中到診斷試驗的設計方法和診斷準確度分析方法方麵。《診斷醫學中的統計學方法》(第二版)繼續提供這個領域更為深入的設計和分析方法,幫助讀者全麵理解這類研究,以及將研究結果推廣到患老人群的實際應用中。
本書作者對於如何衡量診斷試驗準確度以及設計問題做瞭基本介紹,很好地定義瞭不同的診斷準確度評價指標,描述瞭設計診斷準確度研究的策略,並且給齣瞭估計和比較診斷準確度的重要的統計學方法。第二版新的內容包括:
●用於檢驗和定位病竈的診斷試驗方法
●推薦協變量調整方法
●估計和比較診斷試驗預測值以及樣本爨估計的方法
●證實性偏倚和不完善金標準的校正方法
●當存在預試驗數據時,多名閱片者研究的樣本量估計方法
●嵌入隨機效應的meta分析方法
書中三個實例全麵地反映齣瞭診斷試驗中存在的設計和統計學問題,並在附錄中提供瞭所有實例的數據,同時在網站中提供瞭使用FOR下RAN、SAS和R語言編製的軟件包,以便讀者能夠自己實現分析。
《診斷醫學中的統計學方法》(第二版)可以作為研究生階段生物統計學課程極好的補充材料,同時能夠為臨床工作者和醫學、流行病學及生物統計學的研究老提供有價值的參考依據。
作者簡介
周曉華,博士,美國華盛頓大學生物統計係教授,美國聯邦政府退伍人事務部生物統計部主任、美國生物統計學會會員,發錶超過100篇有關診斷醫學和因果推斷的學術論文。
內頁插圖
目錄
第一部分 基本概念和方法
第一章 緒論
1.1 診斷試驗準確度研究
1.2 實例介紹
1.2.1 實例1:甲狀旁腺疾病
1.2.2 實例2:結腸癌診斷
1.2.3 實例3:頸動脈狹窄
1.3 軟件
1.4 本書沒有包含的主題
第二章 診斷準確度評價指標
2.1 靈敏度與特異度
2.1.1 衡量診斷試驗準確度的基本指標:實例2
2.1.2 具有連續型檢查結果的診斷試驗:人工心髒瓣膜實例
2.1.3 具有等級型檢查結果的診斷試驗:實例1
2.1.4 疾病患病率與疾病譜對靈敏度和特異度的影響
2.1.5 FPR和FNR與α和β的類比
2.2 靈敏度與特異度的綜閤指標
2.2.1 兩個及以上診斷試驗準確度比較時存在的問題:實例1
2.2.2 診斷試驗結果的正確率
2.2.3 優勢比和Youden指數
2.3 受試者工作特徵麯綫(ROC)
2.3.1 ROC麯綫:人造心髒瓣膜和實例1
2.3.2 關於ROC麯綫的假定
2.3.3 擬閤的光滑ROC麯綫
2.3.4 ROC麯綫的優點
2.4 ROC麯綫下麵積
2.4.1 ROC麯綫下麵積的解釋
2.4.2 ROC麯綫下麵積的大小
2.4.3 ROC麯綫下麵積:實例1
2.4.4 ROC麯綫下麵積的誤解
2.5 固定FPR的靈敏度
2.6 部分ROC麯綫下麵積
2.7 似然比
2.7.1 關於似然比的三個實例
2.7.2 似然比的缺點
2.7.3 常規與非常規ROC麯綫
2.8 真實診斷結果不是二分類情況的ROC分析
2.9 比較預測模型的c統計量和其他指標
2.10 多個病竈的檢測與定位
2.11 陽性和陰性預測值、貝葉斯定理及實例2
2.11.1 貝葉斯定理
2.12 ROC麯綫的最佳決策閾值
2.12.1 最大化分類的最優閾值
2.12.2 最小化成本的最優閾值
2.12.3 最佳決策閾值:以快速眼動為抑鬱癥生物標識的實例
2.13 多項試驗的結果解釋
2.13.1 平行聯閤診斷
2.13.2 序貫診斷試驗
第三章 診斷準確度的研究設計
3.1 確定研究目標
3.2 識彆目標患者總體
3.3 選擇患者抽樣計劃
3.3.1 第一階段:探索研究
3.3.2 第二階段:挑戰研究
3.3.3 第三階段:臨床研究
……
第四章 單一樣本的參數估計與假設檢驗
第五章 兩種診斷試驗準確度的比較
第六章 樣本量的估計
第七章 診斷準確度研究中的meta分析
……
第二部分 高級方法
第八章 獨立數據的ROC迴歸分析
第九章 多位閱片者多項診斷試驗的分析與評價研究
第十章 校正證實性偏倚的方法
第十一章 校正非完美金標準偏倚的方法
第十二章 Meta分析中的統計學分析方法
附錄A 實例介紹以及第八章數據
附錄B 估計方差和置信區間的刀切法及bootstrap方法
參考文獻
索引
前言/序言
診斷試驗經常用於確定病人是否需要接受額外的診斷、治療以及乾預,而這將影響病人的最終結局,所以診斷試驗研究在醫學中起到非常重要的作用。因此,臨床醫生給齣的診斷試驗結果對於診斷試驗準確度的評價就顯得非常重要,為瞭確保正確地評價診斷試驗的準確度,需要臨床醫生能夠較好地設計診斷試驗,並理解這些方法如何正確地應用到病人身上進行診斷,本書主要有兩個目的:一是提供閤適的方法正確地設計診斷試驗和分析診斷試驗的準確度;二是幫助臨床醫生更好地理解這些診斷試驗的結果,並能夠應用到實際,
新版書中根據新發錶的診斷試驗評價方法,更新瞭每章的內容。更新的內容包括:用於檢測和定位病變部位的診斷試驗評價方法(第二章、第三章和第九章);診斷試驗中需要調整的協變量類型(第三章),以及相應的協變量調整方法(第八章);估計和比較診斷試驗預測值的方法(第四章和第五章);使用預測值作為診斷試驗準確度評價標準的樣本量估計方法(第六章);具有預試驗結果數據時,多位閱片者研究設計類型的樣本量估計方法(第六章);具有連續型結果指標的診斷試驗存在證實性偏倚時,ROC麯綫估計值新的校正方法(第十章);具有等級型或者連續型結果指標的診斷試驗存在非完美金標準情況時,ROC麯綫估計值的校正方法(第十一章)。
本版書中還增加瞭三個實例:正電子發射斷層掃描(PET)用於比較檢測患病的甲狀旁腺準確性的研究;計算機輔助檢測結腸息肉準確性的研究;磁共振成像(MRI)用於診斷動脈狹窄準確性的研究(第一章)。這三個實例用於闡述本書中介紹的統計學方法,具體數據詳見附錄,
本書的整體結構如下:
第二章和第三章分彆介紹瞭有關診斷試驗準確度評價的一些基本的衡量指標以及研究設計類型,同時講解瞭用於評價診斷試驗準確度的統計學方法,並通過實例闡述瞭如何正確應用這些統計學方法。第四章和第五章分彆闡述瞭準確度的估計方法,並比較瞭不同設計情況下診斷試驗的準確度。第六章介紹瞭診斷試驗樣本量的估算方法。第七章和第十二章集中介紹瞭如何進行診斷試驗準確度的meta分析及相應的統計學方法。第八章和第九章分彆介紹瞭多種病人情況及多位閱片者設計的診斷試驗準確度評價模型。第十章及第十一章分彆介紹瞭診斷試驗研究中存在證實性偏倚及非完美金標準時,診斷試驗準確度估計值的校正方法。第一章到第三章介紹瞭診斷試驗中基本的統計學概念以及醫學術語,第四章到第七章的內容為生物統計專業人員介紹瞭基本的數據分析方法,第八章到第十二章介紹瞭高級的統計學內容,同時也提供瞭更為詳細的統計學方法。
疾病診斷的智慧之光:統計學在現代醫學中的應用 在疾病診斷的漫長而復雜的研究過程中,精準與可靠是永恒的追求。從最初的癥狀觀察到最終的診斷結論,每一步都凝聚著醫學工作者的智慧與經驗。然而,隨著醫學科學的飛速發展,數據量的爆炸式增長,以及疾病譜的不斷變化,僅僅依靠直覺和經驗已經不足以應對日益嚴峻的挑戰。在這個關鍵時刻,統計學這門古老而充滿活力的學科,以其強大的數據分析能力和嚴謹的邏輯思維,逐漸成為現代醫學診斷不可或缺的“智慧之光”。 本書並非一本詳盡介紹具體醫學診斷技術或疾病治療方案的臨床手冊,它更專注於揭示隱藏在疾病診斷流程背後的數學語言——統計學。我們將深入探討,如何運用統計學的方法,將紛繁復雜的醫學數據轉化為具有深刻洞察力的診斷依據,從而提升診斷的準確性、效率和可信度。本書的目光聚焦於統計學在整個診斷醫學體係中的核心地位,從基礎概念的梳理,到高級應用的展現,旨在為醫學研究者、臨床醫生以及相關領域的學生提供一個全麵而深入的視角。 數據的力量:從原始信息到診斷洞察 醫學診斷的基石是數據。這些數據來源廣泛,包括患者的病史、體格檢查結果、實驗室檢測指標(如血常規、生化、影像學檢查)、基因組學信息,甚至來自可穿戴設備和遠程監測的生理信號。然而,原始數據本身往往雜亂無章,其中蘊含的真正信息需要經過精心的提煉和解讀。統計學恰恰提供瞭這一能力。 本書將首先帶領讀者認識不同類型醫學數據的特徵,例如分類數據(如疾病是否存在)、計數數據(如特定細胞的數量)、測量數據(如血壓、血糖值)等。理解數據的類型是選擇閤適統計分析方法的前提。在此基礎上,我們將介紹描述性統計學的基本工具,如均值、中位數、標準差、頻率分布等,它們能夠幫助我們概括和展示數據的基本特徵,形成對疾病狀況的初步認識。例如,通過計算某項血液指標的均值和標準差,我們可以瞭解該指標在一組健康人群中的正常範圍,從而為判斷個體患者的異常值提供基準。 然而,描述性統計僅僅是起點。真正的挑戰在於如何從樣本數據推斷齣更廣泛的人群規律,以及如何量化不確定性。這正是推斷性統計學大顯身手之處。本書將重點闡述抽樣分布、置信區間和假設檢驗等核心概念。理解這些概念,我們就能科學地評估基於樣本數據得齣的診斷結論在多大程度上可以推廣到更廣闊的患者群體,以及我們對這一結論的信心程度。例如,一項新的診斷方法的準確性是基於有限數量的患者樣本評估得齣的,通過置信區間,我們可以知道這個準確性評估值可能存在的範圍,從而更客觀地判斷該方法的可靠性。假設檢驗則幫助我們科學地迴答“這個新方法的診斷準確性是否顯著高於現有方法?”這類問題,避免主觀臆斷。 衡量診斷的“標尺”:敏感性、特異性與預測值 在疾病診斷的實踐中,我們最關心的莫過於一個診斷工具(如一種檢測方法、一個影像學特徵)的“好壞”。然而,“好壞”並非一個模糊的概念,它需要精確的量化。統計學提供瞭量化診斷工具性能的“標尺”。 本書將深入解析幾個至關重要的診斷評價指標:敏感性(Sensitivity)、特異性(Specificity)、陽性預測值(Positive Predictive Value, PPV)和陰性預測值(Negative Predictive Value, NPV)。我們會詳細探討它們的定義、計算方法及其在臨床決策中的意義。例如,敏感性衡量的是診斷工具正確識彆齣所有真實患病個體的能力,即“不漏診”的程度;特異性則衡量的是診斷工具正確識彆齣所有健康個體的能力,即“不誤診”的程度。當一個患者的檢測結果呈陽性時,陽性預測值告訴我們他真正患病的概率有多大;而陰性預測值則在患者檢測結果呈陰性時,告訴我們他真正健康的概率有多大。 理解這些指標的局限性也同樣重要。例如,PPV和NPV會受到疾病在人群中的患病率(prevalence)的影響。本書將通過圖錶和實際案例,深入淺齣地解釋這些概念,讓讀者能夠清晰地理解如何評估和選擇最適閤特定臨床場景的診斷工具,並能準確解讀其檢測結果。 揭示關聯:風險因素、相關性與預測模型 疾病的發生往往不是單一因素作用的結果,而是多種因素相互作用的體現。統計學能夠幫助我們揭示這些潛在的關聯,識彆疾病的風險因素,並構建預測模型,從而更早地、更準確地識彆高危人群,或預測疾病的發展趨勢。 本書將介紹相關性分析,幫助我們理解兩個或多個變量之間是否存在綫性或非綫性關係,以及這種關係的強度和方嚮。例如,我們可能想知道吸煙是否與肺癌的發病風險顯著相關。然而,相關性不等於因果性。因此,本書也將重點探討因果推斷的統計學方法,盡管這是一個復雜而前沿的領域,我們將從基本原理齣發,介紹如何通過觀察性研究的設計和分析,盡可能地推斷齣因果關係。 更進一步,我們將深入探討迴歸分析,這是構建預測模型的核心工具。無論是在綫性迴歸中預測一個連續的健康指標(如血壓),還是在邏輯迴歸中預測一個二元的疾病發生概率(如是否患上某種心髒病),迴歸模型都提供瞭強大的預測能力。本書將詳細介紹不同類型的迴歸模型,包括它們的應用場景、模型假設、參數估計以及模型評估的方法。例如,通過構建一個包含年齡、性彆、傢族史、膽固醇水平等多個變量的邏輯迴歸模型,我們可以為每個個體計算其未來罹患心血管疾病的概率,從而實現精準的風險分層和早期乾預。 把握不確定性:生存分析與時間序列分析 在臨床實踐中,我們不僅關心疾病的診斷,還關心疾病的預後和治療效果。生存分析是一種專門用於分析“事件發生時間”數據的統計學方法,它在腫瘤學、流行病學等領域具有極其重要的應用。本書將介紹生存函數的概念,Kaplan-Meier麯綫的繪製和解釋,以及Log-rank檢驗的應用,幫助讀者理解如何評估治療方法的有效性,比較不同組彆患者的生存結局,以及預測患者的生存時間。 此外,對於需要監測病情變化和評估治療動態的場景,時間序列分析也提供瞭有力的工具。本書將介紹時間序列數據的基本特徵,如何進行趨勢和季節性分析,以及常用的時間序列模型,如ARIMA模型,用於預測未來的病情發展。例如,通過對患者體溫、血壓等生理指標進行時間序列分析,我們可以及時發現病情惡化的跡象,並調整治療方案。 從理論到實踐:統計軟件與研究設計 統計學的應用離不開強大的統計軟件。本書雖然不直接教授某一款軟件的操作,但會提及在醫學統計分析中常用的軟件工具,並強調理解統計學原理的重要性,因為隻有理解瞭原理,纔能正確有效地使用這些工具。 最後,本書還將觸及統計學在醫學研究設計中的關鍵作用。一個嚴謹的研究設計是獲得可靠數據和得齣有效結論的前提。我們將探討隨機對照試驗(RCT)、隊列研究、病例對照研究等不同研究設計的特點、優缺點以及它們對統計分析選擇的影響。理解研究設計的原則,能夠幫助研究者避免潛在的偏倚,提高研究的科學性和說服力。 結語:統計學,為診斷醫學注入科學的力量 本書旨在提供一個關於統計學在診斷醫學中應用的全麵而深入的視角。我們相信,通過掌握和運用統計學的方法,醫學工作者能夠更有效地解讀復雜的醫學數據,做齣更精準的診斷決策,更科學地評估診斷工具的性能,更深入地理解疾病的發生機製,並最終為患者提供更優質的醫療服務。統計學,正以其嚴謹的邏輯和量化的力量,為診斷醫學注入源源不斷的科學活力,引領我們走嚮一個更加精確、高效和智能的未來。