流行病學作為公共衛生的基礎科學,其方法學框架在 20 世紀歷經數次典範轉移:從 19 世紀 John Snow 的「瘴氣 vs 水源傳播」之爭,到 20 世紀中葉 Doll & Hill(1950)確立吸菸與肺癌的因果關係,再到當代的分子流行病學和因果推論革命。
研究設計的方法學進階
病例對照研究的現代變體:
- 巢式病例對照研究(nested case-control):在已有世代研究中抽取病例和對照,結合了世代研究的時序優勢和病例對照的效率。
- 病例世代研究(case-cohort design):Prentice(1986)提出的設計,從世代中隨機抽取子世代作為對照,可同時研究多個疾病終點。
- 自身對照研究(self-controlled case series, SCCS):Farrington(1995)開發的設計,每個個體作為自己的對照,消除個體間的混雜因素,特別適合疫苗安全性研究。
因果推論的現代框架:
Bradford Hill 準則(1965)長期作為因果判斷的指導原則,但缺乏嚴格的數學基礎。Judea Pearl 的結構因果模型(Structural Causal Model, SCM)和有向無環圖(DAG, Directed Acyclic Graph)為因果推論提供了形式化框架(Pearl, Causality, 2009)。DAG 的核心應用包括:
- 識別混雜因子(confounder):後門準則(backdoor criterion)
- 避免碰撞偏差(collider bias):條件化碰撞變量會打開偽相關路徑
- 中介分析(mediation analysis):前門準則(front-door criterion)
Hernán & Robins(Causal Inference: What If, 2020)系統整合了反事實框架和觀察性數據的因果推論方法,包括 inverse probability weighting(IPW)、g-estimation 和 targeted maximum likelihood estimation(TMLE)。
傳染病動態的數學建模
經典 SIR 模型(Kermack & McKendrick, 1927)以微分方程描述:
- dS/dt = -βSI/N
- dI/dt = βSI/N - γI
- dR/dt = γI
R₀ = β/γ,群體免疫閾值 = 1 - 1/R₀。
現代擴展包括:SEIR 模型(加入潛伏期 Exposed)、考慮空間異質性的 metapopulation 模型、個體為基礎的模型(agent-based model, ABM)、以及整合人口流動大數據的即時預測模型。Lipsitch et al.(2003, Science)在 SARS 疫情中率先使用即時 R_t 估算指導公衛決策;Cori et al.(2013, American Journal of Epidemiology)開發的 EpiEstim 方法成為 COVID-19 疫情中 R_t 估算的標準工具。
分子流行病學與基因組流行病學
全基因組定序(WGS)整合流行病學調查,實現高解析度的傳播鏈重建。Gardy et al.(2011, NEJM)的結核病研究首次展示 WGS 如何修正傳統接觸者追蹤的誤判。COVID-19 疫情中,GISAID 和 Nextstrain 平台的基因組監測資料即時追蹤變異株演化和跨國傳播。
基因組關聯研究(GWAS)與流行病學的整合產生了「孟德爾隨機化」(Mendelian Randomization, MR)——利用遺傳變異作為暴露的工具變量(instrumental variable),在觀察性數據中進行因果推論。Davey Smith & Hemani(2014, Human Molecular Genetics)系統闡述了 MR 的假設、方法和限制。
偏差與效度的系統性分析
Rothman, Greenland & Lash(Modern Epidemiology, 4th ed., 2021)定義了三大偏差類型:
- 選擇偏差(selection bias):研究對象的選取與暴露-疾病關聯相關。存活者偏差(survivorship bias)和 Berkson's bias 是經典案例。
- 資訊偏差(information bias):暴露或疾病的測量誤差。非差異性錯分(nondifferential misclassification)傾向稀釋效應(bias toward null),差異性錯分方向不定。
- 混雜偏差(confounding):第三變量同時與暴露和結果相關。控制方法包括限制、配對、分層、多變量回歸和傾向分數法(propensity score methods, Rosenbaum & Rubin, 1983)。
VanderWeele(2019, Annals of Internal Medicine)提出的 E-value 為評估未測量混雜因子的影響提供了統一的敏感度分析指標。
