大1 · 第2學期生物統計實驗設計

隨機化方法

Randomization Methods

難度 2 · 基礎experimental-design

隨機化的因果推論理論和現代設計涉及潛在結果框架和適應性隨機化。

Rubin 因果模型（Potential Outcomes Framework）

每個個體有兩個潛在結果：Yᵢ(1)（若接受治療）和 Yᵢ(0)（若未接受）。因果效應 τᵢ = Yᵢ(1) − Yᵢ(0)，但只能觀察到一個（fundamental problem of causal inference）。隨機化保證 E[Ȳ(1) − Ȳ(0)] = E[τ]（Average Treatment Effect, ATE 的不偏估計）。

Covariate-Adaptive Randomization

超越簡單分層：Pocock & Simon（1975）的最小化法（minimization）和 Begg & Iglewicz（1980）的 biased-coin design 在多個協變數上動態平衡。理論上 covariate-adaptive 隨機化的 ATE 估計量仍然一致，但推論需考慮設計特徵（Ma et al., 2020, Ann Stat）。

Cluster Randomized Trials

隨機化單位是群體（如醫院、學校、村莊）而非個體。分析需考慮群內相關（ICC）。有效樣本量 n_eff = mk/(1+(m−1)ρ)，m = 群大小，k = 群數，ρ = ICC。GEE（Generalized Estimating Equations）和 mixed-effects model 是標準分析方法。Stepped-wedge design（所有群組最終都接受介入，但時間隨機）越來越常用。

Mendelian Randomization（MR）

利用自然界的「隨機分配」——等位基因在減數分裂中的隨機分配（孟德爾第二定律）作為工具變數。MR 假設：(1) relevance（基因型與暴露相關），(2) independence（基因型與干擾無關），(3) exclusion restriction（基因型只經由暴露影響結果）。Two-sample MR 以 GWAS summary statistics 進行，不需個體數據。MR-Egger 和 weighted median 方法檢測和修正 horizontal pleiotropy。

Fisher Randomization Test

在 sharp null（H₀: Yᵢ(1) = Yᵢ(0) for all i）下，隨機化分配是唯一的隨機來源。枚舉或模擬所有可能的分配，計算每次的檢定統計量，得精確 p 值。不需大樣本漸近，對任何統計量適用。

文獻參考：Fisher, R.A. (1935). The Design of Experiments. / Rubin, D.B. (1974). J Educ Psychol, 66, 688-701. / Davey Smith, G. & Ebrahim, S. (2003). Int J Epidemiol, 32, 1-22.

互動工具