全基因組關聯研究(GWAS)的方法學與發現
GWAS 比較病例和對照的全基因組 SNP 頻率差異→鑑定與疾病關聯的基因位點。技術基礎:linkage disequilibrium(LD)——附近的 SNP 傾向一起遺傳→tag SNP 可代表周圍的遺傳變異。統計閾值:p < 5 × 10⁻⁸(genome-wide significance,校正 ~100 萬次獨立檢驗的 Bonferroni correction)。截至 2024 年,GWAS Catalog 收錄 >6000 篇研究、>500,000 個 SNP-trait 關聯。主要發現:大多數 GWAS hits 在 non-coding regions(intergenic 或 intronic)→影響 enhancer、promoter 或 splicing regulatory elements→功能詮釋需結合 eQTL(expression quantitative trait loci)和 chromatin accessibility(ATAC-seq)數據。
Missing Heritability 問題
GWAS 鑑定的 common variants(MAF >5%)通常 effect size 很小(OR 1.05-1.5),加總僅解釋疾病遺傳度的 10-30%。「遺失的遺傳度」可能來源:(1) rare variants(MAF <1%,effect size 較大但 GWAS 難偵測→需 WGS)(2) structural variants(CNV, inversions)(3) gene-gene interaction(epistasis)(4) gene-environment interaction (5) epigenetic factors。Omnigenic model(Boyle et al., Cell, 2017)提出:幾乎所有基因都通過 trans-regulatory network 間接影響疾病→core genes 直接相關,peripheral genes 通過基因調控網絡傳遞效應。
Polygenic Risk Score(PRS)的臨床轉譯
PRS = Σ(effect size × allele count) across genome-wide SNPs。冠心病 PRS 可鑑定出風險等同 FH 雜合子的高風險人群(top 8% PRS ≈ 3-fold risk,Khera et al., NEJM, 2016)。臨床應用的挑戰:(1) PRS 在發現族群(多為歐洲裔)外的預測力下降(portability problem)→非歐洲裔的 GWAS 代表性不足 (2) effect size 小→個人層次的預測力有限→更適合群體層次的風險分層 (3) 基因-環境交互作用使 PRS 的預測因生活方式不同而變動。Multi-ancestry GWAS 和 Biobank 計劃(UK Biobank, All of Us)正在改善代表性。
表觀遺傳學(Epigenetics)在多因子疾病中的角色
DNA methylation、histone modification 和 non-coding RNA 不改變 DNA 序列但影響基因表現。DOHaD(Developmental Origins of Health and Disease)假說:子宮內營養不良→DNA methylation pattern 改變→出生後代謝適應不當→成年期肥胖和糖尿病風險↑(Dutch Hunger Winter 研究:二戰荷蘭飢荒期間在子宮內的胎兒,60 年後 IGF2 基因 methylation 仍異常低)。Transgenerational epigenetic inheritance 在人類中的證據仍有限但在動物模型中已確認。
文獻參考:Khera, A.V. et al. (2016). NEJM, 375, 2349-2358. / Boyle, E.A. et al. (2017). Cell, 169, 1177-1186 (Omnigenic model).
