跳至主要內容
2 · 第1學期遺傳學孟德爾遺傳學

數量遺傳

Quantitative Genetics

難度 3 · 進階geneticsstatistics

數量遺傳學建立在 Fisher(1918)的開創性論文「The Correlation between Relatives on the Supposition of Mendelian Inheritance」之上,該文將達爾文的連續變異觀與孟德爾的粒子遺傳成功統一,奠定了現代演化綜合論的統計基礎。

無限基因座模型(Infinitesimal Model)

Fisher 的無限基因座模型假設數量性狀由無限多個效應無限小的基因座控制,每個基因座貢獻微小的加成效果。在此假設下,由中央極限定理,遺傳值(breeding value)的分佈為常態分佈,且不受選擇的影響——選擇只改變均值,不改變遺傳方差。這個「魯棒性」是該模型的重要特性,使得育種者方程式 R = h²S 在多代選擇中仍然適用。

然而,GWAS 時代的資料顯示大多數複雜性狀的遺傳架構介於「少數大效應基因」和「無限微效基因」之間——大部分變異由效應較小但統計顯著的基因座解釋,加上大量效應極微的基因座。

遺傳率的概念精確化

遺傳率是族群層級的參數,依賴於特定族群和環境背景。幾個常見誤解需要澄清:

  1. h² = 0.8 不表示個體表現型的 80% 由基因決定——個體沒有「遺傳率」
  2. 高遺傳率不等於不受環境影響——1950 年代芬蘭男性身高的遺傳率很高,但整個族群的平均身高在改善營養後大幅增加
  3. 遺傳率是特定族群、特定環境下的估計值,不能跨族群或跨環境外推

GWAS 與遺失的遺傳率(Missing Heritability)

以身高為例:雙生研究估計 h² ≈ 0.8,但早期 GWAS 找到的顯著基因座只能解釋約 5% 的變異。這個「遺失的遺傳率」引發了廣泛討論。可能的解釋包括:

  1. 常見變異的微小效應未達統計顯著:Yang et al.(2010)使用 GCTA(Genome-wide Complex Trait Analysis)方法,用所有 SNP 同時估計方差成分,顯示常見 SNP 可解釋身高約 45% 的變異——大部分「遺失」的遺傳率藏在未達 GWAS 顯著閾值的微效 SNP 中

  2. 稀有變異:MAF <1% 的變異不被標準 GWAS 晶片捕捉,但可能有較大的效應量

  3. 結構變異(CNV、indels):GWAS 主要分析 SNP,結構變異的貢獻被低估

  4. 基因-基因互作(上位效應)基因-環境互作(G×E):標準 GWAS 的加成模型不捕捉這些非加成效應

  5. 標籤不完全性(imperfect tagging):tag SNP 與因果變異的 LD 不完全,導致效應被低估

最新的大規模研究(如 GIANT consortium, n > 5,000,000)已鑑定超過 12,000 個與身高相關的獨立 SNP,共同解釋約 40% 的表現型方差。多基因風險分數(Polygenic Risk Score, PRS)結合所有 SNP 效應後可解釋更多方差。

PRS 的建構與應用

PRS = Σ βᵢ × xᵢ(β 為效應量,x 為等位基因劑量)

PRS 在疾病風險預測中的應用日益重要。Khera et al.(2018)顯示冠心病 PRS 最高 8% 的個體風險等同於單基因家族性高膽固醇血症。然而,PRS 面臨多項挑戰:

  1. 跨族群可移植性差:GWAS 以歐洲族群為主,PRS 在其他族群的預測力顯著降低(Martin et al., 2019),加劇健康不平等
  2. 臨床效用:PRS 在族群層面有統計顯著的預測力,但對個體的鑑別力(AUC 改善)通常有限
  3. 倫理問題:PRS 用於行為性狀(如教育程度)引發社會公平性爭議

數量性狀基因座定位(QTL Mapping)

QTL mapping 使用連鎖分析或關聯分析鑑定影響數量性狀的基因體區域。在模式生物中,重組近交系(RIL)、近等基因系(NIL)和雜種不親和(heterogeneous stock)設計提供了精密的 QTL 定位。eQTL(expression QTL)將基因表現量視為數量性狀,鑑定影響基因表現的調控變異——這為 GWAS 信號的功能詮釋提供了關鍵橋樑(Colocalisation analysis: 同一位點的 GWAS 信號和 eQTL 信號是否來自同一因果變異)。

互動工具

動手玩玩看

用互動元件直接感受這個概念,比純文字快 10 倍搞懂。三個 tier 共用同一個工具。

這個和什麼有關