跳至主要內容
3 · 第2學期演化生物學演化機制

族群遺傳學進階

Advanced Population Genetics

難度 4 · 專業evolutiongenetics

進階族群遺傳學以隨機過程、統計推論、分子層級資料為三大支柱,近 15 年因全基因組資料爆發而急速演進。

擴散方程與穩態分布

Wright(1937)求得突變-選擇-漂變穩態的等位頻率分布:
φ(p) ∝ p^(4Nₑu − 1)·(1 − p)^(4Nₑv − 1)·e^(4Nₑsp)

提供從頻率分布反推 Nₑs、Nₑu 的理論基礎。Site Frequency Spectrum(SFS)是此分布在樣本中的直接表徵,∂a∂i(Gutenkunst et al., 2009)與 fastsimcoal2(Excoffier et al., 2013)從 SFS 最大似然推估人口參數。

合併理論延伸

  • 結構合併(structured coalescent):子族群、遷移率併入追溯過程。
  • 選擇合併(ancestral selection graph, ASG):Krone & Neuhauser(1997)以 branching-coalescing 雙事件描述選擇下合併。
  • Sequential Markovian Coalescent(SMC, SMC', MSMC):跨基因組位點的合併樹馬可夫近似,用於從單套全基因組推估過去數十萬年 Nₑ 軌跡(Li & Durbin, 2011, Nature)。

選擇偵測的統計武器

工具 原理 偵測訊號
Tajima's D π − θ_W 擴張/掃除 (D<0)、瓶頸/平衡 (D>0)
Fay-Wu's H 高頻衍生等位 Hard sweep
iHS 延伸單倍型 不完全 sweep
XP-EHH 跨族群 EHH 局部 sweep
F_ST outliers 極端分化 局部適應
PBS 三族群樹枝長度 近期定向選擇
SDS 單倍型時間 千年內 polygenic selection

群體混合(admixture)的量化

  • F-statistics(Patterson et al., 2012, Genetics):F3(X; A, B) 檢測 X 是否為 A, B 混合;F4 測試拓撲與混合。
  • ADMIXTURE(Alexander et al., 2009, Genome Res)以 K 個祖源成分估計每個體混合比例。
  • Globetrotter / DATES 用 LD 衰減估計混合時間。

古 DNA 時代後,這些方法揭示:印歐語族擴散伴隨 Yamnaya 基因流入歐洲(Haak et al., 2015, Nature)、美洲原住民單一主入口論被 Population Y 訊號挑戰(Skoglund et al., 2015, Nature)。

Polygenic Adaptation 與數量性狀

身高、膚色等為 polygenic,適應常以微小頻率變化分布於數百位點呈現,不產生 hard sweep。工具:

  • Singleton Density Score(SDS, Field et al., 2016, Science):從稀有等位單倍型長度估計近千年選擇。
  • Polygenic Risk Score × 族群對照:檢驗 GWAS SNPs 的方向性偏差。
  • Haller 警示:LD block structure、族群分層未校正可能產生偽訊號(Berg et al., 2019;Sohail et al., 2019 同期撤銷英國身高選擇訊號)。

近交族群與 ROH

Runs of Homozygosity(ROH)長度分布區分近期近交(長 ROH)vs. 古代小 Nₑ(短 ROH)。人類平均 ROH 總長約 50–200 Mb,醫學相關(McQuillan et al., 2008, AJHG)。

理論前沿

  • spatial coalescent 與地景遺傳學整合。
  • ancient DNA time-series 直接估計選擇係數(Mathieson 2020)。
  • ARG reconstruction(Relate, Speidel et al., 2019;tsinfer/tsdate, Kelleher et al., 2019)以 Ancestral Recombination Graph 統一所有族群遺傳推論。
  • deep learning(diploS/HIC, SIA)直接從原始序列張量辨識選擇。

族群遺傳學已從 1970 年代允許 sample size 10 的統計框架,演化成處理百萬個體、全基因組、跨時間尺度的計算生物學——仍以 Hardy、Fisher、Wright、Kimura 的基本方程為骨幹。

互動工具

動手玩玩看

用互動元件直接感受這個概念,比純文字快 10 倍搞懂。三個 tier 共用同一個工具。

這個和什麼有關