突變是基因體變異的根本來源,從單一核苷酸變異(SNV)到大規模結構變異(SV)和染色體數目異常,不同層次的突變各有獨特的分子機制、修復路徑和表型後果。高通量定序時代使我們能以前所未有的解析度描繪突變譜(mutational spectrum)、推斷突變過程(mutational processes),並連結基因型與臨床表型。
點突變的分子機制與突變特徵
DNA 聚合酶的固有錯誤率約 10⁻⁴-10⁻⁵/鹼基/複製,經 3'→5' 校對外切酶活性(proofreading)降至約 10⁻⁷,再經錯配修復系統(MMR,核心組分為 MSH2-MSH6/MSH3 識別錯配、MLH1-PMS2 啟動切除)進一步降至 10⁻⁹-10⁻¹⁰。MMR 基因的失活(如 Lynch 症候群中 MLH1/MSH2 的生殖系突變)導致微衛星不穩定性(MSI-High),是大腸直腸癌、子宮內膜癌等的分子特徵,也是免疫檢查點抑制劑的生物標記。
置換突變的模式具強烈的序列情境依賴性。Alexandrov et al.(2013, Nature)分析了 >7,000 個腫瘤基因體,以 96 種三核苷酸情境(5'鄰接鹼基 + 突變鹼基 + 3'鄰接鹼基)為特徵,透過非負矩陣因子分解(NMF)歸納出突變特徵(mutational signatures)。截至 COSMIC v3.4 已識別出 >80 種 SBS(single base substitution)特徵,代表性的包括:
- SBS1:5-甲基胞嘧啶的自發脫胺(C→T at CpG),與年齡正相關,被視為「分裂時鐘」
- SBS4:菸草中苯並芘代謝物的 DNA 加成物,以 C→A 顛換為主
- SBS6/15:MMR 缺陷特徵,以 C→T at NpCpG 和微衛星 indels 為主
- SBS13:APOBEC 胞苷脫胺酶的活性(C→G at TpCpN),與病毒感染和基因體壓力有關
Indels 的分子基礎與 NMD 機制
小型 indels(1-50 bp)常發生在同聚物序列(homopolymers)和短串聯重複序列(STRs)中,主因是 DNA 複製時的滑動(replication slippage)。編碼區的非 3n indels 造成移碼,通常在下游引入提前終止密碼子(PTC),觸發無義介導 mRNA 降解(NMD)——NMD 辨識位於最後一個外顯子-外顯子接合處複合體(EJC)上游 >50-55 nt 的 PTC,透過 UPF1/UPF2/UPF3B 複合物招募 SMG1 激酶啟動 mRNA 降解。NMD 的生物學意義在於防止截斷蛋白的產生,但最後一個外顯子或倒數第二個外顯子最後 50 nt 內的 PTC 可逃脫 NMD,可能產生具顯性負效應的截斷蛋白(如某些 TP53 突變)。
三核苷酸重複擴增疾病(trinucleotide repeat expansion disorders)是一類特殊的 indel 病理機制。CAG 重複擴增(亨丁頓氏症、脊髓小腦萎縮症)中,重複序列形成非典型 DNA 結構(髮夾、滑動環、R-loop),干擾複製和轉錄偶聯修復,導致世代間重複數目傾向擴增(anticipation)。RNA 層面上,CUG/CGG 重複可形成 RNA 焦點(RNA foci)隔離 RNA 結合蛋白(如肌強直性營養不良中 MBNL1 被隔離),導致剪接調控失常。
結構變異的機制學
大規模結構變異(SVs, >50 bp)的產生機制主要有:
NAHR(Non-Allelic Homologous Recombination):由低複製數重複序列(LCRs/segmental duplications)介導。同向 LCRs 之間的 NAHR 產生重複和缺失(reciprocal products),反向 LCRs 產生倒位。DiGeorge 症候群(22q11.2 缺失,發生率 ~1/4000)即由 LCR22s 間的 NAHR 引起。
NHEJ/MMEJ:非同源末端接合(NHEJ)和微同源末端接合(MMEJ/alt-EJ)修復 DNA 雙股斷裂(DSBs)時可能連接非同源斷端,造成易位或複雜重排。Ku70/Ku80-DNA-PKcs 複合物介導 NHEJ;Pol θ 介導 MMEJ。
FoSTeS/MMBIR:複製叉停滯後模板轉換(Fork Stalling and Template Switching)和微同源介導的斷裂誘導複製(Microhomology-Mediated Break-Induced Replication)可解釋複雜基因體重排。Chromothripsis(Stephens et al., 2011, Cell)——染色體碎裂後隨機重組——可在單一事件中產生數十到數百個 SVs,常見於癌症基因體,也在先天性疾病中有報導。Chromoplexy(連鎖易位)和 kataegis(局部超突變)是其他複雜突變模式。
非整倍體的分子基礎與嵌合現象
非整倍體主要源於減數分裂 I 的非分離(MI nondisjunction),母體年齡效應的分子機制涉及 cohesin 蛋白(REC8, SMC1β)在卵母細胞中隨年齡降解(Nagaoka et al., 2012, Nat Rev Genet),削弱姊妹染色分體凝聚和交叉位點維持。近年 Gruhn et al.(2019)的核型分析顯示,人類卵母細胞中非整倍體發生率在 >35 歲女性中急劇上升至 >30%。
有絲分裂後的嵌合型非整倍體在腫瘤生物學中的重要性日益被認知。染色體不穩定性(CIN)——每次有絲分裂都有概率發生染色體錯誤分離——是腫瘤異質性和抗藥性的重要來源(Bakhoum & Cantley, 2018, Cell)。CIN 的分子機制涉及中心體擴增(centrosome amplification)、著絲粒-微管連接錯誤(merotelic attachments)和紡錘體檢查點(SAC)削弱。
突變率的演化與基因體內變異
突變率在基因體內分布高度不均:晚複製區域突變率較高(Stamatoyannopoulos et al., 2009);轉錄活躍區域因轉錄偶聯核苷酸切除修復(TC-NER)而突變率較低;開放染色質區域在某些突變過程中突變率反而較高(如 APOBEC 活性)。
Lynch(2010)的比較基因體分析揭示,每代每核苷酸突變率(μ)與有效族群大小(Nₑ)呈負相關,暗示遺傳漂變限制了 DNA 修復效率的演化精進——小族群中漂變的力量使得微幅提升修復效率的等位基因無法被天擇有效固定。人類的生殖系突變率約 1.0-1.5 × 10⁻⁸/bp/代(Kong et al., 2012, Nature),其中約 80% 來自父方,且隨父親年齡每年增加約 1-2 個突變。
