染色體的結構組織是基因體功能的物理基礎,從核小體到染色體領域(chromosome territory),每一個層級的結構都與基因調控密切相關。
核小體的結構與動態
Luger et al.(1997)解析的核小體高解析度晶體結構(2.8 Å)顯示,組蛋白八聚體由 (H3-H4)₂ 四聚體和兩個 H2A-H2B 二聚體組成。DNA 與組蛋白的互作主要是非序列特異性的——磷酸骨架與組蛋白的正電荷殘基之間的靜電互作。然而,DNA 序列影響核小體的穩定性——AA/TT/TA 二核苷酸偏好出現在小溝朝內的位置,GC 偏好朝外,形成核小體定位偏好(nucleosome positioning preference)。
組蛋白修飾與表觀遺傳密碼
組蛋白 N 端尾部伸出核小體表面,是轉譯後修飾(PTM)的主要靶點。「組蛋白密碼假說」(Strahl & Allis, 2000)提出特定的修飾組合被特定的「讀取」蛋白識別,調控下游功能:
- H3K4me3:活化啟動子(被 TAF3-PHD finger 讀取)
- H3K9me3:異染色質標記(被 HP1 的 chromodomain 讀取)
- H3K27me3:Polycomb 沉默(被 PRC1 的 chromodomain 讀取)
- H3K36me3:轉錄延伸標記
- H4K16ac:染色質去壓縮(干擾 30 nm 纖維形成)
這些修飾由特定的「寫入」酶(如 SET domain 甲基轉移酶、HATs)和「擦除」酶(如 KDMs、HDACs)動態調控。
染色質的三維組織——Hi-C 時代
Lieberman-Aiden et al.(2009)開發的 Hi-C 技術揭示了基因體的多層次三維結構:
- 染色體領域(Chromosome Territories, CT):每條染色體佔據細胞核中特定的空間區域,基因豐富的染色體傾向位於核心位置
- A/B 區室(Compartments):A 區室為開放、活躍染色質,B 區室為緊密、沉默染色質,在數 Mb 尺度上交替分佈
- 拓撲關聯域(TADs):約 200 kb-2 Mb 的自互作域,TAD 內的序列互作頻率顯著高於 TAD 間。TAD 邊界由 CTCF 和 cohesin 維持——CTCF 的結合位點方向性(convergent orientation)決定了環擠出(loop extrusion)模型中 cohesin 的停止位置
- 染色質環(Chromatin Loops):增強子-啟動子互作的結構基礎,由 CTCF/cohesin 或 Mediator/cohesin 介導
著絲粒的表觀遺傳決定
人類著絲粒的位置不僅由 DNA 序列(α-satellite)決定,更依賴表觀遺傳標記——CENP-A(著絲粒特異性 H3 變體)取代一般 H3 標記著絲粒位置。新著絲粒(neocentromere)可以在沒有 α-satellite 的區域形成,證明著絲粒的本質是表觀遺傳的。CENP-A 的自我複製依賴 Mis18 複合體和 HJURP 分子伴侶在 G1 期的裝載。
端粒生物學
端粒酶(TERT + TERC)以 TERC RNA 為模板延伸端粒 DNA 的 3' 突出端(G-overhang)。端粒的 T-loop 結構(3' 突出端摺回並侵入雙鏈區域)和 shelterin 蛋白複合體(TRF1, TRF2, POT1, TIN2, TPP1, RAP1)共同保護端粒免受 DNA 損傷反應(DDR)的錯誤識別。TRF2 的失去導致端粒被識別為 DNA 雙股斷裂,啟動 ATM 依賴的 DDR 和末端融合。
端粒縮短是細胞老化的「分子時鐘」。Hayflick 極限(約 50-70 次分裂)對應到端粒縮短至臨界長度。端粒酶在幹細胞和生殖細胞中活躍,在大多數體細胞中沉默。85-90% 的癌症重新活化端粒酶(TERT 啟動子突變是常見機制),其餘使用 ALT(Alternative Lengthening of Telomeres)——基於同源重組的端粒維護途徑。
染色體結構異常
結構異常可透過 G-banding 或 FISH 偵測,包括缺失(deletion)、重複(duplication)、倒位(inversion)、轉位(translocation)、環狀染色體(ring chromosome)和等臂染色體(isochromosome)。Robertson 轉位(Robertsonian translocation)是近端著絲粒染色體在著絲粒處融合,人類最常見的是 rob(13;14) 和 rob(14;21)——後者的帶因者有較高風險生出唐氏症後代。
