選擇性剪接是轉錄組多樣性的主要驅動力。Wang et al.(2008, Nature)利用 RNA-seq 估計人類 >95% 的多外顯子基因產生 alternative isoforms,但 GTEx 聯盟的後續分析顯示大多數 low-abundance isoforms 的功能意義待驗證——需區分「功能性剪接」和「剪接噪音(splicing noise)」。
Splicing Code 與深度學習
Barash et al.(2010, Nature)提出 splicing code——以機器學習從序列特徵預測組織特異性剪接。SpliceAI(Jaganathan et al., 2019, Cell)以深度殘差網路直接從 pre-mRNA 序列預測 cryptic splice site activation,AUPRC 遠超傳統方法。在臨床遺傳學中,SpliceAI delta score 已被用於評估 VUS(variants of uncertain significance)的致病性,特別是深層內含子變異和同義突變對剪接的影響。Pangolin(Zeng & Li, 2022, Genome Biol)進一步整合組織特異性。
Splicing 與疾病的分子機制
- SMA:SMN1 缺失後,SMN2 的 exon 7 因 C6T 轉換(破壞 ESE 並創造 ESS)predominantly skipped,僅產生 ~10% 全長 SMN。Nusinersen 靶向 ISS-N1 阻擋 hnRNP A1;Risdiplam 穩定 U1 snRNP-exon 7 5' ss 互作。基因治療 Zolgensma(AAV9-SMN1)則直接替換缺失基因
- Myotonic dystrophy(DM1/DM2):DMPK 3' UTR 的 CTG repeat expansion 轉錄為 CUG repeat RNA,sequester MBNL1 至核內 foci,同時 upregulate CELF1,導致胎兒型剪接模式在成人中異常保留(如 CLCN1 exon 7a inclusion → myotonia)
- 癌症中的 splicing factor 突變:SF3B1、U2AF1、SRSF2 在 MDS/CLL/uveal melanoma 中的 recurrent hotspot mutations 導致系統性 mis-splicing。SF3B1 K700E 改變 branch point 選擇,使用 cryptic 3' ss 產生 neo-antigens
單細胞與長讀長定序
短讀長 scRNA-seq 難以精確量化 isoform。PacBio Iso-Seq 和 Oxford Nanopore direct RNA-seq 可讀取全長 mRNA。結合 single-cell 平台(SCAN-seq2、ScISOr-seq)正在揭示剪接異質性在腫瘤進化和免疫逃逸中的角色。ENCODE 4 和 GENCODE 持續更新 isoform 注釋——目前約 250,000 個 transcript models。
文獻參考:Wang, E.T. et al. (2008). Nature, 456, 470-476. / Jaganathan, K. et al. (2019). Cell, 176, 535-548. / Barash, Y. et al. (2010). Nature, 465, 53-59.
