蛋白質體學提供系統生物學從基因型到表型之間最關鍵的分子中間層數據,其技術進展直接推動了 multi-omics 整合和網路建模的精準度。
DIA 與 Library-Free Search
DIA(如 SWATH-MS / diaPASEF)的關鍵進展:
- Spectral library 需求被 library-free 搜尋(DIA-NN; Demichev et al., Nat Methods, 2020)取代——用 in silico predicted spectra(Prosit / MS²PIP)取代實驗 library,大幅降低前置成本。
- diaPASEF(Meier et al., Nat Methods, 2020)結合 TIMS(trapped ion mobility spectrometry)+ parallel accumulation,在 timsTOF Pro 上達到 ~6,000 proteins/hour 的通量。
Single-Cell Proteomics
SCoPE2 / plexDIA(Slavov lab)和 nanoPOTS + TMT 實現 ~1,000-3,000 proteins per single cell。關鍵瓶頸:sensitivity(單細胞蛋白質量 ~100-200 pg vs bulk ~μg)。Sample preparation miniaturization(nanodroplet processing)和 ion accumulation 是技術突破方向。
與 scRNA-seq 的比較:蛋白質與 mRNA 的相關性 r ≈ 0.4-0.6(Schwanhäusser et al., Nature, 2011),因為 translation rate、degradation rate、PTM 都增加了 mRNA 到蛋白質的非線性映射。因此蛋白質體提供 transcriptomics 無法替代的資訊。
Thermal Proteome Profiling (TPP)
Savitski et al.(Science, 2014)利用蛋白質在配體結合後熱穩定性改變的原理:梯度加熱 → 測量各溫度殘餘蛋白質量 → 擬合 melting curve。Shift in melting temperature = drug target engagement。TPP 可在全蛋白質體規模篩選藥物靶點(包括間接靶點),無需化學修飾或親和層析。
Proteogenomics
整合基因組 / 轉錄組定義 sample-specific protein database,偵測突變肽段(single amino acid variant, SAAV)、novel splice junction、非編碼 RNA 翻譯產物。CPTAC(Clinical Proteomic Tumor Analysis Consortium)系統分析 >1,000 腫瘤的 proteogenomics,發現 genomic driver 不一定在蛋白質層級被翻譯(翻譯效率差異),以及 phospho-driven signaling rewiring 不見於 transcriptome。
計算流程:MaxQuant / DIA-NN(搜尋引擎)→ Perseus / MSstats(統計分析)→ KSEA / PhosphoPath(磷酸化通路分析)→ OmicsIntegrator / MOFA(多體學整合)。
文獻:Aebersold & Mann (2016) Nature 537:347-355 / Demichev et al. (2020) Nat Methods 17:41-44 / Slavov (2022) Science 378:eabq4180 (single-cell proteomics review).
