跳至主要內容
4 · 第1學期生物資訊學結構生物資訊

AlphaFold資料庫

AlphaFold Database

難度 3 · 進階structural-bioinformaticsdatabase

AlphaFold 蛋白質結構資料庫(AlphaFold DB)由 DeepMind 與 EMBL-EBI 於 2021 年聯合發布,至第四版已收錄超過 2.14 億個蛋白質的預測結構,涵蓋 UniProt 中幾乎所有已知蛋白質序列(Varadi et al., 2022)。

AlphaFold2 架構與方法學
AlphaFold2(Jumper et al., 2021)的核心創新在於 Evoformer 模組:輸入為多序列比對(MSA)和模板結構,通過交替的行注意力(row attention)和列注意力(column attention)更新 MSA 表示,同時以三角更新(triangular update)和三角注意力維護殘基對(pair representation)的幾何一致性。Structure Module 以等變 transformer 迭代精修 3D 座標,以 FAPE loss(Frame Aligned Point Error)監督訓練。在 CASP14 中,AlphaFold2 於自由建模(FM)目標的中位 GDT-TS 達 92.4(Jumper et al., 2021),遠超次佳方法。

信心指標與品質評估
pLDDT(predicted Local Distance Difference Test)為每個殘基的局部精度指標:> 90 表示高信心(backbone 精度 ~1 Å RMSD),70–90 為中等信心(主鏈可靠但側鏈可能不準確),< 50 通常對應固有無序區(IDR)或構象可塑區。PAE(Predicted Aligned Error)矩陣則評估殘基間相對位置的信心,對判斷結構域間排列尤為重要。

AlphaFold-Multimer 與蛋白質複合體
Evans et al.(2022)擴展 AlphaFold2 至多聚體預測:將多條鏈的 MSA 配對拼接後輸入 Evoformer,以交互作用界面的 DockQ 分數評估。在 CASP15 中表現優異但對瞬態或弱交互作用預測仍有困難。

對結構生物學的影響
AlphaFold DB 使得冷凍電鏡(cryo-EM)和 X 光晶體學的分子替換(molecular replacement)效率大幅提升——預測結構可直接作為搜索模型(Terwilliger et al., 2022)。藥物開發中,AlphaFold 結構已用於虛擬篩選和先導化合物優化(Ren et al., 2023),但活性位點側鏈構象的不確定性仍需分子動力學模擬或實驗驗證。

限制與前沿
AlphaFold2 預測單一構象,無法捕捉構象集合體(conformational ensemble)和變構調節。Wayment-Steele et al.(2023)嘗試以 MSA 亞取樣誘導多構象預測。AlphaFold3(Abramson et al., 2024)將架構擴展至小分子、核酸和翻譯後修飾的複合體預測,採用擴散模型(diffusion model)生成原子座標。

互動工具

動手玩玩看

用互動元件直接感受這個概念,比純文字快 10 倍搞懂。三個 tier 共用同一個工具。

這個和什麼有關