分子對接的理論框架涉及構型空間搜索演算法和結合自由能估計,是結構基礎藥物設計(SBDD)流程中虛擬篩選的計算引擎。
搜索演算法的數學基礎
構型搜索本質上是高維非凸最優化問題。AutoDock Vina(Trott & Olson, 2010)使用 Broyden-Fletcher-Goldfarb-Shanno(BFGS)局部最優化搭配 Iterated Local Search(ILS)進行全域搜索。GOLD 使用遺傳演算法(GA):染色體編碼配體的旋轉鍵角度、氫鍵網路和平移/旋轉參數,透過交叉、突變和選擇操作演化最優構型。Glide 先用 hierarchical filtering(shape complementarity → grid-based force field → Monte Carlo minimization)減少搜索空間。
評分函數的熱力學基礎
結合自由能 ΔG_bind = ΔH - TΔS = ΔG_vdW + ΔG_elec + ΔG_desolv + ΔG_conf + ΔG_entropy。經驗評分函數將此分解為可參數化的項:AutoDock 4 的 ΔG = W_vdw × Σ(A/r^12 - B/r^6) + W_hbond × Σ(C/r^12 - D/r^10) + W_elec × Σ(qi qj / ε r) + W_desolv × Σ(S_i V_j + S_j V_i) e^(-r²/2σ²) + W_tor × N_tor。參數由 PDBbind refined set 的實驗 Ki/Kd 數據擬合。
共識評分與虛擬篩選策略
單一評分函數的 Pearson correlation 與實驗 pKd 通常僅 0.5-0.7。共識評分(consensus scoring)使用多個評分函數的排名或分數取交集,能顯著降低假陽性率。多階段虛擬篩選流程:pharmacophore filtering → docking(AutoDock Vina/Glide SP)→ re-scoring(MM-GBSA)→ visual inspection → experimental validation。
機器學習革命
- DiffDock(Corso et al., 2023):使用 diffusion generative model 在 SE(3) 上生成配體姿態,在 PDBBind 2020 上的 blind docking success rate 顯著超越 Vina/Glide
- Uni-Mol:大規模預訓練的 3D molecular representation,用於 pose prediction 和 affinity prediction
- AlphaFold3(2024):將 small molecule docking 整合進蛋白質結構預測框架,用 diffusion model 同時預測蛋白質和配體的構象
自由能微擾法(FEP)
FEP(Free Energy Perturbation)和 TI(Thermodynamic Integration)使用分子動力學模擬精確計算結合自由能差 ΔΔG(通常精度 ~1 kcal/mol),但計算成本高(每對化合物需要數天 GPU 時間)。Schrödinger FEP+ 和 OpenFE 使結合親和力的精確預測在 lead optimization 階段成為可行。
