虛擬篩選的前沿融合了 AI 方法學、化學空間探索和超大規模計算。
深度學習打分函數
傳統打分函數(empirical: Glide SP/XP; knowledge-based: PMF; physics-based: MM-GBSA)的準確度受限於參數化和構象採樣不足。深度學習打分函數(GNINA — CNN-based re-scoring; OnionNet; PafnuCy)以 PDBbind 等結構-親和力數據集訓練。問題:(1) 過擬合到 PDBbind 的化學空間;(2) pocket-specific memorization 而非真正的結合機制學習。CASF(Comparative Assessment of Scoring Functions)benchmark 顯示 DL scoring 在 ranking power 上改善有限。
Make-on-Demand Chemical Libraries
Enamine REAL(> 36 billion)、WuXi GalaXi(> 120 billion)——這些分子尚未合成但可在 2-4 週內按需合成。ultra-large VS 面臨的挑戰:(1) 計算成本(10¹⁰ docking ~10⁶ CPU-hours);(2) 化學多樣性 vs 冗餘。解決方案:hierarchical VS(先 pharmacophore filter 再 docking)、reactant-based VS(Lyu et al., 2019, Nature 的 V-SYNTHES 方法——在虛擬合成的反應物空間搜索)。Lyu et al. 從 ZINC 的 1.38 億分子中以 docking 篩選 D4 dopamine receptor 的新化學型(chemotypes),命中率 30%。
Generative Models 和 de novo Design
VAE(Variational Autoencoder)、RNN 和 Diffusion Model(如 DiffSBDD, Schneuing et al., 2023)直接在靶標口袋的 3D 結構約束下生成新分子。REINVENT(Blaschke et al.)以 RL(Reinforcement Learning)最佳化 SMILES 生成器產出具有特定屬性(docking score, QED, SA score)的分子。Structure-conditioned generation(Pocket2Mol, TargetDiff)是最新方向。
Multi-target 和 Polypharmacology VS
系統藥理學(systems pharmacology)觀點認為許多疾病需要多靶標干預。以 proteome-wide docking(以同一分子對多個靶標對接)或 network pharmacology 框架進行 multi-target VS,識別具有有利的 selectivity profile 的分子。
文獻參考:Lyu, J. et al. (2019). Nature, 566, 224-229. / Gorgulla, C. et al. (2020). Nature, 580, 663-668. / Sadybekov, A.V. et al. (2022). Nature, 601, 452-459.
