參數估計是 ODE-based 系統生物學建模中的計算核心挑戰,涉及非線性最佳化、統計推斷、可辨識性分析與實驗設計的深度整合。
Maximum Likelihood vs Bayesian
MLE:θ̂ = argmax P(D|θ)。對高斯噪音等價於最小化加權最小二乘。
Bayesian:P(θ|D) ∝ P(D|θ)·P(θ)。優勢:
- 自然量化不確定性(posterior distribution 而非點估計)。
- 正規化效果(prior 避免過擬合)。
- Model selection:Bayes factor B₁₂ = P(D|M₁)/P(D|M₂),P(D|M) = ∫P(D|θ)P(θ)dθ(marginal likelihood / evidence)。
MCMC 採樣:Adaptive Metropolis(AM)自動調整 proposal covariance;Hamiltonian Monte Carlo(HMC)利用梯度資訊高效探索高維空間(需 ODE solver + sensitivity equations 計算 ∂y/∂θ)。
Sensitivity Equations for Gradient Computation
對 ODE dx/dt = f(x,θ),參數敏感度 s_j = ∂x/∂θ_j 滿足:
ds_j/dt = (∂f/∂x)·s_j + ∂f/∂θ_j
此線性 ODE(variational equation)與原始 ODE 同時積分,提供精確梯度給 gradient-based optimizer 和 HMC。Adjoint sensitivity(反向積分)在參數數量遠大於觀測時間點時更高效——與 Neural ODE 的 backpropagation 等價。
Profile Likelihood 與 Confidence Intervals
Profile likelihood PL(θ_i) = max_{θ_(-i)} L(θ)。95% 信心區間由 −2·log(PL(θ_i)/L(θ̂)) < χ²₁,0.95 = 3.84 定義。
Profile likelihood 分類:
- 有限信心區間 → structurally & practically identifiable。
- 無限信心區間 but monotone PL → structurally identifiable, practically non-identifiable(需更多數據)。
- 完全平坦 PL → structurally non-identifiable(模型結構問題)。
Approximate Bayesian Computation (ABC)
當 likelihood 無法寫出(如 stochastic model 的 CME 無解析似然)時,ABC 用模擬代替似然計算:
- Sample θ ~ P(θ)
- Simulate D_sim ~ Model(θ)
- Accept if distance(D_sim, D_obs) < ε
ABC-SMC(Sequential Monte Carlo;Toni et al., J R Soc Interface, 2009)逐步降低 ε,用 importance sampling 提高效率。
Optimal Experimental Design (OED)
FIM F(θ) = E[∇log P(D|θ) · ∇log P(D|θ)^T]。Cramér-Rao bound: Cov(θ̂) ≥ F⁻¹。
D-optimal design: max det(F)(最小化 confidence ellipsoid volume)。
A-optimal: min trace(F⁻¹)。
E-optimal: max λ_min(F)。
OED 決定最佳實驗條件(測哪些物種、在哪些時間點、用什麼刺激)以最大化參數辨識的資訊量。
軟體:Data2Dynamics (MATLAB)、PEtab + pyPESTO (Python) 為 benchmark 標準;AMICI 提供高效 ODE solver + sensitivity;Monolix / NONMEM 專用於藥物動力學。
文獻:Raue et al. (2009) Bioinformatics 25:1923-1929 / Villaverde et al. (2019) Briefings in Bioinformatics 20:1655-1671 / Hass et al. (2019) PLoS Comput Biol 15:e1007223 (PEtab benchmark).
