大4 · 第2學期系統生物學生物網路

網路分析

Network Analysis

難度 3 · 進階systems-biologybioinformatics想做成互動版

網路分析在系統生物學中提供了從還原論到整體論的橋樑，整合圖論、統計物理與機器學習方法來解構生物複雜性。

數學框架與矩陣表示

網路以鄰接矩陣 A 表示，A_ij = 1（或權重 w_ij）若節點 i、j 之間有邊。Laplacian 矩陣 L = D − A（D 為度矩陣）的特徵值譜（spectrum）攜帶網路拓撲資訊：第二小特徵值 λ₂（algebraic connectivity / Fiedler value）衡量網路連通性，λ₂ = 0 表示網路斷裂。譜聚類（spectral clustering）利用 L 的前 k 個特徵向量做模組劃分，理論基礎為 Cheeger inequality。

進階中心性指標

除基礎的 degree 與 betweenness 外：

Eigenvector Centrality：x_i = (1/λ₁)Σ A_ij x_j，即鄰接矩陣主特徵向量的分量——高分代表「連接到其他重要節點」。Google PageRank 是其有向圖推廣。
Closeness Centrality：C_C(v) = (n−1)/Σd(v,u)，衡量到所有節點的平均距離。
Katz Centrality：引入衰減因子 α，考慮所有路徑（不只最短路徑）：x = (I − αA)⁻¹·1。

網路推斷（Network Inference）

從高通量數據反推網路結構是核心挑戰：

相關性方法：Pearson/Spearman 相關 → WGCNA（Weighted Gene Co-expression Network Analysis; Langfelder & Horvath, 2008）以 soft-thresholding 保留連續權重，避免任意截斷。
資訊理論：ARACNE（Margolin et al., 2006）用互資訊（mutual information）估計依賴關係，再以 data processing inequality (DPI) 移除間接邊。
因果推斷：Granger causality 適用於時間序列，判斷基因 X 的過去值是否能預測基因 Y 的未來值。Bayesian network 學習（結構搜尋 + BIC 評分）可推斷有向無環圖（DAG），但計算複雜度為 NP-hard，需啟發式搜索（hill climbing, MCMC）。
機器學習：Graph Neural Network (GNN) 近年被用於 PPI 預測與功能註解，GCN layer 將鄰居特徵聚合：h_v^(l+1) = σ(Σ(1/c_vu)·W^(l)·h_u^(l))，其中 c_vu 為正規化常數。

Network Medicine 框架

Barabási 的 diseasome 研究（Goh et al., PNAS, 2007）將人類疾病基因映射到 PPI 網路上，發現共享基因的疾病傾向在網路中形成重疊模組。Network proximity 指標 d_AB = Σ min d(a,B)/|A| + Σ min d(b,A)/|B| 可預測藥物重定位（drug repurposing）：若藥物靶點模組與疾病模組在 PPI 中距離近（z-score < −2），該藥物有較高機率對該疾病有效（Cheng et al., Nat Commun, 2018）。

實作工具與資料庫：Cytoscape（視覺化）、NetworkX / igraph（Python/R 計算）、STRING / BioGRID / IntAct（PPI 數據庫）。

文獻：Barabási & Oltvai (2004) Nat Rev Genet 5:101-113 / Jeong et al. (2001) Nature 411:41-42 / Langfelder & Horvath (2008) BMC Bioinformatics 9:559.

互動工具