跳至主要內容
4 · 第2學期系統生物學生物網路

網路分析

Network Analysis

難度 3 · 進階systems-biologybioinformatics想做成互動版

網路分析在系統生物學中提供了從還原論到整體論的橋樑,整合圖論、統計物理與機器學習方法來解構生物複雜性。

數學框架與矩陣表示

網路以鄰接矩陣 A 表示,A_ij = 1(或權重 w_ij)若節點 i、j 之間有邊。Laplacian 矩陣 L = D − A(D 為度矩陣)的特徵值譜(spectrum)攜帶網路拓撲資訊:第二小特徵值 λ₂(algebraic connectivity / Fiedler value)衡量網路連通性,λ₂ = 0 表示網路斷裂。譜聚類(spectral clustering)利用 L 的前 k 個特徵向量做模組劃分,理論基礎為 Cheeger inequality。

進階中心性指標

除基礎的 degree 與 betweenness 外:

  • Eigenvector Centrality:x_i = (1/λ₁)Σ A_ij x_j,即鄰接矩陣主特徵向量的分量——高分代表「連接到其他重要節點」。Google PageRank 是其有向圖推廣。
  • Closeness Centrality:C_C(v) = (n−1)/Σd(v,u),衡量到所有節點的平均距離。
  • Katz Centrality:引入衰減因子 α,考慮所有路徑(不只最短路徑):x = (I − αA)⁻¹·1。

網路推斷(Network Inference)

從高通量數據反推網路結構是核心挑戰:

  • 相關性方法:Pearson/Spearman 相關 → WGCNA(Weighted Gene Co-expression Network Analysis; Langfelder & Horvath, 2008)以 soft-thresholding 保留連續權重,避免任意截斷。
  • 資訊理論:ARACNE(Margolin et al., 2006)用互資訊(mutual information)估計依賴關係,再以 data processing inequality (DPI) 移除間接邊。
  • 因果推斷:Granger causality 適用於時間序列,判斷基因 X 的過去值是否能預測基因 Y 的未來值。Bayesian network 學習(結構搜尋 + BIC 評分)可推斷有向無環圖(DAG),但計算複雜度為 NP-hard,需啟發式搜索(hill climbing, MCMC)。
  • 機器學習:Graph Neural Network (GNN) 近年被用於 PPI 預測與功能註解,GCN layer 將鄰居特徵聚合:h_v^(l+1) = σ(Σ(1/c_vu)·W^(l)·h_u^(l)),其中 c_vu 為正規化常數。

Network Medicine 框架

Barabási 的 diseasome 研究(Goh et al., PNAS, 2007)將人類疾病基因映射到 PPI 網路上,發現共享基因的疾病傾向在網路中形成重疊模組。Network proximity 指標 d_AB = Σ min d(a,B)/|A| + Σ min d(b,A)/|B| 可預測藥物重定位(drug repurposing):若藥物靶點模組與疾病模組在 PPI 中距離近(z-score < −2),該藥物有較高機率對該疾病有效(Cheng et al., Nat Commun, 2018)。

實作工具與資料庫:Cytoscape(視覺化)、NetworkX / igraph(Python/R 計算)、STRING / BioGRID / IntAct(PPI 數據庫)。

文獻:Barabási & Oltvai (2004) Nat Rev Genet 5:101-113 / Jeong et al. (2001) Nature 411:41-42 / Langfelder & Horvath (2008) BMC Bioinformatics 9:559.

互動工具

動手玩玩看

用互動元件直接感受這個概念,比純文字快 10 倍搞懂。三個 tier 共用同一個工具。

這個和什麼有關