空間轉錄體學的計算分析需要融合基因表現的高維特徵與組織的二維或三維空間結構,發展出新的統計和深度學習方法。
空間統計模型
SpatialDE(Svensson et al., 2018)使用 Gaussian Process Regression 偵測空間變異基因:y_g = f_g(x) + ε,其中 f_g ~ GP(0, K) 的核函數 K 編碼空間相關性(squared exponential kernel)。SPARK(Sun et al., 2020)使用 generalized linear spatial model,假設 counts 服從 Poisson distribution with spatial random effects,用 variance component test 檢驗空間模式。SPARK-X 提供 non-parametric 版本,計算效率更高。
空間域(spatial domain)識別
BayesSpace(Zhao et al., 2021)在 low-dimensional PCA embedding 上加入 spatial Potts model prior(鄰近 spots 傾向屬於同一 cluster),用 MCMC 推斷空間域分配。SpaGCN 使用 Graph Convolutional Network,以組織影像的 RGB 值和空間鄰近關係作為圖的邊特徵。BANKSY(Singhal et al., 2024, Nature Genetics)結合每個 spot 的自身表現和鄰域平均表現(azimuthal Gabor filter)進行聚類。
細胞類型反卷積
Visium 的 ~55 μm spots 包含多個細胞,需要反卷積推斷細胞組成。Cell2location(Kleshchevnikov et al., 2022, Nature Biotechnology)使用 hierarchical Bayesian model:觀測 counts 建模為 cell type signatures(from scRNA-seq reference)的 NB mixture,用 variational inference 估計每個 spot 中各細胞類型的 cell abundance。RCTD(Cable et al., 2022)使用 CSIDE(spatially-informed DE)在反卷積的同時偵測空間上的差異表現。Tangram(Biancalani et al., 2021)用 optimal transport 將 scRNA-seq cells 映射到空間位置。
多模態空間組學
- Spatial ATAC(DBiT-seq、spatial-CUT&Tag):保留空間資訊的染色質可及性或組蛋白修飾圖譜
- SPOTS:joint spatial RNA + protein 測量
- Xenium(10x, subcellular resolution + panel of ~300-5000 genes)提供了 imaging-based 方法的 commercial solution
計算挑戰
- 3D reconstruction:多張切片的 registration 和 alignment(PASTE, Zeira et al., 2022)
- Cross-platform integration:Visium、MERFISH 和 scRNA-seq 的聯合分析
- Cell segmentation:imaging-based 方法需要精確的細胞分割(Cellpose2、StarDist),errors propagate to downstream analysis
