科學方法論(Scientific Methodology)的哲學基礎和實務應用是理解現代生物學研究的必要素養。以下從科學哲學、研究設計和當代方法學挑戰三個維度切入。
科學哲學的演變
科學方法的哲學基礎經歷了深刻的演變:
邏輯實證主義(Logical Positivism):Vienna Circle(1920-30s)主張科學命題必須可經驗證。但 Hempel 的「烏鴉悖論」(confirmation paradox)揭示了純驗證主義的邏輯困境。
否證主義(Falsificationism):Popper(The Logic of Scientific Discovery, 1934/1959)主張科學進步的機制是「猜想與反駁」(conjectures and refutations)。科學假說的特徵不是可驗證性,而是可否證性(falsifiability)。然而 Duhem-Quine 論題(underdetermination thesis)指出,任何觀察都無法決定性地否證單一假說,因為假說總是與一組輔助假設(auxiliary hypotheses)一起受檢驗。
典範轉移(Paradigm Shift):Kuhn(The Structure of Scientific Revolutions, 1962)提出科學不是線性累積,而是「常規科學」(normal science, puzzle-solving within paradigm)和「革命」(anomalies → crisis → paradigm shift)交替。生物學史上的典範轉移包括:自然發生說 → 細胞理論、拉馬克遺傳 → 達爾文演化、中心法則 → 表觀遺傳學。
研究綱領方法論(Methodology of Scientific Research Programmes):Lakatos(1978)試圖調和 Popper 和 Kuhn,提出科學理論由「硬核」(不可否證的核心假設)和「保護帶」(可修改的輔助假說)組成。
現代生物學研究設計
Fisher(1935, The Design of Experiments)奠定了實驗設計的統計基礎。現代臨床和基礎研究的設計考量:
- 隨機化(Randomization):消除已知和未知混雜因子。Fisher 的隨機化原則是因果推論的基礎。在動物實驗中,隨機化、盲法和預先定義終點(pre-registration)正成為規範要求(Macleod et al., 2014, PLoS Biology)。
- 統計檢定力分析(Power Analysis):實驗前計算所需樣本量,避免 Type I(偽陽性)和 Type II(偽陰性)錯誤。Cohen(1988, Statistical Power Analysis for the Behavioral Sciences)建立了 power analysis 的標準框架。
- 多重比較校正(Multiple Comparison Correction):基因組學實驗常同時測試數百萬個假說,Benjamini & Hochberg(1995, JRSS B)的 FDR(False Discovery Rate)控制方法成為標準。
再現性危機(Reproducibility Crisis)
生物醫學研究正面臨嚴重的再現性危機。Baker(2016, Nature)的調查顯示超過 70% 的研究者曾嘗試重複他人實驗失敗。主要因素包括:
- p-hacking 和發表偏差:Ioannidis(2005, PLoS Medicine, "Why Most Published Research Findings Are False")的影響力論文指出,在低統計檢定力、小效應量和分析靈活性(researcher degrees of freedom)的條件下,大多數發表的研究發現可能是偽陽性。
- HARKing(Hypothesizing After the Results are Known):在看到結果後才「提出」假說,將探索性分析包裝為驗證性分析。
- 選擇性報告:只報告顯著結果,隱藏不顯著結果。
因應措施包括:
- 預先登記(Pre-registration):在 ClinicalTrials.gov 或 OSF(Open Science Framework)上事先登記研究假說、方法和分析計畫。Registered Reports 期刊格式在數據收集前就進行同儕審查。
- 開放科學(Open Science):數據共享(FAIR principles:Findable, Accessible, Interoperable, Reusable)、程式碼公開和預印本(preprint)文化。
- 統計方法改革:貝葉斯統計提供效應量的後驗分布而非二元的顯著/不顯著判斷。American Statistical Association(Wasserstein & Lazar, 2016)發表了反對機械性使用 p < 0.05 的聲明。
因果推論在生物學中的應用
Pearl(2009)的結構因果模型和 Rubin 的潛在結果框架(potential outcomes framework)為觀察性生物學數據的因果分析提供了嚴格的數學基礎。Hernán(2018, American Journal of Public Health, "The C-Word")呼籲生物醫學研究者明確區分「因果問題」和「描述/預測問題」,選擇適當的方法學工具。
