在上期的分享中,我们介绍了休厄尔·赖特通过研究豚鼠的毛色与遗传基因、环境、其他因素的关系,挖掘出了因果关系科学的新发现。尽管他的路径分析是一种极具革命性的思路,但在当时并不受统计学待见。
本期分享中,赖特将继续以豚鼠为例,坚持通过路径图阐释事实,排除众议。
在上篇分享中,赖特表示,如果要探究关系图的因果量,可以通过一个简单的图形规则推测出数据中的相关关系。挨个拆分图中的箭头,就会发现每个箭头都有很明确的含义。(点击蓝字可回顾《小小豚鼠,竟然是推动因果关系科学的助力?》)
尽管非议众多,但作者认为,赖特的言论在其发表的90年后也并未过时,因为它从根本上定义了现代因果分析的新范式。
更让作者钦佩的是赖特的勇气和决心。当一个自学成才的数学家独自面对统计学界的霸权和嘲笑,赖特并没有陷入自我怀疑,仍然坚信自己创造出了重要的事物——路径系数不是相关关系,而是一种完全不同的事物:因果效应。
算术问题至少可以借助独立的验证过程得到证明,但这场争论涉及的不仅仅是算术问题,只有曾经的哲学家敢于对因果关系的性质发表意见。
那么,赖特是如何坚定内在的信念,确信自己走在正确的轨道上呢?
文中作者借用了17世纪,伽利略因坚持哥白尼的“日心说”,被教廷终身软禁的例子。但伽利略至少还有天文观测数据作为凭依,而赖特无所依靠。没有任何可以诉诸的理论框架,没有可以支撑的定理。除了内心的信念——路径系数能够阐释的事实是相关性所无法阐释的。
即使面临万难,他依然和伽利略一样,对反对的声音大声喊出:“地球仍然在动!”
赖特确切地意识到,他可以借助“因果关系”,用自己的方法解决其它方式无法回答的问题,比如确定几个因子的相对重要性。
另一个出色的例子可以在他1921年的论文《相关关系和因果关系》中找到。他在这篇论文中提出了一个问题:如果豚鼠在母鼠的子宫里多待了一天,这会对其出生体重产生多大的影响?
我们不能给还在母鼠子宫内的子鼠称重,但可以比较分别在孕期66天和孕期67天出生的豚鼠的体重。赖特通过比较分析指出,在子宫里多待了一天的豚鼠,其出生体重平均增加了5.66克。
但我们不能草率地得出“出生之前的豚鼠胚胎每天增长大约5.66克体重”的结论,因为影响幼鼠晚出生的因素有很多,比如同窝产仔数相对较少。这意味着在母鼠怀孕期间,幼鼠有更有利的成长环境,能够从母体汲取更多的养分。
因此,我们需要将两个因素区分开:增长的5.66克体重中,有多少是由于子鼠在母鼠子宫内多待了一天,有多少是由于子鼠可以与较少的兄弟姐妹竞争?
赖特通过绘制路径图回答了这个问题。
赖特面临的问题是:妊娠时长P对于出生体重X的直接效应是什么?为了得到这个直接效应,我们需要消除同窝产仔数L带来的偏倚。
跳过中间的数学处理步骤,如果所有其它的变量(A、L、C、Q)都保持不变,只是妊娠时长增加一天,计算得出的p值为3.34克/天,即幼鼠的出生体重平均增长3.34克/天。
通过该例,我们可以得到两个经验——
第一,因果分析允许我们量化在现实世界中实际存在的某个过程,而非只能分析数据中的模式。
第二,无论是否采用数学处理,在路径分析中,都能通过检查整个路径图得出关于单个因果关系的结论。
遗憾的是,1920年到1960年,除了赖特本人和研究动物育种的学者之外,赖特的路径分析方法并未得到广泛的应用,在各大领域掀起科学研究的热潮。
遗传学家、赖特的同事詹姆斯·克洛指出了一个原因:路径分析不适合解决包含“固定程序”的问题,其使用者必须先有一个假设,并设计出一张恰当的、包含多重因果序列的结构图。
关键在于,无论是路径分析,还是因果推断的每一次实践,都需要建立在科学思考的基础上。而统计学一向打压这种做法,鼓励采用“固定程序”解决问题——这恰恰是赖特所厌恶的。
路径分析在后续的科学研究中,会有怎样的演变和应用?下一章节将继续分享,敬请期待。