今年无疑是一个崭新的科技时代。无论是“多面手”ChatGPT的更迭,工作软件的一把手微软Office,再到绘画工具Midjourney,人工智能深度融入各行业,为产业升级和创新提供持续动力。
AI产品百花齐放,发展迅猛,但始终离不开因果推断。2011年图灵奖得主,贝叶斯网络之父Judea Pearl曾在其著作《The Book of Why: The New Science of Cause and Effect》中断言,“如果没有对因果关系的推理能力,AI的发展将从根本上受到限制”。
换言之,要想在人工智能的新赛道上取胜,掌握“因果推断”的科学尤为关键。
为帮助企业探索、评估及应用因果推断理论,接下来我们将分几期,为大家分享上文中提及的书籍《The Book of Why: The New Science of Cause and Effect》。
书籍简介
◇ 标题:
《The Book of Why: The New Science of Cause and Effect》
Judea Pearl、 Dana Mackenzie
◇ 文章概览:
在本书中,Judea Pearl以深入浅出的语言和丰富的案例,展现了因果关系科学的理论框架及其发展脉络;同时回顾了因果论在科学史上的发展历程,其中不乏对当前的人工智能发展现状的反思和对未来人工智能发展方向的探索。
比起此前Judea Pearl出版过的三部专业性著作,本书更像是一本因果关系科学的科普书,面向更广泛的读者群体,展现因果论的方方面面。

引言:思维胜于数据
人类社会发展至今,离不开人类对“为什么”的探求。而本书的主题——因果推断正是关于这个问题的严肃思考。
作者认为,因果关系是我们认知世界的一种重要方式。一旦我们真正理解了因果思维背后的逻辑,我们就可以在现代计算机上模拟它,进而创造出一个“人工科学家”,例如当下可以模仿人类思维的AI。
数据远非万能
在作者看来,阻碍因果推断这一科学诞生的最大障碍,是我们用以提出因果问题的词汇和我们用以交流科学理论的传统词汇之间的鸿沟。简而言之,就是数据。
我们可以用公式表达几个量之间的关系,比如气压计读数B与实际大气压P的关系为方程式B=kP(k为某个比例常数)。
但生活中有很多无法用数学公式来表达的因果关系。比如,按动电灯开关按钮可以控制灯的开启或关闭,夏天闷热的天气会带动当地冰激凌店的销售额增加。
一种特定的疗法在预防某类疾病方面的效果如何?
是新税法的颁布,还是广告推销活动导致了销售额的增长?
我该不该辞掉工作?
雇用记录能否证明雇主的招聘政策存在性别歧视?
因果推断这门新科学的贡献,就在于催生出了一种简单的数学语言,用以表达我们已知和欲知的因果关系。
因果关系演算法
因果推断的数学工具名为“因果关系演算法”,由两种语言组成。
其一为因果图(causal diagrams),用以表达我们已知的事物;
其二为类似代数的符号语言,用以表达我们想知道的事物。
与图表式的“知识语言”并存的,还有一种符号式的“问题语言”,它被用于表述我们想要回答的问题。书中以我们感兴趣的是药物(D)和对病人生存期(L)的影响为例,那么我们的问题可以用符号写成:P(L|do(D))。
作者再次强调,对观察和干预的混淆是悖论之源。因果革命最重要的成果之一就是解释了如何在不实际实施干预的情况下预测干预的效果,其中模拟干预行动的表达方式是因果推断科学独有的,称为"反事实"(counterfactual)。
”因果推断引擎“蓝图
在这部分,作者提出了一个“因果推断引擎”的蓝图,描述了人工智能进行因果推理的过程,并分别解释蓝图中各部分的含义(下图)。

由图中我们可以看到,因果推断引擎是一种问题处理机器,它接收三种不同的输入——假设、问题和数据,并能够产生三种输出。
对比数据挖掘和深度学习,因果模型可以在大部分情况下从未经干预处理的数据中预测干预的结果,并且适应性极强,无论变量之间的数值关系如何,被估量都能适用于与定性模型适配的数据。
各章内容一览
在导言的最后,作者分别介绍了本书各章的主要内容。
第一章:本书的核心隐喻,将观察、干预和反事实这三个台阶组合成因果关系之梯(ladder of causation)。
第二章:统计学科是如何让自己陷入了因果蒙昧的黑暗,以及这对所有依赖数据的科学产生了怎样深刻的影响。
第三章:作者是如何通过对人工智能的研究,特别是对贝叶斯网络的研究,皈依了因果论。
第四章:统计学对因果推断的主要贡献——随机对照试验(randomized controlled trial,简称RCT)。
第五章:讲述因果论发展史,乃至科学史上的一个重要时刻。
第六章:以悖论为主题,包括蒙提·霍尔悖论、辛普森悖论、伯克森悖论等。
第七章:从干预问题入手,讲述作者和他的学生们如何历经20年的努力,实现do类型问题解答的自动化。
第八章:通过讨论反事实,带读者了解因果关系之梯的顶端。
第十章:通过追溯作者转向因果研究领域的起始地,带领读者走向尾声。
往后,我们将逐一奉上数据主体部分的解析,敬请期待。