因果AI案例:冰淇淋热卖会导致犯罪率升高?
2023-07-05
在上期分享中,我们以行刑枪决和疫苗接种两个例子,阐述了如何运用因果图分析具体问题。
 
今天我们将分享第一章的最后一部分——论概率与因果关系以夏天冰淇淋销量和犯罪率同时升高的案例,详细讲述因果与概率之间关系的认知演变。

因果与概率关系的认知演变

概率与因果的关系,作者一句话概括为“因果关系不能被简化为概率”
 
这个认知的形成来之不易。从赖欣巴哈和萨普斯开始,哲学家们开始使用“概率提高”的概念来定义因果关系:如果X提高了Y的概率,那么就是X导致了Y
 
这个概念也存在于我们的日常认知中。例如,“鲁莽驾驶会导致交通事故”或“你会因为懒惰而挂科”这两件事,前者只是增加了后者发生的可能性,而非必然会让后者发生
 
哲学家却几乎无一例外地使用了条件概率来表示“X提高了Y的概率”,记作P(Y|X)>P(Y)。这种解释是错误的,类似表达式P(Y|X)所表示的概率位于因果关系之梯的第一层级,其不能回答第二层级或第三层级的问题。
 
因为“提高”是一个因果概念,意味着X对Y的因果效应,而公式P(Y|X)>P(Y)只涉及观察和手段,意为“如果我们观察到了X,那么Y的概率就提高了”。但这种概率提高完全可能是由其他因素造成的
 
X和Y共同的因或称混杂因子(confounder)问题,是令哲学家最为烦恼的问题之一。
 

案例:冰淇淋与犯罪

 
作者以冰淇淋和犯罪为例。每年夏天是冰淇淋热销,同时也是犯罪率升高的季节。这一现象实际上可以解释为,因为夏天天气炎热,所以冰淇淋的销量和犯罪率同时提高了
 
哲学家通过“背景因子”(混杂因子的另一种说法)设置限定条件来修复定义,并据此建构了表达式P(Y|X,K=k)>P(Y|K=k),其中K代表背景变量。
 
套入例子之中,如果我们只看温度为30°C的日子(K=30),就会发现冰淇淋的销售和犯罪率之间不存在任何关联。只有把30°C的日子和0°C的日子进行比较,才会产生概率提高的错觉。
 
产生错觉的原因显而易见:混杂也是一个因果概念,很难用概率来表示
 
作者给出的提示是:离开因果图,我们是不可能阐明这个定义的一旦用条件概率的语言歪曲“概率提高”,即使再多的概率补丁也无法登上更高一层的因果关系阶梯。
 
拯救概率提高这一概念的正确方法是借助do算子来定义:如果P(Y|do(X))>P(Y),那么我们就可以说X导致了Y。
 

处理不确定性的概率模型:贝叶斯网络

 
在努力将因果关系的概念数学化的过程中,哲学家过早地诉诸其所知的唯一一种用于处理不确定性的语言,即概率语言。
 
而作者则创建了一种关于不确定性的推理方法,即“贝叶斯网络”,用于模拟理想化的、去中心化的人类大脑将概率纳入决策的方法。
 
但贝叶斯网络也未能弥补人工智能和人类智能之间的差距,它缺失了一个关键因素——因果论
 
在后续的进展中,作者对其进行了两次修正。
 
第一次是1991年graph-surgery概念的提出,使贝叶斯网络能够像处理观察信息一样处理干预信 息。第二次在1994年,这次修正将贝叶斯网络带到第三层级,使其能够应对反事实问题。
 
最后,作者提出了他的观点:概率能将我们对静态世界的信念进行编码,而因果论则告诉我们,当世界被改变时,无论改变是通过干预还是通过想象实现的,概率是否会发生改变以及如何改变。 
 
在下一章,我们将对上述提到的贝叶斯网络进展进行更全面的介绍,敬请期待。
因果AI案例:冰淇淋热卖会导致犯罪率升高?
  • 谱蓝云

  • 谱蓝云私域研究所

  • 谱蓝保

  • 孙明展

  • 飞慕课

  • 谱蓝财富

  • 蒲公英

  • 谱蓝保险规划预约

  • 谱蓝财务规划

  • 理财巴士

copyright@创必承 Trussan.com Limited 版权所有粤ICP备15022476号 Powered by Vancheer