账号: 密码:
中国大学出版社协会 | 首页 | 宏观指导 | 出版社天地 | 图书代办站 | 教材图书信息 | 教材图书评论 | 在线订购 | 教材征订
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
科学决策的核心方法:从吸烟是否导致肺癌的大争论说起——教育科学出版社《因果推断》 - 精品书摘 - 中国高校教材图书网
主页 > 精品书摘
科学决策的核心方法:从吸烟是否导致肺癌的大争论说起——教育科学出版社《因果推断》
袁融
2023-02-21 09:45:43  来源: 教育科学出版社 
 

因果推断》(订购

 袁融

教育科学出版社

  因果思维在人类的文明演进中起到了至关重要的作用,但现代的因果推断理论在过去的半个世纪中才得到真正的发展。在过去的几十年里,因果推断在许多重大医疗、教育、经济等公共政策问题上发挥着越来越重要的作用。以下我们一起来回顾在因果推断理论发展早期的一个影响世界的真实案例,这就是经典的1950—1964年间对“吸烟是否导致癌症”的一场长达14年的大争论。

  进入20世纪初期的美国,工业飞速发展,烟草行业也因为工业化的进程产生了巨大的变革。越来越多的人们开始吸食香烟——相比烟斗和雪茄,这种事先做好的卷烟不仅使用方便而且价格便宜,而且还得到了蓬勃发展的广告业的加持。很快成为美国最流行的商品之一,香烟从20世纪初进入市场,发展到1965年的顶峰时,烟民的数量占据美国全国总人口的45%,平均每一个烟民一天就会消耗25支以上香烟。

  香烟的流行让许多人名利双收,然而,人们发现社会中肺癌病人的数量也直线上升。有的人开始意识到似乎肺癌和吸烟之间有着某种密切的关联。大家开始警觉,会不会吸烟和得肺癌之间存在因果关系呢?从今天的角度看,这似乎是一件不言而喻的事情。事实上,如果我们站在今天去回顾香烟消耗量和肺癌死亡率趋势的话(见下图),我们一眼就可以发现男性肺癌死亡率的趋势和香烟消耗量的趋势是高度一致的,只是肺癌死亡率大约滞后于香烟消耗量30年。但是请注意,仅仅根据趋势曲线是无法判定因果关系的,因为曲线的相似只能代表了相关关系,而不能证明因果关系。如果我们不去看1960年之后的曲线,假想我们来到了1960年,我们看到的就只是高速增长的香烟消耗量和同样高速增长的肺癌死亡率,只是后者滞后了大约30年。但这并不具有说服力——因为找到两个相隔30年但都快速增长的变量并不困难!

  从1950年开始,不断有新的调查表明:(1)肺癌患者中吸烟者的比例,远远大于非肺癌患者的比例;(2)重度吸烟者中肺癌患者的比例,远远大于非吸烟者中肺癌患者的比例。这些调查中展现的差距之大让更多的人怀疑吸烟对肺癌有着直接的影响。然而,这些调查仍然说服力不够,因为这些调查的结果还是仅仅只能说明吸烟和得肺癌这两件事情有极大的相关性,但不能说明吸烟就是导致癌症的原因。许多支持吸烟的人认为,一定存在诸如致癌基因这样的“其他”因素,同时导致了吸烟倾向和致癌概率,所以吸烟并不是致癌的原因。换句话说,如果你运气不好拥有致癌基因,即使你不吸烟,你患肺癌的几率也会很高。对于致癌基因等其他因素,在因果关系理论中我们给了它们一个专门的名字——混淆变量(Confounder)。但是从当年对这一因果关系被质疑开始,在长达十多年的时间里,没有一个人能够给出有力的驳斥。似乎谁也无法证明不存在这样的混淆变量,人们也只是对混淆变量有各种猜想,但却无法测量它。

  在那个时代,由于支持吸烟的势力非常强大,很多人对吸烟导致癌症这种观点进行了口诛笔伐。他们当中不乏烟民,更有甚者在烟草公司的资助下故意打压吸烟有害的言论。这些言论听起来也不乏道理,比如,也许肺癌和越来越糟糕的空气质量很有关系,也许肺癌和人们的不良生活习惯有关系,但核心观点就是肺癌和吸烟这件事没有关系。

  另外值得一提的是,尽管随机对照实验已经在那个年代被广泛认知,但是在吸烟这个问题上进行随机对照实验却寸步难行。因为在随机对照实验中,我们需要找到非常相似的人群,让其中一组人吸烟,另外一组人不吸烟,然后再观察对比结果。这显然是不可行的,因为我们无法为了收集实验数据而强迫任何人吸烟。

  如果是你,你会采取什么样的方法来说服大众呢?在那个年代,因果关系的理论初露萌芽,科学家们也没有厘清如何从大量的临床数据中得出确凿的因果关系结论,无数人在吸烟是否会导致癌症的问题上争论不休,始终无法给出定论。

  但是,这场因果思辨却因为这个极为敏感的社会议题被公众认知,并最终推动了因果推断的发展。如前所述,在大量的调查数据面前,人们已经发现吸烟和得肺癌有着极大的相关性。现在问题的关键是如何排除可能的混淆变量。聪明的科学家提出了一个类似反证的思考方法,即我们可以先假设确实存在某些混淆变量,比如说一种既可以致癌也会让人具有强烈吸烟倾向的基因,然后再通过数据来分析这个基因的影响力。假设我们通过数据分析发现,吸烟者比非吸烟者患肺癌的概率高20倍,那么为了解释在数据中看到的20倍的差异,我们就需要致癌基因在吸烟者中的携带率比非吸烟者高20倍,否则我们就不能得到吸烟和患肺癌没有直接因果关系的结论。换句话说,如果这个基因在非吸烟者中的携带率是5%,那它在吸烟者中的携带率就应该是100%。这让当时的决策者们认识到,如果确实存在一个重要的混淆变量,那通过反推的结论,这个混淆变量的影响力必须大到一个难以置信的程度。所以这样的混淆变量很有可能并不存在,或者即使存在也不能掩盖吸烟对肺癌的影响。这个论证大大加强了人们对吸烟导致肺癌这个论断的信心。

  1965年,由美国政府部门组成的专项咨询委员会得出了吸烟导致肺癌的最终结论。随后烟盒上被强制印上了“吸烟有害健康”的提示,并且香烟广告被禁止在电视上播出。虽然委员会的最终报告也指出,当前的统计学方法还不足以确认吸烟和肺癌之间的直接因果关系,但毫不为过地说,这个结论拯救了上百万人的生命,吸烟人数在1965年之后开始逐渐下降。

  回过头来看,吸烟是否导致肺癌这个经典案例,不仅是基于科学方法指导重大公共政策决策的一次重要实践,也同时激发了因果推断理论的发展。从数据中很容易发现相关性,但却不容易得出因果关系。人们发现当随机对照实验无法实施时,我们缺少有效的数学语言和统计学方法来得到可靠的因果推论。在这个长达14年的争辩过程中,真理越辩越明,人们认识到了因果推断的关键作用。

  本文节选自教育科学出版社《因果推断》。

来源:教育科学出版社

本版责编:金洋
 
 
相关评论 发表评论 发送新闻 打印新闻 上一条 下一条 关闭
| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
经营许可证编号:京ICP证130369号    技术支持:云因信息