因果推断与机器学习(修订版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 因果识别和因果效应估测

在1.1节中其实已经介绍了两种最基本的因果识别的方法:利用结构因果模型下的后门准则或者潜在结果框架中的三个基本假设,通过一些推导就可以做到对ATE和CATE的因果识别。我们知道,无论是后门准则还是潜在结果框架下的强可忽略性,都依赖于不存在没有观测到的混淆变量这一点。而这一点可能在现实世界的数据集中很难被满足。因此,本节将介绍其他几种因果识别方法来克服这一局限性:工具变量(instrumental variables,IV)、断点回归设计(regression discontinuity design,RDD)和前门准则。

有时一个因果识别的方法会与一个估测的方法一同出现,但这并不意味着它们一定需要一起使用。事实上,因果识别跟估测应该是可以分开的两个步骤。在实现因果识别之后,因果效应估测就只剩下估测这一步了。估测实际上就是一个普通的监督学习(supervised learning)问题,也可以说是分类或者回归问题(取决于结果变量是离散的还是连续的)。可以说,因果效应估测=因果识别+估测。