因果推断与机器学习(修订版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2.3 前门准则

前门准则是结构因果模型除后门准则外的一种重要的因果识别方法[5],我们可以把它看作是一种对后门准则的拓展。它允许我们在有隐藏混淆变量的情况下实现因果识别。下面定义前门准则。

定义1.20 前门准则。

变量集合M满足前门准则,当且仅当它满足以下三个条件时:

• 以M中所有的变量为条件时,所有从处理变量T到结果变量Y的有向通路都会被阻塞;

• 在没有以任何变量为条件的情况下,不存在没有被阻塞的对因果关系TM而言的后门通路;

• 以处理变量T为条件会阻塞所有对于MY的后门通路。

图1.9展示了两个因果图。其中,在图1.9(a)中的变量集合M满足前门准则,在图1.9(b)中的变量集合M不满足前门准则。读者可以自行分析图1.9(b)中的变量集合M不满足前门准则中的那部分。我们也可以说变量集合M是对于因果关系TY而言的中介变量的集合。为了符号的简单明了,接下来假设变量集合M只包含一个变量,即M={M},令MT都是离散变量。由定义1.20中的第一个条件可以得到对于干预分布PY|do(T))的分解,如式(1.39)所示:

图1.9 两个分别展示变量集合M满足与不满足前门准则的示例因果图

定义1.20中的第二个条件意味着不存在对于因果效应TM而言的混淆变量。也就是说,可以直接用对应的条件分布代替干预分布,如式(1.40)所示:

定义1.20中的第三个条件可以使用后门准则去完成对干预分布PY|do(M))的因果识别,如式(1.41)所示:

这样可以利用第二个和第三个条件得到的式(1.39)和式(1.40),完成对式(1.38)等号右边的两个干预分布的因果识别,因而也就完成了对估测的目标,即干预分布PY|do(T))的因果识别。