统计学关我什么事:生活中的极简统计学
上QQ阅读APP看书,第一时间看更新

4-6 在计算“第二胎生女孩的概率”时,使用“期待值”

我们通过计算得到的后验概率为:

(类别p=0.4的后验概率)=0.27

(类别p=0.5的后验概率)=0.33

(类别p=0.6的后验概率)=0.4

以上数值为各个类别的概率,换言之,也就是“概率的概率”。数值分为3部分、内容详细,十分难得。但是,它并不能作为“第二胎生女孩的概率是多少”这个问题的答案。于是,让我们最后再来了解一下该如何回答这个问题吧。

在求“这对夫妇第二胎生女孩的概率”时,需要用到“平均值”这一概念。由于这也是概率方面的平均值,专业上把这个数值称为“期待值”。关于期待值的具体内容将会在第18讲进行详细介绍,在这里暂且用图解的方式,对其含义进行简单说明。

首先,在表示所有可能发生的情况(生了女孩的情况)的长方形中,画出填入了后验概率的图。这个图由3个长方形构成的。左边的长方形:纵向长度为类别p=0.4、横向长度为其后验概率0.27。正中的长方形:纵向长度为类别p=0.5、横向长度为其后验概率0.33。右边的长方形:纵向长度为类别p=0.6、横向长度为其后验概率0.4。因此,各个长方形的面积如下:

左边的长方形→0.4×0.27=0.108

正中的长方形→0.5×0.33=0.165

右边的长方形→0.6×0.4=0.24

对于这3个长方形,需要画出一个使横向长度之和与面积之和一致的长方形,即虚线长方形。这个长方形,横边的长度刚好等于1。其理由是,由于3个长方形的横边长度为各类别的后验概率,根据标准化条件进行相加,其结果为1。因此,虚线长方形的纵向边长的长度,与3个长方形的面积之和完全一致。这是“把类别平均化的数值”,即为“类别的期待值”(图表4-8

图表4-8 计算类别的平均值

具体的计算过程如下所示:

(P的期待值)=0.4×0.27+0.5×0.33+0.6×0.4

=0.108+0.165+0.24

=0.513

因此,若把这对夫妇的类别(生女孩的概率)进行平均化,则得到结果0.513。这也能够成为解释“这对夫妇第二胎生女孩的概率”的理由。在第19讲中,会针对“满足类别0≤p≤1中所有p的设定”的例子进行说明。

第4讲·小结

1.用概率设定类别,设定其先验概率(因为无法获得数据,而采用了理由不充分原理将其设定为对等)。先验概率是“概率的概率”。

2.设定条件概率(设定类别概率本身即可)。

3.通过获得的信息(生了女孩)中,排除掉所有不可能的情况。

4.关于剩余情况下的概率数值,恢复标准化条件。

5.获得有关类别的后验概率(贝叶斯逆概率)。

6.根据获得的信息,先验概率更新为后验概率(贝叶斯更新)。

7.先验概率和后验概率都是主观概率。

8.因为获得了各个类别(由概率来表现)的概率,通过将其平均化(求期待值),来求类别的平均值。这正是第二胎为女孩的概率。

练习题

本文将所有的先验概率都设定为均等数值,但这似乎不太妥当。比起其他可能性,p=0.5的可能性显然更大。因此,我们在此改变一下先前的设定,将先验概率分为以下三类:

类别p=0.4的概率→0.2

类别p=0.5的概率→0.6

类别p=0.6的概率→0.2

在此条件下,求以下过程中的后验概率。

各个类别的先验概率分别为,

(a)=( )、(b)=( )、(c)=( )

添加信息后的条件概率分别为,

(d)=0.4,(e)=( )

(f)=0.5,(g)=( )

(h)=0.6,(i)=( )

种互不相同的情况的下,生女孩的概率分别为,

(j)=( )×( )=( )

(k)=( )×( )=( )

(l)=( )×( )=( )

如果将“生女孩”的三种情况下的概率进行标准化处理,那么

专栏 column 贝叶斯是何许人也?

发现贝叶斯逆概率的人,名为托马斯·贝叶斯,英国人,生于1702年,卒于1761年。贝叶斯曾在苏格兰的爱丁堡大学学习神学和数学。后来,他继承父业,成为一名牧师。

贝叶斯一边从事牧师的工作,一边研究数学。这并不奇怪。因为在当时,侍奉神职的人们当中,有不少人都在研究数学。

贝叶斯一生中仅写过一篇数学论文,题为《关于概率思考中某一问题的解法的考察》的。贝叶斯逆概率的起点就在这篇论文当中。但贝叶斯本人似乎并不是很重视这一发现,他长期将其搁置一旁,因而我们也无法清楚地知道这篇论文的执笔年份。据推测,应该是在18世纪40年代末的1748年或1749年。

将贝叶斯的发现公之于众的,是他的朋友——同为牧师的理查德·普莱斯。普莱斯受贝叶斯的亲戚所托,调查贝叶斯遗留下来的文献,并发现了前述的那篇论文。普莱斯在整理思路后,于1764年在皇家学会的《哲学纪要》上发表了这篇论文。贝叶斯逆概率自此公之于世。

然而,几乎没有人关注普莱斯的报告内容。后来,由于法国的天才数学家拉普拉斯的研究,才使得情况有所好转。拉普拉斯原本已经在天文学、物理学、数学方面取得了大量优秀成绩。在了解到贝叶斯的研究之前,他就已经写过一篇关于贝叶斯逆概率构想的较为浅显的文章。之后,他听闻普莱斯的研究,并意识到它可能会促使自己的初期研究进一步完善。1781年左右,拉普拉斯一气呵成,将贝叶斯逆概率改编为现今公式的形式。因此也可以说,贝叶斯逆概率的发现也有拉普拉斯的功劳。