
2.2 掷骰子游戏 55
2.2 掷骰子游戏
在阐述统计建模方法前,先看一个有趣的实例(图2.4)。掷骰子,一个生活中比
较常见的游戏,掷一个骰子,玩家猜一个数字,猜中就算赢。按照常识来说,随便选
一个数字,获胜的概率是一样的,即所有选择的获胜概率都是 1/6。因此这个游戏玩
家很难获胜,除非运气很好。假设进行一次游戏,玩家随意选了一个数字,比如是 1。
当投掷 30 次骰子(如图2.4),发现运气不错,命中 7 次,好于预期(7/30 > 1/6)。
2
3
1 4 4 1
5
1 4 4
5
6
4 4
3
2 1 4
5
1
4 2 2
3
4 1
5
1
3
4
图 2.4 骰子结果
此时玩家的胜利似乎只能来源于运气。不过,这里的假设“随便选一个数字,获
胜的概率是一样的”本身就是一个概率模型,它对骰子六个面的出现做了均匀分布
假设:
P (1) = P (2) = ... = P (5) = P (6) = 1/6 (2.16)
但是在这个游戏中没有人规定骰子是均匀的。如果骰子的六个面不均匀呢?这
里可以用一种更加“聪明”的方式定义一种新的模型,即定义骰子的每一个面都以
一定的概率出现,而不是相同的概率。描述如下:
P (1) = θ
1
P (2) = θ
2
P (3) = θ
3
P (4) = θ
4
P (5) = θ
5
P (6) = 1 −
X
1≤i≤5
θ
i
C 归一性 (2.17)
这里,θ
1
∼ θ
5
可以被看作是模型的参数,因此这个模型的自由度是 5。对于这样的
模型,参数确定了,模型也就确定了。但是一个新的问题出现了,在定义骰子每个面
的概率后,如何求出具体的概率值呢?一种常用的方法是,从大量实例中学习模型
参数,这个方法也是常说的参数估计(Parameter Estimation)。可以将这个不均匀的
骰子先实验性地掷很多次,这可以被看作是独立同分布的若干次采样。比如投掷骰
子 X 次,发现 1 出现 X
1
次,2 出现 X
2
次,以此类推,可以得到各个面出现的次数。
假设掷骰子中每个面出现的概率符合多项式分布,那么通过简单的概率论知识可以