概率论
|
|
模板:Topicon
文件:Nuvola apps atlantik.png 典型的机率问题:「掷一颗公正的骰子,出现3点的机率是多少?」 机率论是研究随机性或不确定性等现象的数学。更精确地说,机率论是用来模拟实验在同一环境下会产生不同结果的情状。典型的随机实验有掷骰子、扔硬币、抽扑克牌以及轮盘游戏等。 数学家和精算师认为机率是在0至1之间之闭区间的数字,指定给一发生与失败是随机的「事件」。机率<math>P(A)</math>根据机率公理来指定给事件<math>A</math>。 一事件<math>A</math>在一事件<math>B</math>确定发生后会发生的机率称为<math>B</math>给之<math>A</math>的条件机率;其数值为<math>{P(B \cap A) \over P(A)}</math>(当<math>P(A)</math>不等于零时)。若<math>B</math>给之<math>A</math>的条件机率和<math>A</math>的机率相同时,则称<math>A</math>和<math>B</math>为独立事件。且<math>A</math>和<math>B</math>的此一关系为对称的,这可以由一同价叙述:「<math>P(A \cap B) = P(A)P(B)</math>,当<math>A</math>和<math>B</math>为独立事件时。」中看出。 机率论中的两个重要概念为随机变数和随机变数之机率分布这两种概念;更多讯息,可参见其条目。
生活例子人们对概率总是有一点触摸不清的感觉,而事实上也有很多看似奇异的结果,甚至错误的认识:
历史作为数学统计基础的概率论的创始人分别是法国数学家帕斯卡和费马,其可追溯到公元17世纪。当时的法国宫廷贵族里盛行着掷骰子游戏,游戏规则是玩家连续掷 4 次骰子,如果其中没有 6 点出现,玩家赢,如果出现一次 6 点,则庄家(相当于现在的赌场)赢。按照这一游戏规则,从长期来看,庄家扮演赢家的角色,而玩家大部分时间是输家,因为庄家总是要靠此为生的,因此当时人们也就接受了这种现象。 后来为了使游戏更刺激,游戏规则发生了些许变化,玩家这回用 2 个骰子连续掷 24 次,不同时出现2个6点,玩家赢,否则庄家赢。当时人们普遍认为,2 次出现 6 点的概率是一次出现 6 点的概率的 1 / 6 ,因此 6 倍于前一种规则的次数,也既是 24 次赢或输的概率与以前是相等的。然而事实却刚好相反,从长期来看,这回庄家处于输家的状态,于是他们去请教当时的数学家帕斯卡,求助其对这种现象作出解释。 其他对概率论的发展作出重要贡献的人还有荷兰物理、数学家惠更斯,瑞士物理、数学家伯努利,法国数学家美弗,法国数学、天文学家拉普拉斯,德国数学家高斯,法国物理、数学家泊松,意大利数学、医学家卡尔达诺以及苏联数学家柯尔莫哥洛夫。 事件单位事件、事件空间、随机事件在一次随机试验中可能发生的不能再细分的结果被称为单位事件,用 <math>e</math> 表示。在随机试验中可能发生的所有单位事件的集合称为事件空间,用 <math>S</math> 来表示。例如在一次掷骰子的随机试验中,如果用获得的点数来表示单位事件,那么一共可能出现 6 个单位事件,则事件空间可以表示为 <math>S</math> = { 1,2, 3, 4, 5, 6 } 。 上面的事件空间是由可数有限单位事件组成,事实上还存在着由可数无限以及不可数单位事件组成的事件空间,比如在一次直到获得国徽面朝上的随机掷硬币试验中,其事件空间由可数无限单位事件组成,表示为:<math>S=</math>{ 国,数国,数数国,数数数国,数数数数国,···},注意到在这个例子中"数数数国"是单位事件。将两根筷子随意扔向桌面,其静止后所形成的交角假设为 <math>\alpha</math>,这个随机试验的事件空间的组成可以表示为 <math>S=</math> { <math>\alpha</math> | 0≤ <math>\alpha</math> < 180 } 。 随机事件是事件空间 <math>S</math> 的子集,它由事件空间 <math>S</math> 中的单位元素构成,用大写字母 <math>A,B,C...</math> 表示。例如在掷两个骰子的随机试验中,设随机事件 <math>A</math> = "获得的点数和大于 10 ",则 <math>A</math> 可以由下面 3 个单位事件组成:<math>A</math> = { ( 5,6 ),( 6,5 ),( 6,6 ) } 。 如果在随机试验中事件空间中的所有可能的单位事件都发生,这个事件被称为 必然事件,表示为 <math>S</math> ⊂ <math>S</math> ;相应的如果事件空间里不包含任何一个单位事件,则称之为不可能事件,表示为 ∅ ⊂ <math>S</math> 。 事件的计算因为事件在一定程度上是以集合的含义定义的,因此可以把集合计算方法直接应用于事件的计算,也就是说,在计算过程中,可以把事件当作集合来对待。
在轮盘游戏中假设 <math>A</math> 代表事件「球落在红色区域」,<math>B</math> 代表事件"球落在黑色区域",因为事件 <math>A</math> 和 <math>B</math> 没有共同的单位事件,因此可表示为 <math>A\cap B=\varnothing</math> 注意到事件 <math>A</math> 和 <math>B</math> 并不是互补的关系,因为在整个事件空间 <math>S</math> 中还有一个单位事件「零」,其即不是红色也不是黑色,而是绿色,因此 <math>A,B</math> 的补集应该分别表示如下: <math>\bar{A}=S\setminus A=B\cup \left \{ 0 \right \}</math> 概率的定义传统概率 ( 拉普拉斯概率 )传统概率的定义是由法国数学家拉普拉斯 ( Laplace ) 提出的。如果一个随机试验所包含的单位事件是有限的,且每个单位事件发生的可能性均相等,则这个随机试验叫做拉普拉斯试验。在拉普拉斯试验中,事件 <math>A</math> 在事件空间 <math>S</math> 中的概率 <math>P(A)</math> 为: 例如,在一次同时掷一个硬币和一个骰子的随机试验中,假设事件 <math>A</math> 为获得国徽面且点数大于 4 ,那么事件 <math>A</math> 的概率应该有如下计算方法:<math>S=</math> { ( 国徽,1 点 ),( 数字,1 点 ),( 国徽,2 点 ),( 数字,2 点 ),( 国徽,3 点 ),( 数字,3 点 ),( 国徽,4 点 ),( 数字,4 点 ),( 国徽,5 点 ),( 数字,5 点 ),( 国徽,6 点 ),( 数字,6 点 ) },<math>A</math>={( 国徽,5 点 ),( 国徽,6 点 )},按照拉普拉斯定义,<math>A</math> 的概率为,
注意到在拉普拉斯试验中存在着若干的疑问,在现实中是否存在着这样一个试验,其单位事件的概率具有精确的相同的概率值,因为我们不知道,硬币以及骰子是否"完美",即骰子制造的是否均匀,其重心是否位于正中心,以及轮盘是否倾向于某一个数字。尽管如此,传统概率在实践中被广泛应用于确定事件的概率值,其理论根据是:如果没有足够的论据来证明一个事件的概率大于另一个事件的概率,那么可以认为这两个事件的概率值相等。 如果仔细观察这个定义会发现拉普拉斯用概率解释了概率,定义中用了"相同的可能性" ( 原文是 également possible )一词,其实指的就是"相同的概率"。这个定义也并没有说出,到底什么是概率,以及如何用数字来确定概率。在现实生活中也有一系列问题,无论如何不能用传统概率定义来解释,比如,人寿保险公司无法确定一个 50 岁的人在下一年将死去的概率等。 统计概率统计概率是建立在频率理论基础上的,分别由英国逻辑学家约翰 ( John Venn 1834-1923 ) 和奥地利数学家理查德 ( Richard Von Mises 1883-1953 ) 提出,他们认为,获得一个事件的概率值的唯一方法是通过对该事件进行 100 次,1000 次或者甚至 10000 次的前后相互独立的 <math>n</math> 次随机试验,针对每次试验均记录下绝对频率值和相对频率值 <math>h_n </math>(A),随着试验次数 <math>n</math> 的增加,会出现如下事实,即相对频率值会趋于稳定,它在一个特定的值上下浮动,也即是说存在着一个极限值 <math>P(A)</math>,相对频率值趋向于这个极限值。这个极限值被称为统计概率,表示为:
例如,若想知道在一次掷骰子的随机试验中获得 6 点的概率值可以对其进行 3000 次前后独立的扔掷试验,在每一次试验后记录下出现 6 点的次数,然后通过计算相对频率值可以得到趋向于某一个数的统计概率值。
上面提到的这个有关相对频率的经验值又被称为大数定律,是频率理论学家定义概率论的基础。然而没有人可以将骰子无限的扔下去,因此在实践中也就无法有力的证明大数定律,许多来自数学理论的论证至今也没有取得成功。尽管如此,统计概率在今天的实践中具有重要意义,它是数理统计的基础。 概率公理如果一个函数 <math>P</math> <math>P:S\to \R</math>
指定给每一个事件空间 <math>S</math> 中的事件 <math>A</math> 一个实数 <math>P(A)</math>,并且其满足下面的 3 个公理,那么函数 <math>P</math> 叫做概率函数,相应的 <math>P(A)</math> 叫做事件 <math>A</math> 的概率。
不难看出,上述公理适用于包括拉普拉斯概率和统计概率在内的所有概率定义。如果若干事件间的关系是两两空集,那么公理 3 还可以扩展为如下形式:
概率的计算需要提及的是下面将要介绍的 9 个计算概率的定理与上面已经提及的事件的计算没有关系,所有关于概率的定理均由概率的 3 个公理得来,同时适用于包括拉普拉斯概率和统计概率在内的所有概率理论。 定理 1 (互补法则)与 <math>A</math> 互补事件的概率始终是
证明:
利用互补法则,可以解决下面这个问题,在两次连续旋转的轮盘游戏中,至少有一次是红色的概率是多少? 定理 2不可能事件的概率为零:
证明: ø 和 <math>S</math> 是互补事件,按照公理 2 有
注意:此定理的逆定理不成立,即概率为零的事件不一定是不可能事件。 例子:按照欧几里得几何的定义和几何概型的计算公式,飞镖飞中靶中一点或一条线的概率为零(点、线的面积为零),但是这不是不可能事件。 同理概率为1的事件不一定是必然事件。 定理 3如果若干事件 <math>A_1,A_2</math>,...<math>A_n</math> ∈<math>S</math> 每两两之间是空集关系,那么这些所有事件集合的概率等于单个事件的概率的和。
注意针对这一定理有效性的决定因素是 <math>A_1</math>...<math>A_n</math> 事件不能同时发生。例如,在一次掷骰子中,得到 5 点或者 6 点的概率是: P=P(A5)+P(A6)=文件:Wuerfel.png = <math> \frac{2}{6}</math> = <math> \frac{1}{3}</math> 定理 4如果事件 <math>A,B</math> 是差集关系,则有,
证明: 事件 <math>A</math> 由下面两个事件组成:
定理 5 (任意事件加法法则)对于事件空间 <math>S</math> 中的任意两个事件 <math>A</math> 和 <math>B</math>,有如下定理:
证明: 事件 <math>A</math>∪<math>B</math> 由下面三个事件组成:
例如,在由一共 32 张牌构成的斯卡特扑克牌中随机抽出一张,其或者是"方片"或者是"<math>\mathcal{A}</math>"的概率是多少? 事件 <math>A</math>,<math>B</math> 是或者的关系,且可同时发生,就是说抽出的这张牌即可以是"方片",又可以是"<math>\mathcal{A}</math>",<math>A</math> ∩ <math>B</math> ( 既发生 <math>A</math> 又发生 <math>B</math> ) 的值是 1 / 32,( 从示意图上也可以看出,即是方片又是<math>\mathcal{A}</math>只有一张,即概率是 1 / 32 ),因此有如下结果: 从图片上也可看出,符合这一条件的恰好是 11 张牌。注意到定理 3 是定理 5 的特殊情况,即 <math>A</math>,<math>B</math> 不同时发生,相应的 P(A∩B)=0。 定理 6 (乘法法则)文件:Roulette2.png 轮盘游戏示意图 2 事件 <math>A</math>,<math>B</math> 同时发生的概率是:
注意应用如上公式的前提是事件 <math>A</math>,<math>B</math> 相互之间有一定联系,公式中的 <math>P ( A | B )</math> 是指在 <math>B</math> 条件下 <math>A</math> 发生的概率,又称作条件概率。回到上面的斯卡特游戏中,在 32 张牌中随机抽出一张,即是方片又是<math>\mathcal{A}</math>的概率是多少呢?现用 <math>P(A)</math> 代表抽出方片的概率,用 <math>P(B)</math> 代表抽出<math>\mathcal{A}</math>的概率,很明显,<math>A</math>,<math>B</math> 之间有一定联系,即 <math>A</math> 里包含有 <math>B</math>,<math>B</math> 里又包含有 <math>A</math>,在 <math>A</math> 的条件下发生 <math>B</math> 的概率是 P(B | A)=1/8,则有: 另一个例子,在 32 张斯卡特牌里连续抽两张 ( 第一次抽出的牌不放回去 ),连续得到两个<math>\mathcal{A}</math>的概率是多少呢? 定理 7 (无关事件乘法法则)两个不相关联的事件 <math>A</math>,<math>B</math> 同时发生的概率是:
注意到这个定理实际上是定理 6 (乘法法则) 的特殊情况,如果事件 <math>A</math>,<math>B</math> 没有联系,则有 P(A|B)=P(A),以及 P(B|A)=P(B)。现在观察一下轮盘游戏中两次连续的旋转过程,<math>P ( A )</math> 代表第一次出现红色的概率,<math>P ( B )</math> 代表第二次出现红色的概率,可以看出,<math>A</math> 与 <math>B</math> 没有关联,利用上面提到的公式,连续两次出现红色的概率为: <math>P(A \cap B) = \frac{18}{37} \cdot \frac{18}{37} = 0.2367</math> 忽视这一定理是造成许多玩家失败的根源,普遍认为,经过连续出现若干次红色后,黑色出现的概率会越来越大,事实上两种颜色每次出现的概率是相等的,之前出现的红色与之后出现的黑色之间没有任何联系,因为球本身并没有"记忆",它并不"知道"以前都发生了什么。同理,连续 10 次出现红色的概率为 P=(18/37)10 =0.0007 完全概率<math>n</math> 个事件 <math>H_1,H_2,...H_n</math> 互相间独立,且共同组成整个事件空间 <math>S</math>,即
证明: <math>A=(A\cap H_1)\cup (A\cap H_2)\cup \ldots \cup (A\cap H_n)</math> 例如,一个随机试验工具由一个骰子和一个柜子中的三个抽屉组成,抽屉 1 里有 14 个白球和 6 个黑球,抽屉 2 里有 2 个白球和 8 个黑球,抽屉 3 里有 3 个白球和 7 个黑球,试验规则是首先掷骰子,如果获得小于 4 点,则抽屉 1 被选择,如果获得 4 点或者 5 点,则抽屉 2 被选择,其他情况选择抽屉 3 。然后在选择的抽屉里随机抽出一个球,最后抽出的这个球是白球的概率是: P(白)=P(白|抽1)·P(抽1)+P(白|抽2)·P(抽2)+P(白|抽3)·P(抽3)
从例子中可看出,完全概率特别适合于分析具有多层结构的随机试验的情况。 贝叶斯定理贝叶斯定理由英国数学家贝叶斯 ( Thomas Bayes 1702-1761 ) 发展,用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照定理 6 的乘法法则,P(A∩B)=P(A)·P(B|A)=P(B)·P(A|B),可以立刻导出贝叶斯定理:
如上公式也可变形为 <math>P(B \vert A) = \frac {P(A \vert B) \cdot P(B)} {P(A)} </math> 例如:一座别墅在过去的 20 年里一共发生过 2 次被盗,别墅的主人有一条狗,狗平均每周晚上叫 3 次,在盗贼入侵时狗叫的概率被估计为 0.9,问题是:在狗叫的时候发生入侵的概率是多少? 另一个例子,现分别有 <math>A</math>,<math>B</math> 两个容器,在容器 <math>A</math> 里分别有 7 个红球和 3 个白球,在容器 <math>B</math> 里有 1 个红球和 9 个白球,现已知从这两个容器里任意抽出了一个球,且是红球,问这个红球是来自容器 <math>A</math> 的概率是多少? 假设已经抽出红球为事件 <math>B</math>,从容器 <math>A</math> 里抽出球为事件 <math>A</math>,则有:<math>P ( B )</math> = 8 / 20,<math>P ( A )</math> = 1 / 2,<math>P ( B | A )</math> = 7 / 10,按照公式,则有: 概率分布概率论的应用虽然概率论最早产生于17世纪,然而其公理体系只在20世纪的20至30年代才建立起来并得到迅速发展,在过去的半个世纪里概率论在越来越多的新兴领域显示了它的应用性和实用性,例如:物理、化学、生物、医学、心理学、社会学、政治学、教育学,经济学以及几乎所有的工程学等领域。特别值得一提的是,概率论是今天数理统计的基础,其结果被用做问卷调查的分析资料或者对经济前景进行预测。 参考文献
参见 |