课堂实录| 话说分布列
今天讲分布列。
因为是传说中高考的重要考点,很多的高二新生对分布列有着由衷的敬畏。
所以,今天以概念为主介绍了分布列。
分享出来,供大家参考。
如果从字面上看,大家怎么理解分布列呢?
参与话题讨论
#从字面理解“分布列”#
列是列表、表格的意思,我是赞同的。
至于分布,虽然不好表达它的意思,但,是不是也有点熟悉的感觉呢?
或者说,有没有在哪见过这个词?
嗯,确实,我们最早接触分布这个词,应该就是初中统计初步里提到的这个频率分布表和频率分布直方图了。
既然“列”是“列表”或“表格”的意思,那我们就先回顾下什么是“频率分布表”。
大家还记得,怎么做频率分布表么?频率分布表的结构又是什么样子的呢?
要做频率分布表,首先要给我们一个数据样本。
频率分布表,就是对一个样本的数据做一定量的分析,并用分析的结果来估计总体的相关水平。
列频率分布表,主要有四个步骤:
计算极差(最大值-最小值)
决定组距与组数
分组
列频率分布表
具体就像是这个样子:
频率分布表,实际上反映了在样本数据中,某个范围内数字出现的个数及频率的具体数据。
例1.连续抛了100次硬币,出现41次正面向上,59次反面向上,请做出分布表。
确实,这个样本数据中虽然有100个数,但是毕竟只有两种数:0和1,因此分组时就没必要再弄个范围了,直接以0和1分别为一组,再做统计就好。
这个分布表可以写成这个样子:
分组 | 频数 | 频率 |
0 | 41 | 0.41 |
1 | 59 | 0.59 |
合计 | 100 | 1 |
上节课我们学习了离散型随机变量,下面我们看例2.
例2:某同学连续抛掷硬币100次,记正面向上的次数为X。
①求变量X的取值;
②求P(X=3)
生
变量X的取值可以是:0,1,2,...,100.
嗯,按照概率计算三步曲,确实应该是这样的。
一共抛了100次硬币,每次都有两种选择,所以:
事件X=3表示有3次正面向上,所以:
因此,事件X=3发生的概率就是:
其实,在这个试验中,随机变量X所有可能的取值有:0,1,2,...,100,而3只是其中的一种情况。
下面大家计算一下X取每一个值时相应的概率。
这里的变量取值及取每个值时对应的概率,我们也可用以类似于频率分布表的形式来表达。
上面的这种表格我们称为离散型随机变量X的分布列,简称X的分布列。如果要求不是非常严格,也可以表示成等式的形式:
如果在概率的计算过程中,有类似于数列通项公式的感觉,这样的的分布列也可以用等式来表示:
当然,如果你愿意,分布列还可以用图像来表示。
比如,在掷骰子的试验中,掷出的点数X的分布列,也可以在直角坐标系中表示:
其中,横坐标表示随机变量的取值,纵坐标表示概率。
从图中也可以看出,X的取值范围是{1,2,3,4,5,6},它取每个值的概率都相等,为1/6。
当然,我们以后的分布列,基本上都要求用表格的形式表示。
通过我们对这种离散型随机变量分布列的分析,你觉得这个分布列,与以前的频率分布表有什区别么?
首先,我也觉得,至少从形式上看,频率分布表与随机变量的分布列,是没有什么区别的,关键的部分,也就是分组与频率,完全相同。
但刚才有几位同学说的也有点道理。就象是例2,从分布列的角度去分析,正面向上的次数可以是0,1,2,……100,其中就有41次正面向上和59次反面向上的这种情况。
也就是说,例1只是例2在试验过程中的情况之一而已。
频率分布表是对已经结束的试验结果做分析;而分布列,是在开始试验前,对试验结果做预测!
嗯,这个分析的好。
频率分布表,是给了你一个样本数据,这个样本中的数据,当然只有试验完成以后才会产生。
所以,它是针对于某个已经完成的试验,对其结果做数据分析。
而离散型随机变量的分布列,是在试验之前,对即将要做的试验结果做分析或猜测。
抛掷100次硬币,正面向上的次数有可能有多少次?这是对结果的一种预测。
那么,在生产实践中,频率分布表适用于做经验总结;而分布列,则更适合用于做生产的规划和预测,对即将要做的事情作风险评估或目标预测。
两者都充分体现了数学的应用价值。
和频率分布表类似,随机变量的分布列,明显具备如下两个性质:
好,知道了什么叫分布列,还知道了分布列的基本结构,下面我们就来试试能不能求分布列。
例3.在含有5件次品的100件产品中,任取3件,求:
①取到的次品数X的分布列;
②至少取到1件奖品的概率。
很显然,这个问题可以分为四种情况,因此,各种情况下的概率之和必为1.
这个特征,可以用来检验概率计算的正确性。
上面的这种分布,是我们以后经常会见到的一种形式。我们称它为超几何分布。
它的基本形式为:
一次试验下的N个元素中有两类元素,从中取出M个元素,记属于其中一类的元素个数为变量X,则变量X服从超几何分布。
比如:班级有50名同学,其中男生30人,女生20人。现从班级选取5人,求5人中女生个数的分布列。
上面试验中,女生个数即服从超几何分布。
从上面的例题可以看出,求变量的分布列可以分为三个步骤:
①根据题意,求出变量所有取值;
②计算变量取每个值时的概率;
③根据分布列的特征,列出分布列。