你认识几何分布吗?
概率分布可以分为离散型概率分布和连续型概率分布。这篇文章介绍离散型概率分布中的一种:几何分布。
知识点:
- 伯努利试验
- 期望
- 几何分布 Geometric distribution
在介绍几何分布之前,先来了解一下伯努利试验。
定义:是在随机试验的条件下,结果只有两种可能:发生或者不发生的一种试验。
示例:比如将考试成绩判定为合格或不合格 、生男孩或者生女孩、投掷硬币为正面或反面等等。每一次试验的结果只有两种可能,并且每次试验的结果之间相互独立,互不干扰。比如A及格与B能否及格没有关系。
然后我们来补充一个期望的概念。
定义:是指实验中每个可能出现的结果乘以其概率的总和,反应随机变量平均取值的大小,即在多次试验的情况下预测能取得的结果。
示例:在一个打靶游戏中,打中区域对应得到的分值与其概率如下图所示:
(如果没能打中靶子,则为“其他”,对应概率为0.35)
本例中的“其他”代表没有打中靶子,视为得0分。求相应的期望如下:
E(x)=10×0.05+9×0.1+8×0.1+7×0.2+6×0.2+0×0.35=4.8分
意为在多次打靶之后,期望的打靶得分为4.8分。
接着来了解一下几何分布。
定义:指在伯努利试验中,试验r次才得到第一次成功的机率。即前r-1次都失败,在第r次成功的概率。
示例:射箭第几次能够正中靶心、有放回的情况下第几次能取到期望颜色的小球等等,求这种多次进行的试验下第几次能够达到想要的目的。
公式:假设根据以往经验或数据,某个试验成功的概率为p,除了成功就是失败,没有中间地带,所以失败的概率为1-p,设为q。现在进行这个试验,如果成功就立即停止试验,如果失败就继续试验,一直到成功为止。假设这个试验进行了r次,即在第r次取得了成功。可以用公式表示如下:
这个式子的比较好理解,意为在失败(q)了r-1次之后,终于在第r次迎来了成功(p)。r只取正整数,属于离散型随机变量,在上式中,随机变量r服从几何分布,记为r~ Geo(p)。例如,某生产线上的产品不合格率为0.05,则首次查到不合格品的检查次数r ~ Geo(0.05) 。
几何分布求期望:
公式:如果x~ Geo(p),则
示例:如果引用打靶的例子,该选手对自己的要求比较高,认为打中10分或9分才为成功,低于9分则为失败,求该选手将在第几次获得成功。
这位选手有望在第7次的打靶中获得成功 。
几何分布同样适用于不等式的情况:
情况一:
公式:如果x~ Geo(p),P(x>r)时,P(x>r)=qr
示例:在打靶例子中,如果该选手第一次取得成功时,需要试验r次以上的概率。即在前r次中,该选手的结果都为失败,只有在r次之后,才有可能成功。求该选手在第3次以上才能获得成功的概率。
P(x>r) = qr =(0.05+0.1)3 = 0.003375
情况二:
公式:如果x~ Geo(p),P(x≤r)时,P(x≤r)=1-qr
示例:在打靶例子中,求该选手在打靶3次之内能够获得成功的概率。即该选手在第1次,或第2次,或第3次就获得了成功的概率。
P(x>r) = 1- qr =1-(0.05+0.1)3 =1- 0.003375 = 0.996625
几何分布求方差:
公式:如果x~ Geo(p),则
示例:依旧沿用打靶的例子。求该选手成功打靶10分或者9分需要试打次数的方差。
几何分布就分享到这里了,主要掌握几何分布的含义及几个使用的场景就可以了,接下来是离散型概率分布的其他类型,敬请期待!
本原创首发于公众号:数据分析鱼,欢迎围观!