你认识几何分布吗?

概率分布可以分为离散型概率分布和连续型概率分布。这篇文章介绍离散型概率分布中的一种:几何分布。

知识点:

  • 伯努利试验
  • 期望
  • 几何分布 Geometric distribution

在介绍几何分布之前,先来了解一下伯努利试验。

定义:是在随机试验的条件下,结果只有两种可能:发生或者不发生的一种试验。

示例:比如将考试成绩判定为合格或不合格 、生男孩或者生女孩、投掷硬币为正面或反面等等。每一次试验的结果只有两种可能,并且每次试验的结果之间相互独立,互不干扰。比如A及格与B能否及格没有关系。

然后我们来补充一个期望的概念。

定义:是指实验中每个可能出现的结果乘以其概率的总和,反应随机变量平均取值的大小,即在多次试验的情况下预测能取得的结果。

示例:在一个打靶游戏中,打中区域对应得到的分值与其概率如下图所示:

(如果没能打中靶子,则为“其他”,对应概率为0.35)

本例中的“其他”代表没有打中靶子,视为得0分。求相应的期望如下:

E(x)=10×0.05+9×0.1+8×0.1+7×0.2+6×0.2+0×0.35=4.8分

意为在多次打靶之后,期望的打靶得分为4.8分。

接着来了解一下几何分布。

定义:指在伯努利试验中,试验r次才得到第一次成功的机率。即前r-1次都失败,在第r次成功的概率。

示例:射箭第几次能够正中靶心、有放回的情况下第几次能取到期望颜色的小球等等,求这种多次进行的试验下第几次能够达到想要的目的。

公式:假设根据以往经验或数据,某个试验成功的概率为p,除了成功就是失败,没有中间地带,所以失败的概率为1-p,设为q。现在进行这个试验,如果成功就立即停止试验,如果失败就继续试验,一直到成功为止。假设这个试验进行了r次,即在第r次取得了成功。可以用公式表示如下:

这个式子的比较好理解,意为在失败(q)了r-1次之后,终于在第r次迎来了成功(p)。r只取正整数,属于离散型随机变量,在上式中,随机变量r服从几何分布,记为r~ Geo(p)。例如,某生产线上的产品不合格率为0.05,则首次查到不合格品的检查次数r ~ Geo(0.05) 。

几何分布求期望:

公式:如果x~ Geo(p),则

示例:如果引用打靶的例子,该选手对自己的要求比较高,认为打中10分或9分才为成功,低于9分则为失败,求该选手将在第几次获得成功。

这位选手有望在第7次的打靶中获得成功 。

几何分布同样适用于不等式的情况:

情况一:

公式:如果x~ Geo(p),P(x>r)时,P(x>r)=qr

示例:在打靶例子中,如果该选手第一次取得成功时,需要试验r次以上的概率。即在前r次中,该选手的结果都为失败,只有在r次之后,才有可能成功。求该选手在第3次以上才能获得成功的概率。

P(x>r) = qr =(0.05+0.1)3 = 0.003375

情况二:

公式:如果x~ Geo(p),P(x≤r)时,P(x≤r)=1-qr

示例:在打靶例子中,求该选手在打靶3次之内能够获得成功的概率。即该选手在第1次,或第2次,或第3次就获得了成功的概率。

P(x>r) = 1- qr =1-(0.05+0.1)3 =1- 0.003375 = 0.996625

几何分布求方差:

公式:如果x~ Geo(p),则

示例:依旧沿用打靶的例子。求该选手成功打靶10分或者9分需要试打次数的方差。

几何分布就分享到这里了,主要掌握几何分布的含义及几个使用的场景就可以了,接下来是离散型概率分布的其他类型,敬请期待!

本原创首发于公众号:数据分析鱼,欢迎围观!

(0)

相关推荐

  • 概率分布[概率分布]

    概率分布,是概率论的基本概念之一,主要用以表述随机变量取值的概率规律.为了使用的方便,根据随机变量所属类型的不同,概率分布取不同的表现形式.事件的概率表示了一次试验某一个结果发生的可能性大小.若要全面 ...

  • 课堂实录| 话说分布列

    今天讲分布列. 因为是传说中高考的重要考点,很多的高二新生对分布列有着由衷的敬畏. 所以,今天以概念为主介绍了分布列. 分享出来,供大家参考. 师 如果从字面上看,大家怎么理解分布列呢? 参与话题讨论 ...

  • 概率统计专题49:胸有成竹 - 离散型随机变量与期望

    概率统计专题49:胸有成竹 - 离散型随机变量与期望 离散型随机变量是一个基础性的概念,"成竹在胸"就是说这些内容需要掌握得很好.该类型需要掌握离散型随机变量的概念.分布列.期望. ...

  • 六分钟内解释所有的概率分布,最重要的概率分布的直观解释

    当我开始学习概率分布时,我感觉有点困难,因为内容很多并且名字都很陌生.现在我意识到,只要抛开它们背后的数学知识,这些概念其实很容易理解.我将从概念上讲一讲我认为最基本的概率分布,而不是数学方面的东西. ...

  • 核密度估计KDE

    对样本的分布情况进行研究是最基本的数据分析技能,研究方法可以分为以下两大类 1. 参数估计,根据经验假设数据符合某种特定的分布,然后通过抽样的样本来估计总体对应的参数,比如假设高斯分布,通过样本来估计 ...

  • 《深入浅出统计学》豆知识摘录1

    直方图和条图的区别 条型图,用于描述分类型数据较多. 直方图,用于描述数值型数据的分组. 直方图:图上的长方形之间无间隔, 每个长方形的面积和频数成比例. ⚠️: 画图时,边界线是199和200的平均 ...