通过可视化了解贝叶斯的定理
数据科学, 温和介绍贝叶斯定理以及为什么重要
> Photo by Balázs Utasi from Pexels
当我们在我们的机器学习之旅中开始时,我们经常询问自己是否应该学习统计和概率,特别是概率。答案取决于您的位置以及您想要让自己理解的程度如何。但是,请留意这些:
- 许多算法是使用概念的概念和技巧设计的算法,即朴素贝叶斯和概率图形模型;
- 使用在概率框架下设计的迭代算法进行许多模型,即最大似然估计(使用频率)和最大后估计(使用贝叶斯);
- 并且,模型的参数用概率框架 - 贝叶斯优化进行了调整。
在本文中,我将使用可视化解释Bayes的定理概念,为什么有些可能思考并不困难。
贝叶斯定理作为可视化……
让我们从一家公司的一个例子开始,其中包含30名工程师,其中25名工程师,如下面的可视化。
> Visualization of the statement
我们可以计算P(女性)= 5/30 = 1/6。考虑下一个陈述这些工程师的50%是博士,它可以写入P(博士)= 0.5,其中3个女性获得了博士学位。
> Engineer with PhD
现在,我们可能想要回答的问题是“我们所知道的,有50%的工程师有博士学位。对于来自这家公司的随机选择的个人,这个人是女性的概率是什么?“这个问题可以写入p(女性拥有博士学位)或p(女性| ph.d.)。基于可视化,转化为“给定博士”。作为一个新的宇宙,女性的可能性是什么。我们可以使用以下公式计算:
实际上使用上图,我们可以简单地通过查看博士来计算。作为一个新的宇宙(忽略那些有非博士学位)那么p(女性| ph.d.)= 女性数量/博士数量。工程师(见下文)。
这实际上是贝叶斯定理。
贝叶斯定理基础
在进行任何定义之前,当我们有一个假设时,通常使用贝父的定理,我们观察到一些证据,我们想知道假设持有的可能性,因为上述证据是真实的。现在它可能听起来有点令人困惑,让我们使用上述可视化以获得更好的解释。
在该示例中,我们希望了解选择谁完成博士学位的女性工程师的可能性。
我们需要的第一件事是在不考虑任何证据的情况下从样本中选择女性工程师的可能性。术语P(h)称为“先验”。
> The probability of the hypothesis holds without considering any pieces of evidence
下一个相关数字是女性工程师适合描述(完成博士学位)的比例,这是p(e | h)。在贝叶斯定理中,我们称之为“可能性”一词。
> The proportion of female engineer with PhD
同样,当假设不正确时,我们需要了解另一方面。
> The proportion of PhD for male engineers
有了这个概念,我们可以计算持有博士学位的女工程师的概率,p(女性| ph.d.)。然后可以作为p(e)写入分母。
> Bayes’ Theorem formula
为了添加一个最后的概念,P(H | E)被称为“后验”在贝叶斯定理中,这意味着他们在看到证据后相信假设。通常,当我们分析新数据的扩展以验证和无效模型时,我们将使用此公式。贝叶斯的定理有助于我们量化和系统化改变信仰的想法。这样我们就可以将贝叶斯定理实施到机器上以验证信仰。
定义…
贝叶斯定理(或贝叶斯法,贝叶斯规则,贝叶斯定价定理)根据先前了解可能与事件有关的证据或条件的先验知识来描述事件的可能性。例如,我们可以使用贝叶斯定理来评估Covid-19的风险,以便更准确地(通过在个人年龄上调),而不是假设个体是整个人口的典型。
还有什么?
正如我们所知,贝叶斯定理正在从贝叶斯统计数据中分支,依赖于主观概率,并使用贝叶斯定理来更新有关基于数据的事件和数量的知识和信念。因此,基于一些知识,我们可以在系统上绘制一些初始推论(“在贝叶斯之前”),然后“更新”这些推论,基于数据和新数据来获得“后后”。
此外,存在贝叶斯推理和频繁统计推理的术语,这篇文章中未涵盖。但是,本文应该向您提供对贝叶斯推论的一瞥,您应该能够自己研究频繁的统计推理。
结论
在本文中,我已经使用可视化解释了贝叶斯定理,并希望您获得了理解;
- 贝叶斯定理是什么,它在说什么?
- 什么时候有用?
(本文由闻数起舞翻译自Satsawat Natakarnkitkul的文章《Understand Bayes’ Theorem Through Visualization》,转载请注明出处,原文链接:
https://pub.towardsai.net/understand-bayes-theorem-through-visualization-8ec99a0577e4)