先验概率和后验概率

先验概率:指根据以往经验和分析得到的概率。(由因求果)
后验概率:指依据得到"结果"信息所计算出的最有可能是那种事件发生。(知果求因)


一、概率基础知识

示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
在这里插入图片描述

二、先验概率和后验概率两者之间的关系

2.1 概念区别

先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现.
后验概率是指依据得到"结果"信息所计算出的最有可能是那种事件发生,如贝叶斯公式中的,是"执果寻因"问题中的"因".
后验概率起了这样一个用途,根据一些发生的事实(通常是坏的结果),分析结果产生的最可能的原因,然后才能有针对性地去解决问题。

2.2 举例区分

在这里插入图片描述

图中是影响堵车A的三个因素:B1、B2、B3。则有以下结论:
堵车是结果,三个因素是原因
(由因求果)先验概率:求出堵车A的概率P(A)
(知果求因)后验概率:由于交通事故已经发生车辆拥堵,想算一下拥堵是由交通事故引起的概率P(B1|A)

三、举例说明

假设我们现在有两个盒子,分别为红色和蓝色。在红色盒子中放着2个苹果和6个橙子,在蓝色盒子中放着1个橙子和3个苹果,如下图所示:
在这里插入图片描述图中绿色表示苹果,橙色代表橙子。假设我们每次实验的时候会随机从某个盒子里挑出一个水果,随机变量B(box)表示挑出的是哪个盒子,并且P(B=blue) = 0.6(蓝色盒子被选中的概率),P(B=red) = 0.4(红色盒子被选中的概率)。随机变量F(fruit)表示挑中的是哪种水果,F的取值为"a (apple)“和"o (orange)”。
现在假设我们已经得知某次实验中挑出的水果是orange,那么这个orange是从红色盒子里挑出的概率是多大呢?依据贝叶斯公式有:
在这里插入图片描述


总结

简单介绍一下机器学习中的先验概率和后验概率的基本概念和理解,这有助于后面理解机器学习中因果推理的过程。