贝叶斯公式推导：联合概率对称性破解条件反转

2026-06-11阅读 0热度 0

人工智能

概率论中，从简单概率过渡到条件概率，再延伸到贝叶斯定理，是理解统计推断的关键跃迁。许多人对公式望而生畏，但借助一个简单的盒子球游戏即可清晰构建逻辑框架。接下来，我们通过两个盒子和若干球的实例，逐步拆解这一推导过程。

设有两个盒子：盒子 A 与盒子 B。每个盒子各装 4 个球——盒子 A 含 3 红 1 绿，盒子 B 含 1 红 3 绿。

假设一位蒙眼实验者站在两个盒子前，随机选中任一盒子的概率为 \( \frac{1}{2} \)。选定某个盒子（例如盒子 A）后，从中摸出红球的概率是 \( \frac{3}{4} \)，摸出绿球的概率是 \( \frac{1}{4} \)。

树形图清晰刻画了全过程。从盒子选择到球的选择，每条分支标注了对应的概率。由此自然引出几个基本概念：蒙眼者选定盒子 A 后，取到红球的概率为 \( \frac{3}{4} \)，绿球为 \( \frac{1}{4} \)。

选中任一盒子的概率均为 \( \frac{1}{2} \)，数学表示为 \( P(A) = \frac{1}{2} \)，\( P(B) = \frac{1}{2} \)。这属于简单概率，直接基于全集计算得出。

在盒子 A 已选中的条件下，取出红球的概率记为 \( P(R \mid A) = \frac{3}{4} \)。此即条件概率，它将“样本空间”限定于“盒子 A 已选定”这一子集。换言之，

  P(R | A) = 3/4 = 盒子 A 中红球个数 / 盒子 A 中球的总数

类似地，\( P(G \mid A) = \frac{1}{4} \) 表示在盒子 A 已选中的条件下取出绿球的概率。

条件概率的核心特征在于缩小样本空间。计算条件概率时，参考系仅包含条件所界定的子集。选定盒子阶段，“样本空间”为两个盒子之和；取球阶段，“样本空间”缩小至特定盒子，概率以该盒子内球的总数为分母。本质即用盒子 A 的红球数除以盒子 A 的总球数。

那么 \( P(R \cap A) \) 和 \( P(G \cap A) \) 呢？它们同样是概率，但未附加条件。它们代表从树根节点出发、自初始状态计算的概率——不假设盒子已选，而是将选盒与取球两步合并，计算从起点到终点的总概率。

\( P(R \cap A) = P(A) \cdot P(R \mid A) = \frac{1}{2} \cdot \frac{3}{4} = \frac{3}{8} \)

此公式为何成立？从盒子 A 中取到红球的条件概率为 \( \frac{3}{4} \)，但需乘以选中盒子 A 本身的概率 \( \frac{1}{2} \)。两者相乘后，\( \frac{3}{4} \) 缩至 \( \frac{3}{8} \)。蒙眼者选中盒子 A 的概率为 \( \frac{1}{2} \)，而后在盒子 A 中摸到红球的概率为 \( \frac{3}{4} \)，两步联合概率即为 \( P(R \cap A) = \frac{3}{8} \)。由于两盒各含 4 球且等概率选中，\( \frac{3}{8} \) 等价于盒子 A 中红球数除以全集球总数。

结果直观：所有条件概率均因前置的盒子选择概率而按比例缩小——即按选中该盒子的概率缩放。出发点也从树的盒子节点退回到根节点。

类似地：

 P(G ∩ A) = 1/8 = 盒子 A 中绿球数 / 全集中球的总数  
 P(R ∩ B) = 1/8, P(G ∩ B) = 3/8

至此，全集被分割为四个互不重叠的概率块：

\( P(R \cap A) + P(G \cap A) + P(R \cap B) + P(G \cap B) = \frac{3}{8} + \frac{1}{8} + \frac{1}{8} + \frac{3}{8} = \frac{8}{8} = 1 \)

四个块之和恰好为 1，证明全集中所有盒子与球的组合已被穷举，无任何遗漏。图示如下：

注意，\( P(R \mid A) \) 衡量红球在盒子 A 内部的比例；而 \( P(R \cap A) \) 衡量盒子 A 中红球在整个全集中的比例。两者的区别至关重要。

现转换提问方向：随机取出一个红球，它源自盒子 A 的概率是多少？即求 \( P(A \mid R) = ? \)

此问题方向与树形图恰好相反。原逻辑为先选盒再取球，“样本空间”从全集缩小至特定盒子，在盒子层面计算条件概率。新逻辑则为：先假定取到的球是红色——“样本空间”缩小至仅含红球——再观察其中来自盒子 A 的比例。

一种理解方法是先构建“红球星球”，将全集中所有红球聚集，再观察盒子 A 贡献的份额。

\( P(R) = P(R \cap A) + P(R \cap B) = \frac{1}{2} \)

此值为何合理？全集被切为四块，其中两块含红球：\( P(R \cap A) \) 和 \( P(R \cap B) \)。两者之和即红球的总概率。这两个值均以全集为参考系，因此 \( P(R) = \frac{1}{2} \) 表明全集中一半的球为红色。

新的参考系如下：

类似地：

 P(G) = P(G ∩ A) + P(G ∩ B) = P(G | A) · P(A) + P(G | B) · P(B)  
 P(G) = 1/4 · 1/2 + 3/4 · 1/2 = 1/2

至此，“样本空间”的组织方式发生转变——从“盒子包含球”变为“球携带来源盒子的标签”。

为何需要这种转换？原概率链条为“先选盒、再取球”，但目标问题方向相反：已知取到红球，欲知其来自哪个盒子。方向反转后，需从 \( P(R \mid A) \) 转向计算 \( P(A \mid R) \)：

 P(A | R) = P(A ∩ R) / P(R) = (3/8) / (1/2) = 3/4

为什么不直接用 \( P(A \cap R) = \frac{3}{8} \) 回答？因为 \( \frac{3}{8} \) 是基于全集视角——全集中盒子 A 红球所占比例。但问题要求使用“红球星球”视角，而非全集视角。红球星球的总量小于全集，因此需对 \( \frac{3}{8} \) 按比例放大——除以 \( P(R) = \frac{1}{2} \)，等价乘以 2，得到 \( \frac{3}{4} \)。\( P(A \cap R) \) 与 \( P(R) \) 分母均为全集，度量单位一致，相除后结果即落至红球星球的尺度。

换一种角度：红球星球上共有 4 个红球，其中 3 个来自盒子 A。

 P(A | R) = 来自星球 A 的红球数 / 红球总数 = 3/4

另一种理解：红球星球由两个块构成——\( P(A \cap R) \) 和 \( P(B \cap R) \)，两者之和即为 \( P(R) \)。计算 \( P(A \cap R) \) 在 \( P(R) \) 中的占比，直接做除法即可。

绿球方向的计算完全对称：已知绿球被取出，求其来自盒子 B 的概率。

 P(B | G) = P(B ∩ G) / P(G) = P(B ∩ G) / (P(A ∩ G) + P(B ∩ G))  
 P(B | G) = (3/8) / ((1/8) + (3/8)) = 3/4

总结全过程：在全集 1 中，星球为盒子 A 与盒子 B，各自包含红球与绿球的分区。经过重组，全集 2 中的星球变为红球与绿球，各自包含盒子 A 与盒子 B 的分区。从一种划分到另一种划分的转换——这正是贝叶斯定理的本质。

直接代入公式验证：

 P(A | R)  = P(A ∩ R) / P(R)  
           = P(A ∩ R) / (P(A ∩ R) + P(B ∩ R))  
           = P(R | A) · P(A) / (P(R | A) · P(A) + P(R | B) · P(B))  
           = 3/4 (代入数值即可验证)

需注意一个细节：

 P(A ∩ R) = P(R | A) · P(A)   [问题中已给定，直接使用]  
 P(A ∩ R) = P(A | R) · P(R)   [这是最终目标，计算时不采用此形式]

为何这套全集转换的逻辑成立？为何原本以盒子为视角的概率可以翻转为以球为视角？根本原因在于全集可通过交集运算拆解为互不重叠的概率块。

“全集可被分割为小的、带标签的块（联合概率）。”

这些小块各自携带条件标签，可按需重新组合成新的“星球”，从而以不同视角审视同一个全集。\( P(R \cap A) \)、\( P(R \cap B) \)、\( P(G \cap A) \)、\( P(G \cap B) \)——这四个联合概率是构建一切的基本单元。

贝叶斯公式：

\( P(A \mid R) = \dfrac{P(A \cap R)}{P(R)} = \dfrac{P(R \mid A) \cdot P(A)}{P(R)} \)

从盒子出发提问“给定盒子，球的颜色为何”——答案是条件概率 \( P(R \mid A) \)、\( P(G \mid B) \) 等。将条件概率乘以降落在该盒子上的概率 \( P(A) \) 或 \( P(B) \)，得到联合概率 \( P(R \cap A) \) 等。按颜色对联合概率分组，获得边缘概率 \( P(R) \) 和 \( P(G) \)，进而可反转提问方式：\( P(A \mid R) \) 或 \( P(B \mid G) \)。

从 \( P(R \mid A) \) 到 \( P(A \mid R) \) 的反转——这正是贝叶斯定理所形式化的运算。

贝叶斯思想之所以自然到几乎无需解释，是因为全集天然可被切分为带标签的小块（联合概率），这些小块按盒子分组即得盒子级别概率，按颜色分组即得颜色级别概率。贝叶斯定理仅是一套以一致、归一化方式将“给定”方向从盒子→颜色翻转为颜色→盒子的算术规则。

贝叶斯公式推导：联合概率对称性破解条件反转

相关阅读

最新教程

最新资讯