1404 字
7 分钟
概率论(2) 概率初步
目录
  1. 事件和样本空间
  2. 概率论公理
  3. 条件概率
  4. 贝叶斯理论
  5. 独立事件
  6. 随机变量, 期望

事件和样本空间#

样本空间#

试验的样本空间SS是试验的所有可能结果组成的集合.

试验对应的样本空间
  1. 抛硬币: S={正面,反面}S = \set{\text{正面}, \text{反面}}
  2. 同时抛两枚硬币: S={(正, 正),(正, 反),(反, 正),(反, 反)}S = \set{\text{(正, 正)}, \text{(正, 反)}, \text{(反, 正)}, \text{(反, 反)}}

事件与事件空间#

  1. 事件: 某个谓词H(x),xSH(x), x\in S. H(x)H(x)为真时我们称事件HH”发生”, 否则称事件HH”不发生”.
  2. 事件空间: 某个集合HH, H={xxS,H(x)}H = \set{x | x\in S, H(x)}, 即使事件发生的结果组成的集合.
事件对应的事件空间
  1. H=H = “硬币正面朝上”: E={正面}E = \set{\text{正面}}
  2. 试验为”同时抛两枚硬币”, H="正面朝上的硬币数大于等于一":E={(正, 正),(正, 反),(反, 正)}H = \text{"正面朝上的硬币数大于等于一"}: E = \set{\text{(正, 正)}, \text{(正, 反)}, \text{(反, 正)}}

概率论公理#

概率#

概率是频率的极限.

nn为总试验次数, n(H)n(H)nn次试验中使事件HH发生的试验次数.

可以定义事件HH发生的概率P(H)P(H).

P(H)=limnn(H)nP(H) = \lim _{n\rightarrow \infty}\frac{n(H)}{n}

概率论公理#

概率可以进行公理化定义.

  1. 0P(H)10\le P(H) \le 1.
  2. P(S)=1P(S) = 1
  3. EF=,P(E)+P(F)=P(EF)E \cap F = \emptyset, P(E) + P(F) = P(E\cup F).
概率论定理

以下是一些可以被证明的定理:

  1. P(S\E)=1P(E)P(S\backslash E) = 1 - P(E)
  2. EF,P(E)P(F)E\subset F, P(E) \le P(F).
  3. P(EF)=P(E)+P(F)P(EF)P(E\cup F) = P(E) + P(F) - P(E\cap F).
  4. [ P\left( \bigcup_{i=1}^n E_i \right) = \sum_{r=1}^n (-1)^{,r+1} \sum_{1 \le i_1 < i_2 < \cdots < i_r \le n} P!\bigl(E_{i_1} E_{i_2} \cdots E_{i_r}\bigr) ]. 容斥原理的拓展.

古典概型#

样本空间SS有限, 且每个单位事件(有且仅有1个元素能够使其发生的事件)的概率相等. 比如抛硬币, 掷骰子.

此时事件EE的概率:

P(E)=ESP(E) = \frac{|E|}{|S|}

条件概率#

P(EF)P(E|F)表示在F发生的给定条件下, E发生的概率. P(EF)=P(EF)P(F)P(E|F) = \frac{P(EF)}{P(F)}.

链式法则
P(EF)=P(EF)P(F)P(EF) = P(E|F)P(F)P(E1E2E3En)=P(E1)P(E2E1)P(E3E1E2)P(EnE1E2E3En1)P(E_1E_2E_3\cdots E_n) = P(E_1)P(E_2|E_1)P(E_3|E_1E_2)\cdots P(E_n|E_1E_2E_3\cdots E_{n - 1})

贝叶斯理论#

贝叶斯定理#

P(FE)=P(F)P(EF)P(E)P(F|E) = \frac{P(F)P(E|F)}{P(E)}P(FE)=P(F)P(EF)P(F)P(EF)+P(Fˉ)P(EFˉ)P(F|E) = \frac{P(F)P(E|F)}{P(F)P(E|F) + P(\bar F)P(E|\bar F)}

贝叶斯理论#

贝叶斯理论的本质: 后验概率正比于先验概率与似然(观察到E的可能性)的乘积.

先验概率对应P(EF)P(E|F), 是我们在某信息下对某事发生概率的主观信念. 似然对应P(F)P(F), 是我们观测到某信息的客观机会. 后验概率对应P(FE)P(F|E), 是我们在主观信念和客观信息下的理性推断.

从由因到果(先验)的推理, 转变成由果推因(后验)的推断, 这是贝叶斯理论的精华所在.

独立事件#

  • 称事件EEFF独立, 当且仅当:
P(EF)=P(E)P(F)其等价形式为P(EF)=P(E)P(EF) = P(E)P(F) \\\text{其等价形式为} \\P(E|F) = P(E)
  • 称事件E,F,GE,F,G独立, 当且仅当:
P(EFG)=P(E)P(F)P(G)P(EF)=P(E)P(F)P(EG)=P(E)P(G)P(FG)=P(F)P(G)P(EFG) = P(E)P(F)P(G) \\P(EF) = P(E)P(F) \\P(EG) = P(E)P(G) \\P(FG) = P(F)P(G)

全部成立.

EEFF独立, 则Eˉ\bar EFF也独立…, 等等.

条件独立#

称事件EE与事件FFGG的条件下独立, 当且仅当:

P(EFG)=P(EG)P(FG)其等价形式为P(EFG)=P(EG)P(EF|G) = P(E|G)P(F|G) \\\text{其等价形式为} \\P(E|FG) = P(E|G)

随机变量和期望#

随机变量#

一个随机变量XX是从随机试验结果到实数的函数.

比如一个随机试验为同时抛三枚硬币.

其样本空间S={(H,H,H),(H,H,T),(H,T,H),(T,H,H)(H,T,T),(T,H,T),(T,T,H),(T,T,T)}S = \set{(H, H, H),(H, H, T),(H, T, H),(T, H, H)\\(H, T, T),(T, H, T),(T, T, H),(T, T, T)}

此处用HH代指正面, TT代指反面.

建立随机变量YY作为正面朝上的个数.

我们有Y(H,H,H)=3,Y(H,T,H)=2Y(H, H, H) = 3, Y(H, T, H) = 2等.

离散型随机变量的每个取值可以对应一个概率. 该概率为所有使随机变量取该值的事件概率总和. 从取值到概率可以建立一个函数.

概率质量函数(PMF, probability mass function)#

对于离散型随机变量YY而言, P(Y=x)P(Y = x)表示事件Y=xY = x的概率.称为概率质量函数.

PMF常用柱状图表示: PMF

性质
  1. 非负
  2. 归一

概率密度函数(PDF, probability density function)#

对于连续型随机变量XX而言, PDF表示XXx x 附近“出现的可能性密度”. 其积分表示概率.

性质
  1. 非负
  2. 归一
  3. 其从aabb的积分表示[a,b][a,b]的概率
  4. 单点概率为0.

累计分布函数(CDF, Cumulative Distribution Function)#

随机变量XX的累计分布函数定义为: F(a)=P(Xa),aRF(a) = P(X \le a), a\in R

CDF可以看作PDF从负无穷开始的积分(连续型随机变量), 或者PMF的前缀和(离散型随机变量)

CDF的性质
  1. CDF单调不减.
  2. limxF(x)=0,limx+F(x)=1\lim_{x\rightarrow -\infty}F(x) = 0, \lim_{x\rightarrow +\infty}F(x) = 1
  3. CDF右连续.
CDF的应用
  1. 区间(a,b](a, b]内的概率可以由CDF计算得到. P(x(a,b])=F(b)F(a)P(x\in(a,b]) = F(b) - F(a)
  2. 可以通过CDF的反函数来计算随机变量的分位数(比如中位数).

期望#

随机变量XX的期望定义为: E[X]=Σi:P(X=i)>0iP(X=i)E[X] = \Sigma_{i:P(X=i) > 0} iP(X = i)

如果是连续型随机变量, 则改成积分的形式. 积分区间为(,)(-\infty, \infty)

大量重复试验下, 随机变量的平均值会收敛于期望.(大数定律)

性质
  1. 期望具有线性性.
E[aX+bY+c]=aE[x]+bE[Y]+c.E[aX + bY + c] = aE[x] + bE[Y] + c.
  1. 对于随机变量X,YX, Y, 若XX几乎处处小于等于YY, 则E[X]E[Y]E[X] \le E[Y]
  2. XXYY独立, 则E[XY]=E[X]E[Y]E[XY] = E[X]E[Y]
  3. Jensen不等式: 对于凸函数φ\varphi, φ(E[X])E[φ(X)]\varphi (E[X])\le E[\varphi (X)] , 一些例子
    1. (E[X])2E[X2](E[X])^2\le E[X^2]
    2. eE[X]E[eX]e^{E[X]}\le E[e^X]

指示器随机变量#

事件AA的指示器随机变量II的定义为:

  • AA发生, I=1I = 1
  • AA不发生, I=0I = 0 容易注意到P(I=1)=P(A)=E[I]P(I = 1) = P(A) = E[I]
概率论(2) 概率初步
https://fuwari.vercel.app/posts/概率论2-概率初步/
作者
ykindred
发布于
2025-08-31
许可协议
CC BY-NC-SA 4.0