0%

概率论基础

Probability Theory

概率论基础

随机事件与概率

  • 随机现象:在一定条件下,并不总是出现相同结果的现象
  • 结果不止一个
  • 人们事先并不知道哪一个结果出现
  • 确定性现象:只有一个结果的现象
  • 随机事件(简称事件):随机现象的某些样本点组成的集合
  • 任一事件$A$是相应样本空间的一个子集
  • 样本空间$\Omega$
  • 基本事件:由样本空间$\Omega$中的单个元素组成的子集
  • 必然事件:样本空间$\Omega$的最大子集($\Omega$本身)
  • 不可能事件:样本空间$\Omega$的最小子集(即空集$\emptyset$)

事件间关系

  • 包含:如果属于$A$的样本点必属于$B$,则称$A$被包含在$B$中 或 $B$包含$A$
    $$A\subset B 或 B \supset A$$
  • 对任一事件$A$,必有$\emptyset \subset A\subset \Omega$
  • 相等:如果事件$A$和事件$B$满足——属于$A$的样本点必属于$B$,且属于$B$的样本点——则称事件$A$与事件$B$相等($A=B$)
    $$A\subset B 且 B\subset A$$
  • 互不相容:事件$A$和事件$B$没有相同的样本点(事件$A$与事件$B$不可能同时发生)

事件间运算

  • :由事件$A$与$B$中所有的样本点组成的新事件
  • 事件$A$与$B$中至少有一个发生
    $$A\cup B$$
  • :由事件$A$与$B$中公共的样本点组成的新事件
  • 事件$A$与$B$同时发生
    $$A\cap B或 AB$$
  • :由在事件$A$中而不在事件$B$中的样本点组成的新事件
  • 事件$A$发生而事件$B$不发生
    $$A-B 或 A\cap B^c$$
  • 对立事件:事件$A$的对立事件$\bar{A}$——由在$\Omega$中而不在$A$中的样本点组成的新事件
  • $A$不发生
    $$\bar{A}=A^c=\Omega-A$$
  • 对立事件是相互的
    $$\overline{ \overline{A} }=A$$
  • $\overline{\Omega}=\emptyset$
  • $\overline{\emptyset}=\Omega$

事件的运算性质

  • 交换律
    $$A\cup B=B\cup A$$
    $$AB=BA$$
  • 结合律
    $$(A\cup B)\cup C=A\cup (B\cup C)$$
    $$(AB)C=A(BC)$$
  • 分配律
    $$(A\cup B)\cap C=(A\cap C)\cup(B\cap C)$$
    $$(A\cap B)\cup C=(A\cup C)\cap(B\cup C)$$
  • De Morgan(对偶律)
  • 事件并的对立等于对立的交
    $$\overline{A\cup B}=\overline{A}\cap \overline{B}$$
  • 事件交的对立等于对立的并
    $$\overline{A\cap B}=\overline{A}\cup\overline{B}$$
    $$\overline{\bigcup_{i=1}nA_i}=\bigcap_{i=1}n\overline{A_i},\quad \overline{\bigcup_{i=1}^\infty A_i}=\bigcap_{i=1}^\infty \overline{A_i}$$
    $$\overline{\bigcap_{i=1}nA_i}=\bigcup_{i=1}n\overline{A_i},\quad \overline{\bigcap_{i=1}^\infty A_i}=\bigcup_{i=1}^\infty \overline{A_i}$$

分割

partition
将样本空间$\Omega$划分为$n$个互不相容的事件$D_1,\cdots,D_n$——${D_1,\cdots,D_n}$称为$\Omega$的一个分割
$$\mathscr{F}={D_1,\cdots,D_n}$$

  • 对所有的$i,j=1,\cdots,n$且$i\neq j$,有$D_i\cap D_j=\emptyset$
  • $\bigcup_{i=1}^n=\Omega$

函数

Beta函数

$$B(\alpha, \beta)=\int_0^1 x{\alpha-1}(1-x){\beta-1}\mathrm{d}x ,\quad \alpha,\beta>0$$

  • $B(\alpha,\beta)=\frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}$
    证明:

Gamma函数

$$\Gamma(\alpha)=\int_0{+\infty}x{\alpha-1}e^{-x}\mathrm{d}x ,\quad \alpha>0$$

  • $\Gamma(\alpha+1)=\alpha\Gamma(\alpha)$
  • $\Gamma(n+1)=n!,\quad n\in \mathbb{N}$.

随机变量

用来表示随机现象结果的变量

概率

条件概率

$X$ condition on $Y$
$$P(X|Y)=\frac{P(X,Y)}{P(Y)}=\frac{P(Y|X)P(X)}{P(Y)}$$

贝叶斯公式

  • 如果${A_i:i=1,\cdots,k}$是一个分割(partition),则有
    $$P(A_j|B)=\frac{P(B|A_j)P(A_j)}{\sum_{i=1}^kP(B|A_i)P(A_i)}$$

期望

Expectation
$$E(X)=\int xf_X(x)\mathrm{d}x$$

条件期望

条件期望/条件均值(Conditional Mean):
$$E\left(X|Y=y\right)=\int xf_{X|Y}(x|y)\mathrm{d}x$$

重期望

LIE(Law of Iterated Expectation)

$$E(X)=E\left[E\left(X|Y\right) \right]$$
$$E\left[Z|X \right]=E\left[E\left(Z|Y,X\right)|X \right]$$

$$Var(X)=E\left[Var(X|Y) \right]+Var\left[E\left(X|Y \right)\right]$$

证明:

方差

条件方差

$$Var\left(X|Y=y\right)=\int \left[x-E\left(X|Y=y \right)\right]^2f_{X|Y}(x|y)\mathrm{d}x$$

协方差

Covariance

条件协方差

Law of Total Conditional Variance:
$$Cov(Z|X)=Cov\left[E\left(Z|Y,X\right)|X \right]+E\left[Cov\left(Z|Y,X\right)|X \right]$$

分布

  • 概率密度函数(pdf,probability density function)

常见离散分布

伯努利分布

Bernoulli Distribution
$X\sim Bernoulli(p)$, $X$的可能取值只有0和1,且相应的概率为
$$P(X=1)=p,\quad P(X=0)=1-p\quad 0 < p <1$$

$$f(x|p)=\left{
\begin{array}{ll}
px(1-p){1-x}, & x=0,1\
0, & x\neq0,1
\end{array}
\right.$$

  • $E(X)=p$
    $$E(X)=1\cdot p+0\cdot (1-p)=p$$
  • $Var(X)=p(1-p)$
    $$E(X2)=12\cdot p+0^2\cdot (1-p)=p$$
    $$Var(X)=E(X2)-[E(X)]2=p-p^2=p(1-p)$$

泊松分布

Poisson Distribution
参数为$\lambda$的泊松分布的概率密度函数为
$$P(X=k)=\frac{\lambdak}{k!}e{-\lambda},\quad k=0,1,\cdots.$$

  • $E(X)=\lambda$
  • $Var(X)=\lambda$

常见连续分布

贝塔分布

Beta Distribution
$X\sim B(\alpha, \beta)$, 则$X$的概率密度函数为
$$f_X(x)=\frac{1}{B(\alpha,\beta)}x{\alpha-1}(1-x){\beta-1},\quad 0< x < 1$$

  • $E(X)=\frac{\alpha}{\alpha+\beta}$

    \begin{equation}
    \begin{aligned}
    E(X)&=\int_0^1 x\frac{1}{B(\alpha,\beta)}x{\alpha-1}(1-x){\beta-1}\mathrm{d}x\
    &=
    \end{aligned}
    \end{equation}

  • $Var(X)=\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}$

伽马分布

Gamma Distribution
$X\sim \Gamma(\alpha, \beta)$, 则$X$的概率密度函数为
$$f_X(x)=\frac{\beta^{\alpha} }{\Gamma(\alpha)}x{\alpha-1}e{-\beta x},\quad x>0$$

  • $E(X)=\frac{\alpha}{\beta}$
  • $Var(X)=\frac{\alpha}{\beta^2}$

逆伽马分布

Inverted Gamma Distribution
$X\sim \Gamma(\alpha, \beta)$,定义$Y=\frac{1}{X}$,则$Y$服从逆伽马分布,概率密度函数为
$$f_Y(y)=\frac{\beta^{\alpha} }{\Gamma(\alpha)}y{-(\alpha+1)}e{ -\frac{\beta}{y} },\quad y>0$$

正态分布

$t$分布

Student’s t-distribution[1]

从均值为$\mu$、方差为$\sigma^2$的正态总体种抽取容量为$n$的随机样本,随机样本的

  • 均值:$\bar{x}$
  • 方差:$s2=\frac{1}{n-1}\sum_{i=1}n(x_i-\bar{x})^2$

则随机变量T
$$T=\frac{\bar{x}-\mu}{ s/\sqrt{n} }$$
服从自由度为$n-1$的$t$分布,即$T\sim t(n-1)$。

  • $t$分布是一种典型的长尾分布

卡方分布

若$k$个随机变量$Z_1, Z_2, \cdots, Z_k$是相互独立、服从标准正态分布的随机变量,则随机变量Z的平方和
$$X = \sum_{i=1}kZ_i2$$
服从自由度为$k$的卡方分布。

  • $E(X)=$

分布的特征

偏态

||左偏|正态|右偏|
|均值、中位数、众数|均值$<$中位数$<$众数|均值=中位数=众数|众数$<$中位数$<$均值|

峰度

参考资料


  1. 'Student’是William Sealy Gosset的笔名 ↩︎

Thank you for your approval.

欢迎关注我的其它发布渠道