概率论公式整理
概率
频率 $f_n(A)=\frac{k}{n}$
- $ 0 \leq f_n(A) \leq 1$
- 对于必然事件$\Omega$ $f_n(\Omega)=1$
- 若事件不相容 $A \cap B = \emptyset$ 则 $f_n(A \cup B) = f_n(A) + f_n(B)$
若事件两两不相容
\[f_n(\bigcup_{i=1}^n A_i) = \sum_{i=1}^n f_n(A_i)\]有限可加性:事件$A_i$两两不相容
\[P(\bigcup_{i=1}^{n} A_i) = \sum_{i=1}^{n} P(A_i)\]基本运算公式
\[\begin{align*} P(A \cup B) &= P(A) + P(B) - P(A \cap B)\\ P(A - B) &= P(A) - P(A \cap B)\\ P( \overline{A} ) &= 1 - P(A)\\ P(A \cup B \cup C) &= P(A) + P(B) + P(C) - P(A \cap B) - P(A \cap C) - P(B \cap C) + P(A \cap B \cap C)\\ P(\bigcup_{i=1}^{n} A_i) &= \sum_{i=1}^{n} P(A_i) - \sum_{1 \leq i < j \leq n} P(A_i \cap A_j) + \sum_{1 \leq i < j < k \leq n} P(A_i \cap A_j \cap A_k) + \cdots + (-1)^{n-1} P(A_1 \cap A_2 \cap \cdots \cap A_n) \end{align*}\]条件概率
条件概率 \(P(B|A) = \frac{P(AB)}{P(A)}\)
含义:在事件A发生的条件下,事件B发生的概率 变式 \(\begin{align*} P(AB) &= P(A)P(B|A) = P(B)P(A|B)\\ P(AB) &= \frac{P(AB|U)}{P(B|U)}\\ P(ABC) &= P(A)P(B|A)P(C|AB)\\ P(\bigcap_{i=1}^{n} A_i) &= P(A_1)P(A_2|A_1)P(A_3|A_1A_2) \cdots P(A_n|A_1A_2 \cdots A_{n-1}) \end{align*}\)
全概率公式 \(P(B) = \sum_{i=1}^{n} P(A_i)P(B|A_i)\)
含义:B的概率等于在所有可能发生的事件$A_i$发生的条件下,B发生的概率的和 贝叶斯公式(逆概率公式) \(P(A_i|B) = \frac{P(A_i)P(B|A_i)}{\sum_{j=1}^{n} P(A_j)P(B|A_j)} = \frac{P(A_i)P(B|A_i)}{P(B)}\)
独立性
\[\begin{align*} P(AB) &= P(A)P(B)\\ P(ABC) &= P(A)P(B)P(C)\\ P(\bigcap_{i=1}^{n} A_i) &= \prod_{i=1}^{n} P(A_i) \end{align*}\]若A,B独立,则
$A \cap B = \emptyset$, $P(A \cap B) = 0$, $P(A \cup B) = P(A) + P(B)$, $P(B|A) = P(B|\overline{A}) P(B)$
伯努利实验
- 试验只有两个结果:$A$和$\overline{A}$
- 试验可以重复进行
- 每次试验结果相互独立
k重伯努利实验下A出现k次的概率
\[P_n(k) = C_n^k p^k (1-p)^{n-k}\]随机变量
随机变量:对于随机试验,对每个样本点赋予一个实数,这个实数就是随机变量 离散型随机变量:随机变量只能取有限个或可列个值 连续型随机变量:随机变量的取值是一个区间内的任意一个值
分布函数 X是一个随机变量,对于任意实数x,函数
\[F(x) = P\{X \leq x\}\]称为X的分布函数
- $F(x)$非严格单调递增
- $0 \leq F(x) \leq 1$
- $\lim_{x \to -\infty} F(x) = 0$,$\lim_{x \to +\infty} F(x) = 1$
- $F(x)$右连续(左闭右开)
离散型随机变量
概率分布、分布律
\[P\{X=x_i\} = p_i \qquad i=1,2,\cdots\]- $p_i \geq 0$
- $\sum_{i=1}^{\infty} p_i = 1$
二项分布
二项分布是n重伯努利实验中成功次数的离散型概率分布
\[P\{X=k\} = C_n^k p^k (1-p)^{n-k} \qquad k=0,1,2,\cdots,n\]泊松分布
泊松分布是二项分布的极限情况,当n很大,p很小时,二项分布近似于泊松分布
\[P\{X=k\} = \lim_{n \to \infty} C_n^k p^k (1-p)^{n-k} = \frac{\lambda^k}{k!} e^{-\lambda} \qquad k=0,1,2,\cdots\]其中$\lambda = np$,是泊松分布的参数
泊松分布的期望和方差
\[E(X) = \lambda \qquad D(X) = \lambda\]连续型随机变量
概率密度函数
\[F(x) = \int_{-\infty}^{x} f(t) dt\] \[\begin{align*} f(x) &\geq 0\\ \int_{-\infty}^{+\infty} f(x) dx &= 1\\ P\{a \leq X \leq b\} &= \int_{a}^{b} f(x) dx\\ F^{'}(x) &= f(x) \qquad 如果f(x)在x处连续 \end{align*}\]均匀分布
\[f(x) = \begin{cases} \frac{1}{b-a} & a \leq x \leq b\\ 0 & 其他 \end{cases}\] \[F(x) = \begin{cases} 0 & x < a\\ \frac{x-a}{b-a} & a \leq x \leq b\\ 1 & x > b \end{cases}\]均匀分布的期望和方差
\[E(X) = \frac{a+b}{2} \qquad D(X) = \frac{(b-a)^2}{12}\]指数分布
\[f(x) = \begin{cases} \lambda e^{-\lambda x} & x \geq 0\\ 0 & x < 0 \end{cases}\] \[F(x) = \begin{cases} 1-e^{-\lambda x} & x \geq 0\\ 0 & x < 0 \end{cases}\]无记忆性
\[P\{X > s+t | X > s\} = P\{X > t\}\]指数分布的期望和方差
\[E(X) = \frac{1}{\lambda} \qquad D(X) = \frac{1}{\lambda^2}\]正态分布
\[f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} = \frac{1}{\sigma\sqrt{2\pi}} \exp({-\frac{(x-\mu)^2}{2\sigma^2}})\]正态分布的期望和方差
\[E(X) = \mu \qquad D(X) = \sigma^2\]标准正态分布 $X \sim N(0,1)$
对于一般的正态分布$X \sim N(\mu,\sigma^2)$,可以通过标准化来转化为标准正态分布
\[Z = \frac{X-\mu}{\sigma} \sim N(0,1)\]注意 $\sigma = \sqrt{D(X)}$
拓展:$\int_{-\infty}^{\infty} e^{-x^2} = \sqrt{\pi}$
在二维平面中,样本点的期望值为 $(0,0)$ 样本的的分布遵循以下几个特性:
- 距离对称性 $f(x,y) = f(r) = f(\sqrt{x^2+y^2})$
- 独立性 $f(x,y) = g(x)h(y)$
对$f(x,y)$积分,其结果应当为常数,改写$f(x) = e^{-cr^2}$我们在极坐标下对其积分
\[\begin{align*} \int_{0}^{\infty} \int_{0}^{2\pi} f(r) r dr d\theta &= \int_{0}^{\infty} \int_{0}^{2\pi} e^{-cr^2} r dr d\theta \\ &= \int_{0}^{\infty} e^{-cr^2} r dr \int_{0}^{2\pi} d\theta \\ &= \int_{0}^{\infty} e^{-cr^2} r dr \cdot 2\pi \\ &= \frac{\pi}{c} \end{align*}\]再次回到$f(x,y)$,我们对其积分
\[\begin{align*} \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f(x,y) dx dy &= \int_{-\infty}^{\infty}f(x) dx\int_{-\infty}^{\infty} f(y) dy\\ &= (\int_{-\infty}^{\infty}f(x) dx)^2 \end{align*}\]在前我们已经得到了积分结果为$\frac{\pi}{c}$,所以
\[\int_{-\infty}^{\infty}e^{-cx^2} dx = \sqrt{\frac{\pi}{c}}\]因为概率密度函数的积分结果为1,我们先令$c=1$,只要对函数$f(x)$进行变换,就可以得到正态分布的概率密度函数,具体来说这个变换为
\[\varphi(x) = \frac{1}{\sqrt{\pi}}\frac{1}{\sqrt{2\sigma^2}} f(\frac{x-\mu}{\sqrt{2\sigma^2}})\]我们得到了最终的正态分布的概率密度函数
\[\varphi(x) = \frac{1}{\sqrt{\pi}\sqrt{2 }\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]随机变量函数的分布
设X是一个随机变量,Y是随机变量X的函数,即$Y = g(X)$,则Y是一个随机变量,其分布函数为
\[\begin{align*} F_Y(y) &= P\{Y \leq y\}\\ &= P\{g(X) \leq y\}\\ &= P\{X \leq g^{-1}(y)\}\\ &= F_X(g^{-1}(y))\\ \end{align*}\] \[f_Y(y) = \frac{dF_Y(y)}{dy} = f_X(g^{-1}(y)) |\frac{dg^{-1}(y)}{dy}|\]随机向量
随机向量:设$(X_1,X_2,\cdots,X_n)$是n个随机变量,它们构成的向量$(X_1,X_2,\cdots,X_n)$称为n维随机向量
二维随机向量:设$(X,Y)$是二维随机变量,对于任意实数$x,y$,函数
\[F(x,y) = P\{X \leq x, Y \leq y\}\]称为二维随机变量$(X,Y)$的分布函数
- $\frac{\partial F}{\partial x} \geq 0 \quad \frac{\partial F}{\partial y} \geq 0$
- $0 \leq F(x,y) \leq 1$
- $F(-\infty,y) = F(x,-\infty) = 0$
- $F(+\infty,+\infty) = 1$
- $F(x,y)$关于x和y都是右连续的
- $P{a_1 < X \leq b_1, a_2 < Y \leq b_2} = F(b_1,b_2) - F(a_1,b_2) - F(b_1,a_2) + F(a_1,a_2)$
二维离散型随机变量:设$(X,Y)$是二维随机变量,如果存在一列非负常数$p_{ij}(i,j=1,2,\cdots)$,使得 \(P\{X=x_i,Y=y_j\} = p_{ij} \qquad i,j=1,2,\cdots\)
则称$(X,Y)$为二维离散型随机变量,其中$p_{ij}$满足
\[\sum_{i=1}^{\infty} \sum_{j=1}^{\infty} p_{ij} = 1\]二维连续型随机变量:设$(X,Y)$是二维随机变量,如果存在非负常数$f(x,y)$,使得对于任意实数$x,y$,有
\[P\{(X,Y) \in D\} = \iint_D f(x,y)dxdy\](联合)分布律
二维离散型随机变量的分布律
\[\begin{align*} P\{X=x_i,Y=y_j\} &= p_{ij} \qquad i,j=1,2,\cdots\\ \end{align*}\]二维连续型随机变量的概率密度
\[\begin{align*} f(x,y) &\geq 0\\ \iint_{-\infty}^{+\infty} f(x,y)dxdy &= 1\\ \frac{\partial^2 F(x,y)}{\partial x \partial y} &= f(x,y) \quad 若f(x,y)在点(x,y)连续\\ P\{(X,Y) \in D\} &= \iint_D f(x,y)dxdy \end{align*}\]边缘分布律
二维离散型随机变量的边缘分布律
\[\begin{align*} P\{X=x_i\} &= \sum_{j=1}^{\infty} P\{X=x_i,Y=y_j\} = \sum_{j=1}^{\infty} p_{ij} \qquad i=1,2,\cdots\\ P\{Y=y_j\} &= \sum_{i=1}^{\infty} P\{X=x_i,Y=y_j\} = \sum_{i=1}^{\infty} p_{ij} \qquad j=1,2,\cdots \end{align*}\]二维连续型随机变量的边缘概率密度
\[\begin{align*} f_X(x) &= \int_{-\infty}^{+\infty} f(x,y)dy\\ f_Y(y) &= \int_{-\infty}^{+\infty} f(x,y)dx \end{align*}\]二维连续型随机变量的边缘分布律
\[\begin{align*} F_X(x) &= P\{X \leq x\} = P\{X \leq x, -\infty < Y < +\infty\} = \int_{-\infty}^{x} \int_{-\infty}^{+\infty} f(u,y)dydu = \int_{-\infty}^{x} f_X(u)du\\ F_Y(y) &= P\{Y \leq y\} = P\{Y \leq y, -\infty < X < +\infty\} = \int_{-\infty}^{y} \int_{-\infty}^{+\infty} f(x,v)dxdv = \int_{-\infty}^{y} f_Y(v)dv \end{align*}\]条件分布
条件分布
\[\begin{align*} F_{X|Y}(x|y) &= P\{X \leq x|Y=y\} = \frac{P\{X \leq x, Y=y\}}{P\{Y=y\}} = \frac{\int_{-\infty}^{x} f(u,y)du}{f_Y(y)}\\ f_{X|Y}(x|y) &= \frac{f(x,y)}{f_Y(y)}\\ F_{Y|X}(y|x) &= P\{Y \leq y|X=x\} = \frac{P\{X=x, Y \leq y\}}{P\{X=x\}} = \frac{\int_{-\infty}^{y} f(x,v)dv}{f_X(x)}\\ f_{Y|X}(y|x) &= \frac{f(x,y)}{f_X(x)} \end{align*}\]二维离散型随机变量的条件分布律
\[\begin{align*} P\{X=x_i|Y=y_j\} &= \frac{P\{X=x_i,Y=y_j\}}{P\{Y=y_j\}} = \frac{p_{ij}}{\sum_{k=1}^{\infty} p_{kj}} \qquad i=1,2,\cdots\\ P\{Y=y_j|X=x_i\} &= \frac{P\{X=x_i,Y=y_j\}}{P\{X=x_i\}} = \frac{p_{ij}}{\sum_{k=1}^{\infty} p_{ik}} \qquad j=1,2,\cdots \end{align*}\]二维均匀分布
定义 若$(X,Y)$的概率密度为 \(f(x,y)=\left\{ \begin{array}{ll} \dfrac{1}{S_D}, & (x,y)\in D \\ 0, & \text{其他} \end{array}\right.\) $S_D$为区域$D$的面积,则称$(X,Y)$在平面有界区域$D$上服从均匀分布。
二维均匀分布就是几何概型的二维情况。
二维正态分布
定义 若$(X,Y)$的概率密度为:
\[f(x,y)=\dfrac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\left\{-\dfrac{1}{2(1-\rho^2)}\left[\left(\dfrac{x-\mu_1}{\sigma_1}\right)^2-2\rho\left(\dfrac{x-\mu_1}{\sigma_1}\right)\left(\dfrac{y-\mu_2}{\sigma_2}\right)+\left(\dfrac{y-\mu_2}{\sigma_2}\right)^2\right]\right\}\]其中$\mu_1,\mu_2\in R$,$\sigma_1,\sigma_2>0$,$-1<\rho<1$,则称$(X,Y)$服从参数为$\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho$的二维正态分布,记为$(X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)$。此时:
- $X\sim N(\mu_1,\sigma_1^2)$,$Y\sim N(\mu_2,\sigma_2^2)$,$\rho$为$X$与$Y$的相关系数,即$\rho=\dfrac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}}=\dfrac{Cov(X,Y)}{\sigma_1\sigma_2}$。
- $X,Y$的条件分布都是正态分布。
- $aX\pm bY$($a\neq0$或$b\neq0$)服从正态分布$N(a\mu_1\pm b\mu_2,a^2\sigma_1^2+b^2\sigma_2^2)$。
- $XY$相互独立的充要条件是$XY$不相关,即$\rho=0$。
对于$(X,Y)\sim N(0,0;1,1;\rho)$ \(f(x,y)=\dfrac{1}{2\pi\sqrt{1-\rho^2}}\exp\left[-\dfrac{x^2-2\rho x y+y^2}{2(1-\rho^2)}\right]\)
随机变量独立性
概念
定义 设随机变量$X,Y$的联合分布函数为$F(x,y)$,边缘分布函数为$F_X(x)$,$F_Y(y)$,若对任意实数$x$,$y$,有$P{X\leqslant x,Y\leqslant y}=P{X\leqslant x}P{Y\leqslant y}$,即$F(x,y)=F_X(x)F_Y(y)$,则称随机变量$X$和$Y$相互独立。即对于离散型随机变量$P{X=x_i,Y=y_j}=P{X=x_i}P{Y=y_j}$。对于连续型随机变量$f(x,y)=f_X(x)f_Y(y)$。
充要条件
若$X,Y$独立,则
- 对于二维离散型随机变量,$p_{ij}=p_{i\cdot}\cdot p_{\cdot j}$。
- 对于二维连续型随机变量,$f(x,y)=f_X(x)\cdot f_Y(y)$。
- 对于二维随机变量,$F(x,y)=F_X(x)\cdot F_Y(y)$。(联合分布函数等于各自边缘函数乘积)
性质
若$X,Y$独立,则$f(X)$与$g(Y)$也相互独立。
若对所有$x_1,x_2,\cdots,x_n$有$F(x_1,x_2,\cdots,x_n)=F_{X_1}(x_1)F_{X_2}(x_2)\cdots F_{X_n}(x_n)$,则$X_1,X_2,\cdots,X_n$相互独立。
若$X_1,X_2,\cdots,X_n$相互独立,其中任意$k$个随机变量也相互独立。
若$X_1,X_2,\cdots,X_n$相互独立,则其各自的函数$g_1(X_1)g_2(X_2)\cdots g_n(X_n)$也相互独立。
独立同分布运算
若$XY$相互独立,则:
- 若$X\sim B(n,p)$,$Y\sim B(m,p)$,则$X+Y\sim B(n+m,p)$。
- 若$X\sim P(\lambda_1)$,$Y\sim P(\lambda_2)$,则$X+Y\sim P(\lambda_1+\lambda_2)$。
- 若$X\sim N(\mu_1,\sigma_1^2)$,$Y\sim N(\mu_2,\sigma_2^2)$,则$X+Y\sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)$,$X-Y\sim N(\mu_1-\mu_2,\sigma_1^2+\sigma_2^2)$。
二维随机变量函数的分布
设$(X,Y)$是二维随机变量,$Z=\varphi(X,Y)$是由$(X,Y)$所确定的随机变量,如果对于任意实数$z$,有
\[P\{Z \leq z\} = P\{\varphi(X,Y) \leq z\} = P\{(X,Y) \in D_z\} = \iint_{D_z} f(x,y)dxdy\]1. $Z = X+Y$
\[\begin{align*} F_Z(z) = P\{X+Y \leq z\} &= \iint_{x+y \leq z} f(x,y)dxdy\\ &= \int_{-\infty}^{+\infty} dy\int_{-\infty}^{z-y} f(x,y)dx\\ \end{align*}\]令$u=x+y,v=y$,则 $x=u-v,y=v$, \(D_z = \{(u,v) | u \geq v, v \leq z \}\)
\[\begin{align*} F_Z(z) &= \int_{-\infty}^{+\infty} \int_{-\infty}^{z} f(u-v,v)du dv\\ &= \int_{-\infty}^{z} du \int_{-\infty}^{+\infty} f(u-v,v)dv\\ &= \int_{-\infty}^{z} f_Z(u)du \end{align*}\]由对称性可得
\[\begin{align*} f_Z(z) &= \int_{-\infty}^{+\infty} f(z-y,y)dy\\ &= \int_{-\infty}^{+\infty} f(x,z-x)dx\\ \end{align*}\]几何含义:$f_Z(z)$是$f(x,y)$在直线 $x+y=z$ 上的积分(将$f(x,y)$ 的 $x+y=z$ 映射到 $f_Z(z)$ 的 $z$点 )
当$f(x,y) = f_X(x)f_Y(y)$时,$X,Y$相互独立,得到卷积公式
\[\begin{align*} f_Z(z) = f_X*f_Y&= \int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)dx\\ &= \int_{-\infty}^{+\infty} f_X(z-y)f_Y(y)dy\\ \end{align*}\]若 $X,Y$相互独立 且服从 $N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2)$,则 $Z=X+Y$ 服从 $N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)$
\[\begin{align*} f_Z(z) &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}} \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(z-x-\mu_2)^2}{2\sigma_2^2}}dx\\ & \cdots\\ &= \frac{1}{\sqrt{2\pi}\sqrt{\sigma_1^2+\sigma_2^2}}e^{-\frac{(z-\mu_1-\mu_2)^2}{2(\sigma_1^2+\sigma_2^2)}} \end{align*}\]2. $Z = \frac{X}{Y}$
\[\begin{align*} F_Z(z) = P\{\frac{X}{Y} \leq z\} = \iint_{\frac{x}{y} \leq z} f(x,y)dxdy\\ \end{align*}\]令$u=y \qquad v=\frac{x}{y}$,则 $x=uv,y=u$, \(D_z = \{(u,v) | u \geq 0, v \leq z\}\)
jacobian矩阵:新坐标系 $(u,v)$ 在原坐标系 $(x,y)$ 的微分元素面积为 $ | J | dudv$ ,其中 $ | J | $ 为jacobian矩阵的行列式 |
当$f(x,y) = f_X(x)f_Y(y)$时,$X,Y$相互独立
\[f_Z(z) = \int_{-\infty}^{+\infty} f_X(zu)f_Y(u)|u|du\]3. $Z = XY$
\[\begin{align*} F_Z(z) = P\{XY \leq z\} = \iint_{xy \leq z} f(x,y)dxdy \end{align*}\]令$u=y \qquad v=xy$,则 $x=\frac{v}{u},y=u$,
\[J = \begin{vmatrix} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v}\\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v}\\ \end{vmatrix} = \begin{vmatrix} -\frac{v}{u^2} & \frac{1}{u}\\ 1 & 0\\ \end{vmatrix} = -\frac{1}{u}\] \[\begin{align*} F_Z(z) &= \int_{-\infty}^{+\infty} \int_{-\infty}^{z} f(\frac{v}{u},u)|J|du dv \\ &= \int_{-\infty}^{z} \int_{0}^{+\infty} f(\frac{v}{u},u)|\frac{1}{u}|du dv\\ &= \int_{-\infty}^{z} f_Z(v)dv \end{align*}\] \[f_Z(z) = \int_{-\infty}^{+\infty} f(\frac{z}{u},u)|\frac{1}{u}|du\]4. $M = \max{X,Y}$
X,Y相互独立
\[\begin{align*} F_M(m) &= P\{\max\{X,Y\} \leq m\}\\ &= P\{X \leq m\}P\{Y \leq m\}\\ &= F_X(m)F_Y(m) \end{align*}\]5. $N = \min{X,Y}$
X,Y相互独立
\[\begin{align*} F_N(n) &= P\{\min\{X,Y\} \leq n\}\\ &= 1 - P\{\min\{X,Y\} > n\}\\ &= 1 - P\{X > n\}P\{Y > n\}\\ &= 1 - (1-F_X(n))(1-F_Y(n))\\ \end{align*}\]数字特征
期望
离散型随机变量的期望
\[E(X) = \sum_{i=1}^{n} x_i p_i\]连续型随机变量的期望
\[E(X) = \int_{-\infty}^{+\infty} xf(x)dx\]性质
\[E(Z) = E(g(X)) = \sum_{i=1}^{n} g(x_i)p_i \qquad E(Z) = E(g(X)) = \int_{-\infty}^{+\infty} g(x)f(x)dx\\\] \[E(aX+bY) = aE(X) + bE(Y)\\\]若X,Y相互独立,则
\[E(XY) = E(X)E(Y)\]方差
离散型随机变量的方差
\[D(X) = \sum_{i=1}^{n} (x_i - E(X))^2 p_i = E(X^2) - [E(X)]^2\]连续型随机变量的方差
\[D(X) = \int_{-\infty}^{+\infty} (x - E(X))^2 f(x)dx = E(X^2) - [E(X)]^2\]性质
\[D(aX+b) = a^2D(X)\] \[\begin{align*} D(aX \pm bY) &= a^2D(X) + b^2D(Y) \pm 2abCov(X,Y)\\ &= D(X) + D(Y) \qquad X,Y相互独立\\ \end{align*}\] \[D(X) < E[(X-c)^2] \qquad c \neq E(X)\] \[D(X) = 0 \Leftrightarrow X = c \qquad c为常数\]协方差
\[Cov(X,Y) = E[(X-E(X))(Y-E(Y))] = E(XY) - E(X)E(Y)\]性质
\[\begin{align*} Cov(X,Y) &= Cov(Y,X)\\ Cov(aX+bY,Z) &= aCov(X,Z) + bCov(Y,Z)\\ Cov(X,Y) &= 0 \Leftarrow X,Y相互独立\\ \end{align*}\]相关系数
\[\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}} = \frac{E(XY) - E(X)E(Y)}{\sqrt{D(X)D(Y)}}\]性质
\[\begin{align*} \rho_{XY} &= \rho_{YX}\\ |\rho_{XY}| &\leq 1\\ |\rho_{XY}| &= 1 \Leftrightarrow P\{Y=aX+b\} = 1\\ \rho_{XY} &= 0 \Leftrightarrow X,Y相互独立 \end{align*}\]常用分布性质表
|—| |:—:|
分布 | 分布律(概率密度) | 期望 | 方差 | 范围 |
---|---|---|---|---|
0-1分布 | $p{X=1} = p,p{X=0} = q$ | $p$ | $pq$ | $0<p<1,q=1-p$ |
二项分布$X\sim B(n,p)$ | $p{X=k} = C_n^kp^kq^{n-k}$ | $np$ | $npq$ | $0<p<1,q=1-p,n \in N^*$ |
泊松分布$X\sim P(\lambda)$ | $p{X=k} = \frac{\lambda^k}{k!}e^{-\lambda}$ | $\lambda$ | $\lambda$ | $\lambda\geq 0$ |
均匀分布$X\sim U(a,b)$ | $f(x) = \begin{cases}\frac{1}{b-a},&a<x<b\newline 0,&其他\end{cases}$ | $\frac{a+b}{2}$ | $\frac{(b-a)^2}{12}$ | $-\infty<a<b<+\infty$ |
指数分布$X\sim E(\lambda)$ | $f(x) = \begin{cases}\lambda e^{-\lambda x},&x>0\newline 0,&x\leq 0\end{cases}$ | $\frac{1}{\lambda}$ | $\frac{1}{\lambda^2}$ | $\lambda>0$ |
正态分布$X\sim N(\mu,\sigma^2)$ | $f(x) = \frac{1}{\sqrt{\pi}\sqrt{2}\sigma}\exp(-\frac{(x-\mu)^2}{2\sigma^2})$ | $\mu$ | $\sigma^2$ | $-\infty<x<+\infty$ |
二维正态分布
$(X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)$
对于$(X,Y)\sim N(0,0;1,1;\rho)$ \(f(x,y)=\dfrac{1}{2\pi\sqrt{1-\rho^2}}\exp\left[-\dfrac{x^2-2\rho x y+y^2}{2(1-\rho^2)}\right]\)
其它
几何分布:在伯努利试验中,得到一次成功所需要的试验次数X,X的值域是{ 1, 2, 3, … }
\[P\{X=k\} = (1-p)^{k-1}p \quad E(x) = \frac{1}{p} \quad D(x) = \frac{1-p}{p^2}\]有时几何分布也指代失败的次数
\[P\{X=k\} = (1-p)^{k}p \quad E(x) = \frac{1-p}{p} \quad D(x) = \frac{1-p}{p^2}\]大数定理
切比雪夫不等式
\[P\{|X-E(X)| \geq \varepsilon\} \leq \frac{D(X)}{\varepsilon^2}\] \[P\{|X-E(X)| < \varepsilon\} \geq 1 - \frac{D(X)}{\varepsilon^2}\]定义:收敛
设$Y_1,Y_2,\cdots,Y_n,\cdots$是随机变量序列,$a$是常数,如果对于任意的$\varepsilon > 0$,有
\[\lim_{n \to \infty} P\{|Y_n - a| < \varepsilon\} = 1\]则称随机变量序列$Y_1,Y_2,\cdots,Y_n,\cdots$依概率收敛于$a$,记作
\[Y_n \xrightarrow{P} a \qquad (n \to \infty)\]切比雪夫大数定理
条件
- $X_1,X_2,\cdots,X_n,\cdots$相互独立
- $\forall i \quad D(X_i) = \sigma^2 < l$ , $l$是常数
即
\[\overline{X} \xrightarrow{P} \overline{E(X)} \qquad (n \to \infty)\]推论 当
- $X_1,X_2,\cdots,X_n,\cdots$相互独立
- $\forall i \quad E(X_i) = \mu \quad D(X_i) = \sigma^2$
即
\[\overline{X} \xrightarrow{P} \mu \qquad (n \to \infty)\]辛钦大数定理
条件
- $X_1,X_2,\cdots,X_n,\cdots$相互独立
- $X_i$服从同一分布
- $E(X_i) = \mu$
即
\[\overline{X} \xrightarrow{P} \mu \qquad (n \to \infty)\]伯努利大数定理
$n_A$是$n$次重实验中时间A发生的次数,A发生的概率为$p$
\[\lim_{n \to \infty} P\{|\frac{n_A}{n} - p| < \varepsilon\} = 1\]即
\[\frac{n_A}{n} \xrightarrow{P} p \qquad (n \to \infty)\]中心极限定理
林德贝格-勒维/独立同分布中心极限定理
条件
- $X_1,X_2,\cdots,X_n,\cdots$相互独立
- $X_i$服从同一分布,$E(X_i) = \mu \quad D(X_i) = \sigma^2$
即当$n$充分大时
\[\begin{align*} \sum_{i=1}^{n}X_i \sim N(n\mu,n\sigma^2)\\ \frac{\sum_{i=1}^{n}X_i - n\mu}{\sigma\sqrt{n}} \sim N(0,1)\\ \end{align*}\]相关性质: $X_1+X_2 \sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)$ note: $aX \sim N(a\mu,a^2\sigma^2) \Leftarrow E(aX) = aE(X) \quad D(aX) = a^2D(X)$
李雅普诺夫/独立不同分布中心极限定理
条件
- $X_1,X_2,\cdots,X_n,\cdots$相互独立
- $E(x_i) = \mu_i \quad D(X_i) = \sigma_i^2 \neq 0$
存在正数$\delta$使得当$n \to \infty$时
\[\frac{1}{\sum_{i=1}^{n}\sigma_i^{2+\delta}}\sum_{i=1}^{n}E(|X_i - \mu_i|^{2+\delta}) \to 0\]则随机变量
\[Z_n = \frac{\sum_{i=1}^{n}X_i - \sum_{i=1}^{n}\mu_i}{\sqrt{D(\sum_{i=1}^{n}X_i)}} = \frac{\sum_{i=1}^{n}X_i - \sum_{i=1}^{n}\mu_i}{\sqrt{\sum_{i=1}^{n}\sigma_i^2}}\]的分布函数$F_n(x)$对于任意$x$满足
\[\lim_{n \to \infty} F_n(x) = \Phi(x)\]即当$n$充分大时
\[\begin{align*} \sum_{i=1}^{n}X_i &\sim N(\sum_{i=1}^{n}\mu_i,\sum_{i=1}^{n}\sigma_i^2)\\ Z_n &\sim N(0,1)\\ \end{align*}\]拉普拉斯/局部极限定理 、棣莫弗-拉普拉斯/积分极限定理
条件
- 随机变量$X \sim B(n,p)$
- $n$充分大
注:$E(X) = np\quad D(X) = npq \quad \sigma = \sqrt{npq}$ 拉普拉斯定理
\[P\{X=k\} \approx \frac{1}{\sqrt{2\pi npq}}e^{-\frac{(k-np)^2}{2npq}} = \frac{1}{\sqrt{npq}} \varphi(\frac{k-np}{\sqrt{npq}})\]棣莫弗-拉普拉斯
\[\lim_{n \to \infty} P\{a \leq \frac{X-np}{\sqrt{npq}} \leq b\} = \Phi(b) - \Phi(a)\]即
\[\begin{align*} X &\sim N(np,npq)\\ \frac{X-np}{\sqrt{npq}} &\sim N(0,1)\\ \end{align*}\]随机样本
设$X_1,X_2,\cdots,X_n$是来自同一总体的$n$个相互独立的随机变量,称$X_1,X_2,\cdots,X_n$为一个容量为$n$的简单随机样本,简称样本。
若$X$的分布函数为$F(x)$,则$X_1,X_2,\cdots,X_n$的联合分布函数为
\[F(x_1,x_2,\cdots,x_n) = \prod_{i=1}^{n}F(x_i)\]若$X$的概率密度为$f(x)$,则$X_1,X_2,\cdots,X_n$的联合概率密度为
\[f(x_1,x_2,\cdots,x_n) = \prod_{i=1}^{n}f(x_i)\]统计量
设$X_1,X_2,\cdots,X_n$是来自总体$X$的一个样本,$g(X_1,X_2,\cdots,X_n)$是样本的一个函数,不含未知参数,则称$g(X_1,X_2,\cdots,X_n)$为统计量。
统计量也是一个分布
统计量即是从“实例化”的样本中反推数字特征
重要统计量
1. 样本均值
\[\overline{X} = \frac{1}{n}\sum_{i=1}^{n}X_i\]2. 样本方差
\[S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \overline{X})^2 = \frac{1}{n-1}(\sum_{i=1}^{n}X_i^2 - n\overline{X}^2)\]note:
\[\begin{align*} E(\sum_{i=1}^{n}(X_i - \overline{X})^2) &= E(\sum_{i=1}^{n}(X_i^2 - 2X_i\overline{X} + \overline{X}^2))\\ &= E(\sum_{i=1}^{n}X_i^2 - 2\overline{X}\sum_{i=1}^{n}X_i + \sum_{i=1}^{n}\overline{X}^2)\\ &= E(\sum_{i=1}^{n}X_i^2 - 2n\overline{X}^2 + n\overline{X}^2)\\ &= E(\sum_{i=1}^{n}X_i^2 - n\overline{X}^2)\\ &= \sum_{i=1}^{n}E(X_i^2) - nE(\overline{X}^2)\\ &= \sum_{i=1}^{n}(D(X_i) + E(X_i)^2) - n(D(\overline{X}) + E(\overline{X})^2)\\ &= \sum_{i=1}^{n}(\sigma^2 + \mu^2) - n(\frac{\sigma^2}{n} + \mu^2)\\ &= n\sigma^2 + n\mu^2 - \sigma^2 - n\mu^2\\ &= (n-1)\sigma^2 \end{align*}\]其中
\[D(\overline{X}) = D(\frac{1}{n}\sum_{i=1}^{n}X_i) = \frac{1}{n^2}D(\sum_{i=1}^{n}X_i) = \frac{1}{n^2}\sum_{i=1}^{n}D(X_i) = \frac{\sigma^2}{n}\]note: $E(X) = E(X_i) = \mu \quad D(X) = D(X_i) = \sigma^2$ 注意:$\sigma^2 \neq S^2$ 但 $E(S^2) = \sigma^2$
3. 样本$k$阶原点矩
\[A_k = \frac{1}{n}\sum_{i=1}^{n}X_i^k\]4. 样本$k$阶中心矩
\[B_k = \frac{1}{n}\sum_{i=1}^{n}(X_i - \overline{X})^k\]抽样分布
设$X_1,X_2,\cdots,X_n$是来自总体$X$的一个样本,$g(X_1,X_2,\cdots,X_n)$是样本的一个函数,不含未知参数,则$g(X_1,X_2,\cdots,X_n)$的分布称为抽样分布。
重要抽样分布
1. $\chi^2$ 分布
设$X_1,X_2,\cdots,X_n$是来自$N(0,1)$的样本,则称随机变量
\[\chi^2 = X_1^2 + X_2^2 + \cdots + X_n^2\]服从自由度为$n$的$\chi^2$分布,记为$\chi^2 \sim \chi^2(n)$
性质
$\chi^2_1 \sim \chi^2(n_1) \quad \chi^2_2 \sim \chi^2(n_2)$,且$\chi^2_1$与$\chi^2_2$相互独立,则$\chi^2_1 + \chi^2_2 \sim \chi^2(n_1 + n_2)$
$\chi^2 \sim \chi^2(n)$,则$E(\chi^2) = n$,$D(\chi^2) = 2n$
上分位数 $\chi_\alpha^2(n)$
\[P\{\chi^2 \geq \chi_\alpha^2(n)\} = \alpha\]一般当 $n$ 充分大时($n>45$),$\chi^2$分布近似得有
\[\chi_\alpha^2(n) \approx \frac{1}{2} (z_\alpha + \sqrt{2n-1})^2\]$z_\alpha$为标准正态分布的上$\alpha$分位数
\[z_\alpha = \Phi^{-1}(1-\alpha)\]2. $t$ 分布
设$X \sim N(0,1)$,$Y \sim \chi^2(n)$,且$X$与$Y$相互独立,则称随机变量
\[t = \frac{X}{\sqrt{Y/n}}\]服从自由度为$n$的$t$分布,记为$t \sim t(n)$
上分位数 $t_\alpha(n)$
\[P\{t \geq t_\alpha(n)\} = \alpha\]$t_\alpha(n)$具有对称性,即
\[t_\alpha(n) = -t_{1-\alpha}(n)\]当 $n$ 充分大时($n>45$),$t$分布近似得有
\[t_\alpha(n) \approx z_\alpha\]3. $F$ 分布
设$X \sim \chi^2(n_1)$,$Y \sim \chi^2(n_2)$,且$X$与$Y$相互独立,则称随机变量
\[F = \frac{X/n_1}{Y/n_2}\]服从自由度为$(n_1,n_2)$的$F$分布,记为$F \sim F(n_1,n_2)$
\[F_\alpha(n_1,n_2) = \frac{1}{F_{1-\alpha}(n_2,n_1)}\]重要性质
设 $X_1,X_2,\cdots,X_n$ 是总体 $N(\mu,\sigma^2)$ 的一个样本,$\overline{X}$和$S^2$分别是样本均值和样本方差,则有
\[\overline{X} \sim N(\mu,\frac{\sigma^2}{n})\] \[\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\] \[\overline{X}与S^2相互独立\] \[\frac{\overline{X} - \mu}{S/\sqrt{n}} \sim t(n-1)\]设 $X_1,X_2,\cdots,X_n$ 和 $Y_1,Y_2,\cdots,Y_m$ 分别是来自正态总体 $N(\mu_1,\sigma_1^2)$ 和 $N(\mu_2,\sigma_2^2)$ 的两个独立的样本,则有
\[\frac{\overline{X} - \overline{Y} - (\mu_1 - \mu_2)}{S_\omega \sqrt{\frac{1}{n} + \frac{1}{m}}} \sim t(n+m-2)\] \[S_\omega^2 = \frac{(n-1)S_X^2 + (m-1)S_Y^2}{n+m-2}\]参数估计
矩估计
矩:$k$阶原点矩$E(X^k)$,$k$阶中心矩$E((X-\mu)^k)$
- $E(X) = \mu$
- $E(X^2) = \mu^2 + \sigma^2$
- $E(X^3) = \mu^3 + 3\mu\sigma^2$
- $E(X^4) = \mu^4 + 6\mu^2\sigma^2 + 3\sigma^4$
最大似然估计(Maximum Likelihood Estimation)
Likelihood Function
Likelihood Function是一个关于参数$\theta$的函数,表示在给定参数$\theta$的条件下,样本观测值出现的概率,记为$L(\theta)$
Maximum Likelihood Estimation
Maximum Likelihood Estimation是指在所有可能的参数值中,使得观测值出现的概率最大的那个参数值,记为$\hat{\theta}$
随机变量,$X$在参数 $\theta$ 的概率分布为 $P{X=x_i} = f(x_i;\theta) \quad i=1,2,\cdots,n$ ,则样本$X_1,X_2,\cdots,X_n$的联合概率分布为
\[P\{X_1=x_{i1},X_2=x_{i2},\cdots,X_n=x_{in}\} = \prod_{i=1}^{n}f(x_{i};\theta)\]其中$n_i$表示样本中$X$取值为$x_i$的个数,$n = \sum_{i=1}^{n}n_i$ ,则样本的 Likelihood Function 为
\[L(p_1,p_2,\cdots,p_n) = \prod_{i=1}^{n}f(x_{i};\theta)\]找到使得 Likelihood Function 最大的参数值,即为 Maximum Likelihood Estimation
\[\hat{\theta} = \arg \max_{\theta} L(\theta)\]因为 Likelihood Function 是连乘,求导不方便,通常对 Likelihood Function 函数取对数
\[\ln L(\theta) = \sum_{i=1}^{n}\ln f(x_i;\theta)\] \[\hat{\theta} = \arg \max_{\theta} \ln L(\theta)\]求 Likelihood Function 的最大值,即求对 Likelihood Function 的导数为0的点
\[\frac{\partial \ln L(\theta)}{\partial \theta} = 0\]对于k个参数,有k个方程,解方程组得到参数的最大似然估计值
\[\begin{cases} \frac{\partial \ln L(\theta)}{\partial \theta_1} = 0\\ \frac{\partial \ln L(\theta)}{\partial \theta_2} = 0\\ \cdots\\ \frac{\partial \ln L(\theta)}{\partial \theta_k} = 0 \end{cases}\]估计的评价标准
无偏性
无偏性:估计量的数学期望等于被估计参数的真实值
\[E(\hat{\theta}) = \theta\]无偏估计 $\hat{\theta}$ 的数学期望为 $\theta$
有效性
有效性:估计量的方差小于等于其他估计量的方差
\[D(\hat{\theta}) \leq D(\tilde{\theta})\]称$\hat{\theta}$比$\tilde{\theta}$有效
一致性
一致性:当样本容量$n$趋于无穷大时,估计量的值趋于被估计参数的真实值
\[\lim_{n \to \infty} \hat{\theta} = \theta\]或
\[\lim_{n \to \infty} P\{|\hat{\theta} - \theta| < \epsilon\} = 1\]区间估计
置信区间
置信区间:在一定置信水平下,估计参数的区间
设总体$X$的分布为$f(x;\theta)$,$\theta$为待估参数,$X_1,X_2,\cdots,X_n$为来自$X$的样本,$\hat{\theta}$为$\theta$的估计量,$\theta$的置信水平为$1-\alpha$,则称随机区间 $(\hat{\theta}_1,\hat{\theta}_2)$ 为$\theta$的置信水平为$1-\alpha$的置信区间,如果对于任意$\theta$,有
\[P\{\hat{\theta}_1 < \theta < \hat{\theta}_2\} = 1-\alpha\]其中$\hat{\theta}_1,\hat{\theta}_2$为$\theta$的函数,称为置信下限和置信上限
$\alpha$为显著性水平
枢轴变量
枢轴变量:枢轴变量是样本均值$\overline{X}$和样本方差$S^2$的函数,记为$Q(\overline{X},S^2)$,枢轴变量的分布不依赖于待估参数,即枢轴变量的分布不依赖于$\theta$,则称$Q(\overline{X},S^2)$为$\theta$的枢轴量
枢轴量法
枢轴量法:设总体$X$的分布为$f(x;\theta)$,$\theta$为待估参数,$X_1,X_2,\cdots,X_n$为来自$X$的样本,$\hat{\theta}$为$\theta$的估计量,$\theta$的置信水平为$1-\alpha$,$Q(\overline{X},S^2)$为$\theta$的枢轴量,$Q(\overline{X},S^2)$的分布不依赖于$\theta$,则有
\[P\{a < Q(\overline{X},S^2) < b\} = 1-\alpha\]其中$a,b$为常数,由此得到$\theta$的置信水平为$1-\alpha$的置信区间为 $(\hat{\theta}_1,\hat{\theta}_2)$
正态总体的区间估计
设总体$X$的分布为$N(\mu,\sigma^2)$,$\mu$为待估参数,$X_1,X_2,\cdots,X_n$为来自$X$的样本,$\overline{X}$为$\mu$的估计量,$S^2$为$\sigma^2$的估计量,$\mu$的置信水平为$1-\alpha$
1. 对$\mu$的估计
若$\sigma^2$已知
$\sum_{i=1}^{n}X_i \sim N(n\mu,n\sigma^2)$ ,得到$\overline{X} \sim N(\mu,\frac{\sigma^2}{n})$
\[\frac{\overline{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)\]相关性质:$X_1+X_2 \sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2) \qquad kX \sim N(k\mu,k\sigma^2)$
对于给定的$\alpha$,有
\[P\{-z_{\alpha/2} < \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} < z_{\alpha/2}\} = 1-\alpha\\ P\{\overline{X} - \frac{\sigma}{\sqrt{n}}z_{\alpha/2} < \mu < \overline{X} + \frac{\sigma}{\sqrt{n}}z_{\alpha/2}\} = 1-\alpha\]则有置信区间为
\[(\overline{X} - \frac{\sigma}{\sqrt{n}}z_{\alpha/2},\overline{X} + \frac{\sigma}{\sqrt{n}}z_{\alpha/2})\]$z_{\alpha}$是标准正态分布的上侧$\alpha$分位数,$\frac{\sigma}{\sqrt{n}}$系数将标准正态分布的标准差$1$转化为$\overline{X}$的标准差$\frac{\sigma^2}{n}$
若$\sigma^2$未知
考虑$S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \overline{X})^2$是$\sigma^2$的无偏估计量,则有
\[\begin{align*} \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} &\sim N(0,1) \\ \frac{(n-1)S^2}{\sigma^2} &\sim \chi^2(n-1) \\ \frac{\overline{X} - \mu}{S/\sqrt{n}}= \frac{\overline{X} - \mu}{\sqrt{\sigma^2/n}} \cdot \frac{1}{\sqrt{\frac{(n-1)S^2}{\sigma^2}/(n-1)}} &\sim t(n-1) \end{align*}\]其中的$\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$会在下文中解释
\[\frac{\overline{X} - \mu}{S/\sqrt{n}} \sim t(n-1)\]对于给定的$\alpha$,有
\[P\{-t_{\alpha/2}(n-1) < \frac{\overline{X} - \mu}{S/\sqrt{n}} < t_{\alpha/2}(n-1)\} = 1-\alpha\\ P\{\overline{X} - \frac{S}{\sqrt{n}}t_{\alpha/2}(n-1) < \mu < \overline{X} + \frac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\} = 1-\alpha\]则有置信区间为
\[(\overline{X} - \frac{S}{\sqrt{n}}t_{\alpha/2}(n-1),\overline{X} + \frac{S}{\sqrt{n}}t_{\alpha/2}(n-1))\]又因为 $\frac{S}{\sqrt{n}} = \frac{S_0}{\sqrt{n-1}}$ 其中$S_0 = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(X_i - \overline{X})^2}$,置信区间可以写做
\[(\overline{X} - \frac{S_0}{\sqrt{n-1}}t_{\alpha/2}(n-1),\overline{X} + \frac{S_0}{\sqrt{n-1}}t_{\alpha/2}(n-1))\]2. 对$\sigma^2$的估计
只考虑$\mu$未知的情况
考虑$S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \overline{X})^2$是$\sigma^2$的无偏估计量,则有
\[\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\]这里解释一下为什么是$\chi^2(n-1)$分布
\[\begin{align*} \frac{(n-1)S^2}{\sigma^2} &= \frac{\sum_{i=1}^{n}(X_i - \overline{X})^2}{\sigma^2} \\ &= \sum_{i=1}^{n}(\frac{(X_i - \mu) - (\overline{X}-\mu)}{\sigma})^2 \\ X_i - \mu &\sim N(0,\sigma^2) \\ \overline{X}-\mu &\sim N(0,\frac{\sigma^2}{n}) \\ (X_i - \mu) - (\overline{X}-\mu) &\sim N(0,\frac{n-1}{n}\sigma^2) \\ \frac{X_i - \overline{X}}{\sigma\sqrt{\frac{n-1}{n}}} &\sim N(0,1) \\ (\frac{X_i - \overline{X}}{\sigma\sqrt{\frac{n-1}{n}}})^2 &\sim \chi^2(1) \\ \frac{n}{n-1}\frac{(X_i - \overline{X})^2}{\sigma^2} &\sim \chi^2(1) \\ \frac{n}{n-1} \sum_{i=1}^{n}\frac{(X_i - \overline{X})^2}{\sigma^2} &\sim \chi^2(n) \\ \sum_{i=1}^{n}\frac{(X_i - \overline{X})^2}{\sigma^2} &\sim \frac{n-1}{n}\chi^2(n) = \chi^2(n-1) \\ \end{align*}\]对于给定的$\alpha$,有
\[P\{\chi^2_{1-\alpha/2}(n-1) < \frac{(n-1)S^2}{\sigma^2} < \chi^2_{\alpha/2}(n-1)\} = 1-\alpha\\ P\{\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)} < \sigma^2 < \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}\} = 1-\alpha\]注:$\alpha/2$ 指将概率(面积)分为两部分,$\alpha/2$在左边,$\alpha/2$ 在右边,$1-\alpha/2$指除去左侧$\alpha/2$的部分,剩下的右侧部分
则有置信区间为
\[(\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)})\]或
\[(\frac{nS_0^2}{\chi^2_{\alpha/2}(n-1)},\frac{nS_0^2}{\chi^2_{1-\alpha/2}(n-1)})\]其中$S_0 = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(X_i - \overline{X})^2}$
当$n$足够大时,根据中心极限定理,有 $ \frac{\overline{X}-\mu}{\alpha/\sqrt{n}} \sim N(0,1)$,则有置信区间为
\[(\overline{X} - \frac{S_0}{\sqrt{n}}z_{\alpha/2},\overline{X} + \frac{S_0}{\sqrt{n}}z_{\alpha/2})\]总结
待估参数 | 其它参数 | 统计量 | 置信区间 |
---|---|---|---|
$\mu$ | $\sigma^2$已知 | $T = \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)$ | \(\left(\overline{X} - \frac{\sigma}{\sqrt{n}}z_{\alpha/2},\overline{X} + \frac{\sigma}{\sqrt{n}}z_{\alpha/2}\right)\) |
$\mu$ | $\sigma^2$未知 | $T = \frac{\overline{X} - \mu}{S/\sqrt{n}} \sim t(n-1)$ | \(\left(\overline{X} - \frac{S}{\sqrt{n}}t_{\alpha/2}(n-1),\overline{X} + \frac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\right)\) |
$\sigma^2$ | $\mu$未知 | $T = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ | \(\left(\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}\right)\) |
假设检验
统计假设
关于总体 $X$ 的分布的假设称为统计假设,记为 $H$
- 对于总体 $X$ 的分布的假设,称为原假设,记为 $H_0$
- 对于总体 $X$ 的分布的假设,称为备择假设,记为 $H_1$
- 原假设和备择假设是互斥的,即 $H_0$ 和 $H_1$ 不可能同时成立
统计假设的形式
- $H_0: \theta = \theta_0$,$H_1: \theta \neq \theta_0$
- $H_0: \theta \leq \theta_0$,$H_1: \theta > \theta_0$
- $H_0: \theta \geq \theta_0$,$H_1: \theta < \theta_0$
显著性水平、拒绝域、临界值
- 检验的显著水平是指在原假设为真时,拒绝原假设的概率,记为 $\alpha$
- 检验的显著水平越小,说明检验的标准越高,检验的结论越可靠
- 通常取 $\alpha = 0.05$ 或 $\alpha = 0.01$
在假设 $H_0$ 成立的条件下,构造统计量 $U$ ,给定显著性水平 $\alpha$,使得拒绝域 $W = { | U | > \lambda_\alpha }$ 的概率为 $\alpha$,则称 $\lambda_\alpha$ 为显著性水平为 $\alpha$ 的临界值,即 |
检验方法的两类错误
第一类错误:原假设为真,但是被拒绝
\[P\{拒绝H_0|H_0\text{为真}\} = \alpha\]第二类错误:原假设为假,但是被接受
\[P\{接受H_0|H_0\text{为假}\} = \beta\]
当个正态总体的假设检验
双边检测:$H_0: \mu = \mu_0$,$H_1: \mu \neq \mu_0$
单边检测:$H_0: \mu \leq \mu_0$,$H_1: \mu > \mu_0$
检验参数 | 条件 | $H_0$ | $H_1$ | $H_0$的拒绝域 | 统计量 | 自由度 | 分位点 |
---|---|---|---|---|---|---|---|
$\mu$ | $\sigma^2$已知 | \(\begin{array}{} \mu = \mu_0\\\mu \leq \mu_0\\\mu \geq \mu_0\end{array}\) | \(\begin{array}{} \mu \neq \mu_0\\\mu > \mu_0\\\mu < \mu_0\end{array}\) | \(\begin{array}{}|Z| >z_{\alpha/2}\\Z > z_{\alpha}\\Z < -z_{\alpha}\end{array}\) | \(Z = \frac{\overline{X} - \mu_0}{\sigma/\sqrt{n}} \sim N(0,1)\) | $\infty$ | \(\begin{array}{}\pm z_{\alpha/2}\\ z_{\alpha/2}\\ -z_{\alpha/2}\end{array}\) |
$\mu$ | $\sigma^2$未知 | \(\begin{array}{} \mu = \mu_0\\\mu \leq \mu_0\\\mu \geq \mu_0\end{array}\) | \(\begin{array}{} \mu \neq \mu_0\\\mu > \mu_0\\\mu < \mu_0\end{array}\) | \(\begin{array}{}|T| >t_{\alpha/2}\\T > t_{\alpha}\\T < -t_{\alpha}\end{array}\) | \(T = \frac{\overline{X} - \mu_0}{S/\sqrt{n}} \sim t(n-1)\) | $n-1$ | \(\begin{array}{}\pm t_{\alpha/2}\\ t_{\alpha/2}\\ -t_{\alpha/2}\end{array}\) |
$\sigma^2$ | $\mu$未知 | \(\begin{array}{} \sigma^2 = \sigma_0^2\\\sigma^2 \leq \sigma_0^2\\\sigma^2 \geq \sigma_0^2\end{array}\) | \(\begin{array}{} \sigma^2 \neq \sigma_0^2\\\sigma^2 > \sigma_0^2\\\sigma^2 < \sigma_0^2\end{array}\) | \(\begin{array}{}\chi^2 > \chi^2_{\alpha/2} \text{ and } \chi^2 < \chi^2_{1-\alpha/2} \\\chi^2 >\chi^2_{\alpha} \\\chi^2 < \chi^2_{1-\alpha}\end{array}\) | \(\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)\) | $n-1$ | \(\begin{array}{}\chi^2_{\alpha/2},\chi^2_{1-\alpha/2}\\\chi^2_{\alpha}\\\chi^2_{1-\alpha}\end{array}\) |
$\sigma^2$ | $\mu$已知 | \(\begin{array}{} \sigma^2 = \sigma_0^2\\\sigma^2 \leq \sigma_0^2\\\sigma^2 \geq \sigma_0^2\end{array}\) | \(\begin{array}{} \sigma^2 \neq \sigma_0^2\\\sigma^2 > \sigma_0^2\\\sigma^2 < \sigma_0^2\end{array}\) | \(\begin{array}{}\chi^2 > \chi^2_{\alpha/2} \text{ and } \chi^2 < \chi^2_{1-\alpha/2} \\\chi^2 >\chi^2_{\alpha} \\\chi^2 < \chi^2_{1-\alpha}\end{array}\) | \(\chi^2 = \frac{\sum_{i=1}^n(X_i - \mu)^2}{\sigma_0^2} \sim \chi^2(n)\) | $n$ | \(\begin{array}{}\chi^2_{\alpha/2},\chi^2_{1-\alpha/2}\\\chi^2_{\alpha}\\\chi^2_{1-\alpha}\end{array}\) |
求解情景
存在样本 $X_i$ 的总体 $X_i \sim \mathcal{N}(\mu,\sigma^2)$
区间估计
给定分布参数($\mu ,\sigma$)的置信水平 $1-\alpha$ 或者显著性水平 $\alpha$,求解参数的置信区间
- 将现有统计量转化为标准分布求解置信区间
假设检验
给定显著性水平 $\alpha$ 和关于参数($\mu ,\sigma$)的假设 $H_0, H_1$,对假设进行检验
- 将现有统计量转化为标准分布求解拒绝域
- 判断参数是否在拒绝域内来判断是否需要拒绝
统计量转换
检验参数 | 条件 | 统计量 | 自由度 | 分位点 |
---|---|---|---|---|
$\mu_0$ | $\sigma^2$已知 | \(U = \frac{\overline{X} - \mu_0}{\sigma/\sqrt{n}} \sim N(0,1)\) | $\infty$ | \(\pm z_{\alpha/2}\) |
$\mu_0$ | $\sigma^2$未知 | \(T = \frac{\overline{X} - \mu_0}{S/\sqrt{n}} \sim t(n-1)\) | $n-1$ | \(\pm t_{\alpha/2}\) |
$\sigma_0^2$ | $\mu$未知 | \(\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)\) | $n-1$ | \(\chi^2_{\alpha/2},\chi^2_{1-\alpha/2}\) |
$\sigma_0^2$ | $\mu$已知 | \(\chi^2 = \frac{\sum_{i=1}^n(X_i - \mu)^2}{\sigma_0^2} \sim \chi^2(n)\) | $n$ | \(\chi^2_{\alpha/2},\chi^2_{1-\alpha/2}\) |