[数理统计] - 假设检验

在总体的分布函数完全未知或只知其形式,但不知道参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设。最常见的比如,有一组数据,这数据是某机器生产出来的产品的数据,假设机器的误差范围在0.1,那么通过假设检验可以判断机器是否在正常工作。

我们要根据样本对正态总体所提出假设做出是接受,还是拒绝的决策。

检验问题

对于假设检验问题,一般会有2个相反的假设

H0:μ=μ0原假设H1:μμ0备择假设\begin{aligned} H_0&: \mu = \mu_0 & \text{原假设} \\ H_1&: \mu \neq \mu_0 & \text{备择假设} \end{aligned}

  • 检验的是总体均值μ\mu,利用样本均值X\overline{X}统计量进行判断
  • X\overline{X}μ\mu的无偏估计,X\overline{X}的观察值x\overline{x}的大小在一定程度上反映μ\mu的大小。

如果假设H0H_0为真,则观察值x\overline{x}μ0\mu_0的偏差不应该太大,如果xu0|\overline{x} - u_0|过大,就怀疑假设H0H_0的正确性而拒绝H0H_0,如果H0H_0为真时,则Xμ0σ/nN(0,1)\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0, 1),衡量xu0|\overline{x} - u_0|的大小可以转为衡量Xμ0σ/n\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}

  • 选定一正数kk
    • 观察值x\overline{x}满足Xμ0σ/nk\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \geq k:拒绝假设H0H_0
    • 观察值x\overline{x}满足Xμ0σ/n<k\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} < k:接受假设H0H_0

但是这样可能在H0H_0为真时拒绝H0H_0(一定概率弃真),也就是在H0H_0为真的时候,在拒绝域之内。即

P(假设为真时拒绝)=P(Xμ0σ/nk)=aP(\text{假设为真时拒绝}) = P(|\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}| \geq k) = a

H0H_0为真的时候Z=Xμ0σ/nN(0,1)Z = \frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0, 1),这样,只允许犯错的概率最大为aa,也就是上图的阴影部分,从而可以决定kk,即

k=za/2k = z_{a/2}

因此,ZZ的观察值满足

  • z=xμ0σ/nk=za/2|z| = |\frac{\overline{x} - \mu_0}{\sigma/\sqrt{n}}| \geq k = z_{a/2}:拒绝H0H_0
  • z=xμ0σ/n<k=za/2|z| = |\frac{\overline{x} - \mu_0}{\sigma/\sqrt{n}}| < k = z_{a/2}:接受H0H_0

通俗的讲就是xμ0\overline{x} - \mu_0太大了,而且几乎只有aa的可能性这么大,于是选择拒绝
但是如果没有那么大,我们也就没有什么证据去拒绝,就只能接受了

这里z=xμ0σ/n|z| = |\frac{\overline{x} - \mu_0}{\sigma/\sqrt{n}}|计算的值是坐标,然后通过a/2a/2去查表,查到za/2z_{a/2}的值,然后对比大小

除了上面的弃真错误,我们还可能在假设为假的时候接受,也就是当满足H1H_1的时候,在拒绝域之外。即

P(假设为假时接受)=βP(\text{假设为假时接受}) = \beta

为了尽可能的减少犯错,但是在样本容量固定的时候

  • 减少一类错误的概率,往往会增大另外一类的错误的概率
  • 要使犯两类错误的概率都减少,需要增加样本容量(毕竟可以用作判断的数据更多了)

检验分类:

  • 显著性检验:控制第II类错误的概率,不考虑犯第二类错误的概率
    • 双边备择假设双边假设检验
  • 右边检验:关心总体均值是否增大

H0:μμ0H0:μ>μ0\begin{aligned} H_0&: \mu \leq \mu_0 \\ H_0&: \mu > \mu_0 \end{aligned}

  • 左边检验:关心总体均值是否减少

H0:μμ0H0:μ<μ0\begin{aligned} H_0&: \mu \geq \mu_0 \\ H_0&: \mu < \mu_0 \end{aligned}


原假设H0H_0
备择假设H1H_1
拒绝域:拒绝H0H_0时,统计量所在的区域
临界点:拒绝域的边界点za/2z_{a/2}

犯错概率

接受H0H_0 拒绝H0H_0
H0H_0为真 1a1-a 一类错误aa
H0H_0为假 二类错误β\beta 1β1-\beta

假设以下假设检验问题的拒绝域是xc\overline{x} \geq c,样本数量是nn

H0:μ=μ0H1:μ=μ1\begin{aligned} H_0&: \mu = \mu_0 \\ H_1&: \mu = \mu_1 \end{aligned}

a=P(xcH0)=P(xμ0σ/ncμ0σ/n)β=P(x<cH1)=P(xμ1σ/n<cμ1σ/n)\begin{aligned} a &= P(\overline{x} \geq c|H_0) = P(\frac{\overline{x} - \mu_0}{\sigma/\sqrt{n}} \geq \frac{c - \mu_0}{\sigma/\sqrt{n}}) \\ \beta &= P(\overline{x} < c|H_1) = P(\frac{\overline{x} - \mu_1}{\sigma/\sqrt{n}} < \frac{c - \mu_1}{\sigma/\sqrt{n}}) \end{aligned}

a=P(x拒绝域H0)β=P(x拒绝域H1)\begin{aligned} a &= P(x \in \text{拒绝域} |H_0) \\ \beta &= P(x \notin \text{拒绝域} |H_1) \end{aligned}


如果要增加样本数量nn,使犯错的概率低于一定数值cc,则

a=1Φ(μ0σ/n)cβ=1Φ(μ1σ/n)c\begin{aligned} a = 1 - \Phi(\frac{\mu_0}{\sigma/\sqrt{n}}) \leq c \\ \beta = 1 - \Phi(\frac{\mu_1}{\sigma/\sqrt{n}}) \leq c \end{aligned}

假设的建立

  • u=u0u = u_0
  • u>u0u > u_0
  • u<u0u < u_0

对于上面3种情况

  • 是对是不是u0u_0进行检定(两边各2.5%)
  • 是对是不是比u0u_0多进行检定,对于少于u0u_0的情况不考虑(右边5%)
  • 是对是不是比u0u_0少进行检定,对于多于u0u_0的情况不考虑(左边5%)

  • 简单假设
    • H0:u=u0H1:u=u1H_0: u = u_0 \leftrightarrow H_1: u = u_1
  • 双侧假设:对立假设是双侧的
    • H0:u=u0H1:uu1H_0: u = u_0 \leftrightarrow H_1: u \neq u_1
  • 单侧假设:对立假设是单侧的
    • H0:u=u0H1:u>u0H_0: u = u_0 \leftrightarrow H_1: u > u_0
    • H0:u=u0H1:u<u0H_0: u = u_0 \leftrightarrow H_1: u < u_0
    • H0:uu0H1:u>u0H_0: u \leq u_0 \leftrightarrow H_1: u > u_0
    • H0:uu0H1:u<u0H_0: u \geq u_0 \leftrightarrow H_1: u < u_0

也就是是否是单双侧和H0H_0无关,只和H1H_1有关

正态总体均值的假设检验

单个正态总体均值差的检验

Z检验法

条件:σ2\sigma^2已知,关于μ\mu的检验

  • 假设

H0:μ=μ0原假设H1:μμ0备择假设\begin{aligned} H_0&: \mu = \mu_0 & \text{原假设} \\ H_1&: \mu \neq \mu_0 & \text{备择假设} \end{aligned}

  • 采用分布

Xμ0σ/nN(0,1)\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \sim{} N(0,1)

  • 统计量

Z=Xμ0σ/nZ = \frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}

  • 犯错概率

P(假设为真时拒绝)aP(假设为真时拒绝)=P(Xμ0σ/nk)=a\begin{aligned} P(\text{假设为真时拒绝}) &\leq a \\ P(\text{假设为真时拒绝}) &= P(|\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}| \geq k) = a \end{aligned}

  • 零界点

k=za/2k = z_{a/2}

  • 拒绝域

z=xμ0σ/nk=za/2|z| = |\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}| \ge k = z_{a/2}

  • 接受域

z=xμ0σ/n<k=za/2|z| = |\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}| < k = z_{a/2}

Z右边检验法

条件:σ2\sigma^2已知,关于μ\mu的检验

  • 假设

H0:μμ0H0:μ>μ0\begin{aligned} H_0&: \mu \leq \mu_0 \\ H_0&: \mu > \mu_0 \end{aligned}

  • 采用分布

Xμ0σ/nN(0,1)\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \sim{} N(0,1)

  • 统计量

Z=Xμ0σ/nZ = \frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}

  • 犯错概率

P(假设为真时拒绝)aP(假设为真时拒绝)=P(Xk)P(假设为真时拒绝)=P(Xμ0σ/nkμ0σ/n)P(Xμσ/nkμ0σ/n)\begin{aligned} P(\text{假设为真时拒绝}) &\leq a \\ P(\text{假设为真时拒绝}) &= P(\overline{X} \geq k) \\ P(\text{假设为真时拒绝}) &= P(\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \geq \frac{k - \mu_0}{\sigma/\sqrt{n}}) \\ &\leq P(\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} \geq \frac{k - \mu_0}{\sigma/\sqrt{n}}) \end{aligned}

P(Xμσ/nkμ0σ/n)=aP(\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} \geq \frac{k - \mu_0}{\sigma/\sqrt{n}}) = a

  • 零界点

k=μ0+σnzak = \mu_0 + \frac{\sigma}{\sqrt{n}}z_a

  • 拒绝域

xk=μ0+σnzaz=xμ0σ/nza\begin{aligned} \overline{x} &\geq k = \mu_0 + \frac{\sigma}{\sqrt{n}}z_a \\ &\Downarrow \\ z &= \frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}} \geq z_a \end{aligned}

Z左边检验法

条件:σ2\sigma^2已知,关于μ\mu的检验

  • 拒绝域

xk=μ0σnzaz=xμ0σ/nza\begin{aligned} \overline{x} &\leq k = \mu_0 - \frac{\sigma}{\sqrt{n}}z_a \\ &\Downarrow \\ z &= \frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}} \leq -z_a \end{aligned}

t检验法

条件:σ2\sigma^2未知,关于μ\mu的检验

  • 假设

H0:μ=μ0H1:μμ0\begin{aligned} H_0:& \mu = \mu_0 \\ H_1:& \mu \neq \mu_0 \end{aligned}

  • 统计量

t=Xμ0S/nt = \frac{\overline{X}-\mu_0}{S/\sqrt{n}}

  • 采用分布

Xμ0σ/nXμ0S/nt(n1)σS=i=1n(xix)2n1\begin{aligned} \frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} &\rightarrow \frac{\overline{X}-\mu_0}{S/\sqrt{n}} \sim t(n - 1) \\ \sigma &\rightarrow S = \sqrt{\frac{\sum_{i=1}^n(x_i - \overline{x})^2}{n-1}} \\ \end{aligned}

  • 犯错概率

P(假设为真时拒绝)aP(假设为真时拒绝)=P(Xμ0S/nk)=a\begin{aligned} P(\text{假设为真时拒绝}) &\leq a \\ P(\text{假设为真时拒绝}) &= P(|\frac{\overline{X}-\mu_0}{S/\sqrt{n}}| \geq k) = a \end{aligned}

  • 零界点

k=ta/2(n1)k = t_{a/2}(n - 1)

  • 拒绝域

t=xμ0s/nk=ta/2(n1)\begin{aligned} |t| = |\frac{\overline{x}-\mu_0}{s/\sqrt{n}}| \geq k = t_{a/2}(n - 1) \end{aligned}

两个正态总体均值差的检验

以上都是对一个正态总体进行检验,我们同样可以对具有相同的方差的两正态总体均值差的假设进行检验,设

X1,X2,,XnY1,Y2,,Yn\begin{aligned} X_1, X_2, \cdots, X_n \\ Y_1, Y_2, \cdots, Y_n \end{aligned}

分布是来此正态总体N(μ1,σ2),N(μ2,σ2)N(\mu_1, \sigma^2), N(\mu_2, \sigma^2)的样本,且两样本独立,分别设他们的样本均值为X,Y\overline{X}, \overline{Y},样本方差S12,S22S^2_1, S^2_2

t检验法(2)

条件:方差相等,但σ2\sigma^2未知,关于μ\mu的检验

  • 假设

H0:μ1μ2=δH1:μ1μ2δ\begin{aligned} H_0:& \mu_1 - \mu_2 = \delta \\ H_1:& \mu_1 - \mu_2 \neq \delta \end{aligned}

不过通常情况下都是δ=0\delta = 0的情况

  • 统计量

t=(XY)δSw1n1+1n2t = \frac{(\overline{X} - \overline{Y}) - \delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}

其中

Sw2=(n11)S12+(n21)S22n1+n22=i=1n1(XiX)2+i=1n2(YiY)2(n11)+(n21)S^2_w = \frac{(n_1 - 1)S^2_1 + (n_2 - 1)S^2_2}{n_1 + n_2 - 2} = \frac{\sum^{n_1}_{i=1}(X_i - \overline{X})^2 + \sum^{n_2}_{i=1}(Y_i - \overline{Y})^2}{(n_1 - 1) + (n_2 -1)}

  • 采用分布

(XY)δSw1n1+1n2ta/2(n1+n22)\frac{(\overline{X} - \overline{Y}) - \delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t_{a/2}(n_1 + n_2 - 2)

  • 犯错概率

P(假设为真时拒绝)aP(假设为真时拒绝)=P((xy)δSw1n1+1n2k)=a\begin{aligned} P(\text{假设为真时拒绝}) &\leq a \\ P(\text{假设为真时拒绝}) &= P(|\frac{(\overline{x} - \overline{y}) - \delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}| \geq k) = a \end{aligned}

  • 零界点

ta/2(n1+n22)t_{a/2}(n_1 + n_2 - 2)

  • 拒绝域

t=(xy)δSw1n1+1n2ta/2(n1+n22)|t| = |\frac{(\overline{x} - \overline{y}) - \delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}| \geq t_{a/2}(n_1 + n_2 - 2)

其本质和单个变量的tt检验是一样的,只是把对应的统计量换为2个变量的时候罢了

单个 2个
离差(分子) Xμ0\overline{X} - \mu_0 (XY)(μ1μ2)(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)
方差无偏估计 i=1n(xix)2n1\frac{\sum_{i=1}^n(x_i - \overline{x})^2}{n-1} i=1n1(XiX)2+i=1n2(YiY)2(n11)+(n21)\frac{\sum^{n_1}_{i=1}(X_i - \overline{X})^2 + \sum^{n_2}_{i=1}(Y_i - \overline{Y})^2}{(n_1 - 1) + (n_2 -1)}
分母 S1nS\sqrt{\frac{1}{n}} Sw1n1+1n2S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}
自由度 n1n -1 (n11)+(n21)(n_1 - 1) + (n_2 - 1)

正态总体方差的假设检验

一个正态总体均值差的检验

σ02\sigma^2_0为已知常数,取显著性水平为aa,由于S2S^2σ2\sigma^2的无偏估计,当H0H_0为真的时候,观察值s2s^2σ02\sigma^2_0的比值s2σ02\frac{s^2}{\sigma^2_0}一般来说在1附件浮动

X检验法

条件:σ2,μ\sigma^2, \mu未知,关于σ\sigma的检验

  • 假设

H0:σ2=σ02H1:σ2σ02\begin{aligned} H_0:& \sigma^2 = \sigma^2_0 \\ H_1:& \sigma^2 \neq \sigma^2_0 \end{aligned}

  • 统计量

χ2=(n1)S2σ02\chi^2 = \frac{(n-1)S^2}{\sigma^2_0}

  • 采用分布

(n1)S2σ02χ2(n1)\frac{(n-1)S^2}{\sigma^2_0} \sim{} \chi^2(n-1)

  • 犯错概率

P(假设为真时拒绝)=P(((n1)S2σ02k1)((n1)S2σ02k2))=aP(\text{假设为真时拒绝}) = P((\frac{(n-1)S^2}{\sigma^2_0} \leq k_1) \cup (\frac{(n-1)S^2}{\sigma^2_0} \geq k_2)) = a

为了更好的计算,一般取

P(((n1)S2σ02k1))=a2P(((n1)S2σ02k2))=a2P((\frac{(n-1)S^2}{\sigma^2_0} \leq k_1) ) = \frac{a}{2} \quad P((\frac{(n-1)S^2}{\sigma^2_0} \geq k_2) ) = \frac{a}{2}

  • 零界点

k1=χ1a/22(n1)k2=χa/22(n1)\begin{aligned} k_1 &= \chi^2_{1-a/2}(n-1) \\ k_2 &= \chi^2_{a/2}(n-1) \end{aligned}

  • 拒绝域

(n1)S2σ02χ1a/22(n1)(n1)S2σ02χa/22(n1)\begin{aligned} \frac{(n-1)S^2}{\sigma^2_0} &\leq \chi^2_{1-a/2}(n-1) \\ \frac{(n-1)S^2}{\sigma^2_0} &\geq \chi^2_{a/2}(n-1) \end{aligned}

右边检验问题

H0H_0中的完全σ2\sigma^2都比H1H_1中的σ2\sigma^2要小,当H1H_1为真的时,S2S^2的观察值s2s^2往往偏大
条件:σ2,μ\sigma^2, \mu未知,关于σ\sigma的检验

  • 假设

H0:σ2σ02H1:σ2>σ02\begin{aligned} H_0:& \sigma^2 \leq \sigma^2_0 \\ H_1:& \sigma^2 > \sigma^2_0 \end{aligned}

  • 统计量

(n1)S2σ2\frac{(n-1)S^2}{\sigma^2}

  • 采用分布

(n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)

  • 犯错概率

P(假设为真时拒绝)=P(S2k)=P((n1)S2σ02(n1)kσ02)P((n1)S2σ2(n1)kσ02)\begin{aligned} P(\text{假设为真时拒绝}) &= P(S^2 \geq k) \\ &= P(\frac{(n-1)S^2}{\sigma^2_0} \geq \frac{(n-1)k}{\sigma^2_0}) \\ &\leq P(\frac{(n-1)S^2}{\sigma^2} \geq \frac{(n-1)k}{\sigma^2_0}) \end{aligned}

P((n1)S2σ2(n1)kσ02)=aP(\frac{(n-1)S^2}{\sigma^2} \geq \frac{(n-1)k}{\sigma^2_0}) = a

  • 零界点

k=σ02n1χa2(n1)k = \frac{\sigma^2_0}{n-1}\chi^2_a(n-1)

  • 拒绝域

s2ks^2 \geq k

s2σ02n1χa2(n1)s^2 \geq \frac{\sigma^2_0}{n-1}\chi^2_a(n-1)

χ2=(n1)s2σ02χa2(n1)\chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \geq \chi^2_a(n-1)

左边检验问题

H0:σ2σ02H1:σ2<σ02\begin{aligned} H_0:& \sigma^2 \geq \sigma^2_0 \\ H_1:& \sigma^2 < \sigma^2_0 \end{aligned}

可得拒绝域

χ2=(n1)s2σ02χ1a2(n1)\chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \leq \chi^2_{1-a}(n-1)

两个正态总体方差比的检验

F检验

条件:σ12,σ22,μ1,μ2\sigma_1^2, \sigma_2^2, \mu_1, \mu_2未知,关于S12S22\frac{S^2_1}{S^2_2}的检验

  • 假设

H0:σ12σ22H1:σ12>σ22\begin{aligned} H_0:& \sigma_1^2 \leq \sigma^2_2 \\ H_1:& \sigma_1^2 > \sigma^2_2 \end{aligned}

  • 统计量

s12s22\frac{s^2_1}{s^2_2}

  • 采用分布

S12/S22σ12/σ22F(n11,n21)\frac{S^2_1/S^2_2}{\sigma^2_1/\sigma^2_2} \sim F(n_1 - 1, n_2 - 1)

  • 犯错概率

P(假设为真时拒绝)=P(S12S22k)P(S12/S22σ12/σ22k)=a(因为σ12/σ221)\begin{aligned} P(\text{假设为真时拒绝}) &= P(\frac{S^2_1}{S^2_2} \geq k) \\ &\leq P(\frac{S^2_1/S^2_2}{\sigma^2_1/\sigma^2_2} \geq k) = a (\text{因为}\sigma^2_1/\sigma^2_2 \leq 1) \end{aligned}

  • 零界点

k=Fa(n11,n21)k = F_a(n_1 - 1, n_2 - 1)

  • 拒绝域

F=s12s22Fa(n1,n21)F = \frac{s^2_1}{s^2_2} \geq F_a(n_1, n_2 -1)

总结

假设检验的本质:小概率事件原理。

再多解释下,就是"在你的假设下,这事件发生的概率太低了,我根本就不相信!“或者是"在你的假设下,这事件发生的概率不算低,我没理由拒绝你的假设,只好姑且相信。”

名称 原假设H0H_0 备择假设H1H_1 检验统计量 拒绝域
ZZ检验法 μμ0μμ0μ=μ0\begin{aligned}\mu \leq \mu_0\\\mu \geq \mu_0\\\mu = \mu_0\end{aligned} μ>μ0μ<μ0μμ0\begin{aligned}\mu > \mu_0\\\mu < \mu_0\\\mu \neq \mu_0\end{aligned} Z=Xμ0σ/nZ = \frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} zzazzazza/2\begin{aligned}z &\geq z_a\\z &\leq -z_a\\\lvert z \rvert &\geq z_{a/2}\end{aligned}
tt检验法 μμ0μμ0μ=μ0 (σ2未知)\begin{aligned}\mu \leq \mu_0\\\mu \geq \mu_0\\\mu = \mu_0\\\ (\sigma^2\text{未知})\end{aligned} μ>μ0μ<μ0μμ0\begin{aligned}\mu > \mu_0\\\mu < \mu_0\\\mu \neq \mu_0\end{aligned} t=Xμ0S/nt = \frac{\overline{X}-\mu_0}{S/\sqrt{n}} tta(n1)tta(n1)tta2(n1)\begin{aligned}t &\geq t_a(n-1)\\t &\leq -t_a(n-1)\\\lvert t \rvert &\geq t_{a-2}(n-1)\end{aligned}
ZZ检验法(2) μ1μ2μ0μ1μ2μ0μ1μ2=μ0 (σ12,σ22已知)\begin{aligned}\mu_1 - \mu_2 \leq \mu_0\\\mu_1 - \mu_2 \geq \mu_0\\\mu_1 - \mu_2 = \mu_0\\\ (\sigma_1^2, \sigma_2^2\text{已知})\end{aligned} μ1μ2>μ0μ1μ2<μ0μ1μ2μ0\begin{aligned}\mu_1 - \mu_2 > \mu_0\\\mu_1 - \mu_2 < \mu_0\\\mu_1 - \mu_2 \neq \mu_0\end{aligned} Z=(XY)δσ12n1+σ22n2Z = \frac{(\overline{X} - \overline{Y}) - \delta}{\sqrt{\frac{\sigma^2_1}{n_1}+\frac{\sigma^2_2}{n_2}}} zzazzazza/2\begin{aligned}z &\geq z_a\\z &\leq -z_a\\\lvert z \rvert &\geq z_{a/2}\end{aligned}
tt检验法(2) μ1μ2μ0μ1μ2μ0μ1μ2=μ0 (σ12=σ22未知)\begin{aligned}\mu_1 - \mu_2 \leq \mu_0\\\mu_1 - \mu_2 \geq \mu_0\\\mu_1 - \mu_2 = \mu_0\\\ (\sigma_1^2 = \sigma_2^2\text{未知})\end{aligned} μ1μ2>μ0μ1μ2<μ0μ1μ2μ0\begin{aligned}\mu_1 - \mu_2 > \mu_0\\\mu_1 - \mu_2 < \mu_0\\\mu_1 - \mu_2 \neq \mu_0\end{aligned} t=(XY)δSw1n1+1n2Sw2=i=1n(XiX)2+i=1n(YiY)2(n1)+(m1)\begin{aligned}\qquad\quad t &= \frac{(\overline{X} - \overline{Y}) - \delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\\S^2_w &= \frac{\sum^n_{i=1}(X_i - \overline{X})^2 + \sum^n_{i=1}(Y_i - \overline{Y})^2}{(n -1) + (m -1)}\end{aligned} tta(n1+n22)tta(n1+n22)tta/2(n1+n22)\begin{aligned}t &\geq t_a(n_1 + n_2 -2)\\t &\leq t_a(n_1 + n_2 -2)\\\lvert t \rvert &\geq t_{a/2}(n_1 + n_2 -2)\end{aligned}
χ2\chi^2检验法 σ2σ0σσ0σ=σ0 (μ未知)\begin{aligned}\sigma^2 \leq \sigma_0\\\sigma \geq \sigma_0\\\sigma = \sigma_0\\\ (\mu \text{未知})\end{aligned} σ2>σ0σ<σ0σσ0\begin{aligned}\sigma^2 > \sigma_0\\\sigma < \sigma_0\\\sigma \neq \sigma_0\end{aligned} χ2=(n1)S2σ02\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} χ2χaa(n1)χ2χ1a2(n1)χ2χa/22(n1)orχ2χ1a/22(n1)\begin{aligned}\chi^2 &\geq \chi^a_a(n-1)\\\chi^2 &\leq \chi^2_{1-a}(n-1)\\\chi^2 \geq \chi^2_{a/2}(n-1) \quad &or \quad \chi^2 \leq \chi^2_{1-a/2}(n-1)\end{aligned}
FF检验法 σ12σ22σ12σ22σ12=σ22(μ1,μ2未知)\begin{aligned}\sigma^2_1 &\leq \sigma^2_2\\\sigma^2_1 &\geq \sigma^2_2\\\sigma^2_1 &= \sigma^2_2\\(\mu_1, &\mu_2\text{未知})\end{aligned} σ12>σ22σ12<σ22σ12σ22\begin{aligned}\sigma^2_1 &> \sigma^2_2\\\sigma^2_1 &< \sigma^2_2\\\sigma^2_1 &\neq \sigma^2_2\end{aligned} F=S12S12F = \frac{S^2_1}{S^2_1} FFa(n11,n21)FF1a(n11,n21)FFa/2(n11,n21)FF1a/2(n11,n21)\begin{aligned}F &\geq F_a(n_1 - 1, n_2 - 1)\\F &\leq F_{1-a}(n_1 - 1, n_2 - 1)\\F &\geq F_{a/2}(n_1 - 1, n_2 - 1)\\&\text{或}\\F &\leq F_{1 - a/2}(n_1 - 1, n_2 - 1)\end{aligned}
            graph TD
            均值还是方差假设检验 --> 均值;
均值还是方差假设检验 --> 方差;
均值 --一个总体--> 一个总体均值的条件;
均值 --两个总体--> 两个总体均值的条件;
一个总体均值的条件 --方差已知--> Z检验法;
一个总体均值的条件 --方差未知--> t检验法;
两个总体均值的条件 --方差未知--> t检验法;
方差 --一个总体--> 一个总体方差的条件;
方差 --两个总体--> 两个总体方差的条件;
一个总体方差的条件 --方差,期望未知--> X检验法;
两个总体方差的条件 --方差,期望未知--> F检验法;
          

p值检验法

以上的方法都是临界值法,这里介绍pp值检验法
定义:假设检验问题的pp值是由检验统计量的样本观察值得出的原假设(H0H_0)可被拒绝的最小显著性水平。

也就是如果pp计算出来比aa小的话,那么就

  • 建立假设
  • 确定统计量
  • 计算出统计量CC
  • 计算pp
    • p=P(Zz0)=P(ZC)=1Φ(C)p = P(Z \geq z_0) = P(Z \geq C) = 1 - \Phi(C)
    • pp值就是拒绝域上图形的面积大小
  • 判断
    • 拒绝:apa \geq p
    • 接受:a<pa < p
  • 单/双问题
    • 单(比大小):pp值即单侧的图形的面积
    • 双(比等于):pp值是单侧的面积×2\times 2

非参数检验

符号检验

符号检验是一种使用正负号来检验不同假设的非参数检验

x=频率较小的符号出现的次数n=正负号合在一起的总数\begin{aligned} x &= \text{频率较小的符号出现的次数} \\ n &= \text{正负号合在一起的总数} \end{aligned}

检验统计量:

n25,x(频率较小的符号出现的次数)n>25,z=(x+0.5)(n2)n2\begin{aligned} n \leq 25, & x(\text{频率较小的符号出现的次数}) \\ n > 25, & z = \frac{(x + 0.5) - (\frac{n}{2})}{\frac{\sqrt{n}}{2}} \end{aligned}

小于等于25的情况

使用二项分布,假设有10个数据

  • 正负的分布次数有:210=10242^{10} = 1024
    • 都是正:C100=1C^0_10 = 1
    • 只有一个是正:C101=10C^1_{10} = 10
    • 只有两个是正:C102=45C^2_{10} = 45
    • 只有一个是负:C101=10C^1_{10} = 10
    • 只有两个是负:C102=45C^2_{10} = 45

所以10个数值里,只有一个符号与其他符号不同的几率为1+101024+1+101024=2210240.02\frac{1 + 10}{1024} + \frac{1 + 10}{1024} = \frac{22}{1024} \approx 0.02,也就是P值。

威尔科克森符号秩检验

不需要要求正态纷纷不,只要求对称分布和中间值M0M_0为分布的中心,检验成对观测数据之差是否来自均值为0的总体(产生数据的总体是否具有相同的均值)
原假设是:两配对样本来自的两总体的分布无显著差异

  • i=1,2,,ni = 1, 2, \cdots, n,计算XiM0|X_i - M_0|,它们代表这些样本点到M0M_0的距离
  • 把上面的nn个绝对值排序,并找出它们的nn个秩
    • 如果它们有相同的样本点,每个点取平均秩(如1,4,4,51, 4, 4, 5的秩为1,2.5,2.5,41, 2.5, 2.5, 4
    • W+W^+等于XiM0>0X_i - M_0 > 0XiM0|X_i - M_0|的秩的和
    • WW^-等于XiM0<0X_i - M_0 < 0XiM0|X_i - M_0|的秩的和
  • 双边检验
    • H0:M=M0H_0: M = M_0
    • H1:MM0H_1: M \neq M_0
    • 某些时候在零假设下,W+W^+WW^-相差不大,其中一个很小的时候,应换衣零假设,取检验统计量W=min(W+,W)W = min(W^+, W^-)
  • 单边检验
    • H0:M>M0H_0: M > M_0
  • 由中心极限定理:WN(μ,σ)Z=WμσN(0,1)W \sim N(\mu, \sigma) \leftrightarrow Z = \frac{W - \mu}{\sigma} \sim N(0, 1)
    • 期待值:E(W)=μ=n(n+1)4E(W) = \mu = \frac{n(n + 1)}{4}
    • 方差:Var(W)=σ=n(n+1)(2n+1)24Var(W) = \sigma = \frac{n(n + 1)(2n + 1)}{24}

例子:

H0:M=0H0:M0\begin{aligned} H_0: & M = 0 \\ H_0: & M \neq 0 \end{aligned}

ii 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
xix_i 5.85.8 0.10.1 1.91.9 2.52.5 5.75.7 1.21.2 4.24.2 8.08.0 7.97.9 2.32.3 0.90.9 5.55.5 3.33.3 7.27.2 1.51.5 5.45.4 3.13.1
RiR_i 1414 11 55 77 1313 33 1010 1717 1616 66 22 1212 99 1515 44 1111 88
ϵi\epsilon_i 11 11 11 00 11 00 11 11 11 00 11 11 11 00 11 00 11

W=i=0nϵiRi=14+1+5+13+4+10+17+16+2+12+9+8=111μ=17(17+1)4=76.5σ2=17(17+1)(217+1)24446.25Z=Wμσ=11176.5446.251.633P=0.1024(双边检验2)\begin{aligned} W &= \sum^n_{i=0} \epsilon_iR_i = 14 + 1 + 5 + 13 + 4 + 10 + 17 + 16 + 2 + 12 + 9 + 8 = 111 \\ \mu &= \frac{17(17 + 1)}{4} = 76.5 \\ \sigma^2 &= \frac{17(17 + 1)(2 * 17 + 1)}{24} \approx 446.25 \\ Z &= \frac{W - \mu}{\sigma} = \frac{111 - 76.5}{\sqrt{446.25}} \approx 1.633 \\ \\ P\text{值} &= 0.1024 (\text{双边检验}*2) \end{aligned}

威尔科克森秩和检验

推断连续型变量的两个独立样本代表的两个总体分布是否由差别,如下:YiY_i的分布和Xi+δX_i + \delta的分布相同

  • Xi,YiX_i, Y_i,计算XiM0|X_i - M_0|YiM0|Y_i - M_0|,它们代表这些样本点到M0M_0的距离
  • 把上面的nn个绝对值排序,并找出它们的nn个秩
    • 如果它们有相同的样本点,每个点取平均秩(如1,4,4,51, 4, 4, 5的秩为1,2.5,2.5,41, 2.5, 2.5, 4
  • 假设分布
    • X1,X2,,XmF(x),i.i.dX_1, X_2, \cdots, X_m \sim F(x), i.i.d
    • Y1,Y2,,YmF(yδ),i.i.dY_1, Y_2, \cdots, Y_m \sim F(y - \delta), i.i.d
  • 假设
    • H0:δ=0H_0: \delta = 0
    • H1:δ0H_1: \delta \neq 0
  • 检验统计量:W=i=1nRiW = \sum^n_{i=1} R_i,(单纯YiY_i的秩的和)
  • 由中心极限定理:WN(μ,σ)Z=WμσN(0,1)W \sim N(\mu, \sigma) \leftrightarrow Z = \frac{W - \mu}{\sigma} \sim N(0, 1)
    • 期待值:E(W)=μ=n(m+n+1)2E(W) = \mu = \frac{n(m + n + 1)}{2}
    • 方差:Var(W)=σ=mn(m+n+1)12Var(W) = \sigma = \frac{mn(m + n + 1)}{12}

例子:

设有数据

X=[9.5,13.9,18.1,19.9,20.6,21.5,21.8,22.1,25.7,27.9]Y=[14.7,19.8,21.3,21.6,21.7,22.2,22.4,22.7,24.6,27.1,27.0,28.0,29.3,37.1]\begin{aligned} X &= [9.5, 13.9, 18.1, 19.9, 20.6, 21.5, 21.8, 22.1, 25.7, 27.9] \\ Y &= [14.7, 19.8, 21.3, 21.6, 21.7, 22.2, 22.4, 22.7, 24.6, 27.1, 27.0, 28.0, 29.3, 37.1] \end{aligned}

9.5,13.9,14.7,18.1,19.8,19.9,20.6,21.3,21.5,21.6,21.721.8,22.1,22.2,22.4,22.7,24.6,25.7,27.1,27.0,27.9,28.0,29.3,37.1\begin{gathered} \mathbf{9.5}, \mathbf{13.9}, 14.7, \mathbf{18.1}, 19.8, \mathbf{19.9}, \mathbf{20.6}, 21.3, \mathbf{21.5}, 21.6, 21.7 \\ \mathbf{21.8}, \mathbf{22.1}, 22.2, 22.4, 22.7, 24.6, \mathbf{25.7}, 27.1, 27.0, \mathbf{27.9}, 28.0, 29.3, 37.1 \end{gathered}

计算

W=i=1nRi=1+2+4+6+7+9+12+13+18+21=93μ=10(14+10+1)2=125σ2=1410(14+10+1)2291.67Z=Wμσ=93125291.671.8737P=0.0610(双边检验2)\begin{aligned} W &= \sum^n_{i=1}R_i = 1 + 2 + 4 + 6 + 7 + 9 + 12 + 13 + 18 + 21 = 93 \\ \mu &= \frac{10(14 + 10 + 1)}{2} = 125 \\ \sigma^2 &= \frac{14*10(14 + 10 + 1)}{2} \approx 291.67 \\ Z &= \frac{W - \mu}{\sigma} = \frac{93 - 125}{\sqrt{291.67}} \approx -1.8737 \\ \\ P\text{值} &= 0.0610 (\text{双边检验}*2) \end{aligned}

卡方检验

卡方检验的目标就是检查观测值的频数与期望频数之间的差异显著性。

  • 卡方距离:
    • 由于卡方检验的目标是检查观测频数与期望频数之间的差异性水平,因此卡方检验的核心内容就是计算出观测值的频数与期望频数总体差距的统计量
    • 卡方值越大,表示距离越大,差异性越强。可以根据卡方值查表推导出卡方检验的概率值,然后根据概率值判定卡方检验的判断结论。
    • χ2=(XiEi)Ei\chi^2 = \sum\frac{(X_i - E_i)}{E_i}

拟合优度检验

卡方独立性检验

也叫独立性检验,是一种统计量的分布在零假设成立时近似服从卡方分布χ2\chi^{2}分布的假设检验
在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。

  • 列联表:测数据按两个或多个(定型变量)分类时所列出的频数表
AA BB 行和
XX a11a_{11} a12a_{12} a11+a12a_{11}+a_{12}
YY a21a_{21} a22a_{22} a21+a22a_{21}+a_{22}
列和 a11+a21a_{11}+a_{21} a12+a22a_{12}+a_{22} nn

列联表分析的基本问题:考察各属性之间有无关联,即判断两个属性是否独立

  • pip_{i\cdot}:代表总体中个体仅属于X,YX,Y中一项的概率
  • pjp_{\cdot j}:代表总体中个体仅属于A,BA,B中一项的概率
  • pijp_{ij}:代表总体中个体仅属于X,YX,Y中一项且属于A,BA,B中一项的概率

A,BA, B两属性独立的假设可以表述为

H0:pij=pipj原假设H1:pijpipj备择假设\begin{aligned} H_0&: p_{ij} = p_i \cdot p_j & \text{原假设} \\ H_1&: p_{ij} \neq p_i \cdot p_j & \text{备择假设} \end{aligned}

在原假设下,我们可以计算各个参数的极大似然估计值

p1^=a11+a12np2^=a21+a22np1^=a11+a21np2^=a12+a22n\begin{aligned} \hat{p_{1\cdot}} &= \frac{a_{11}+a_{12}}{n} \\ \hat{p_{2\cdot}} &= \frac{a_{21}+a_{22}}{n} \\ \hat{p_{\cdot 1}} &= \frac{a_{11}+a_{21}}{n} \\ \hat{p_{\cdot 2}} &= \frac{a_{12}+a_{22}}{n} \end{aligned}

进而可以计算出npij^=np^ip^jn \hat{p_{ij}} = n\hat{p}_{i\cdot}\hat{p}_{\cdot j},即期待频数

期待度数=列的周边度数×行的周边度数全体的度数\text{期待度数} = \frac{\text{列的周边度数}\times \text{行的周边度数}}{\text{全体的度数}}

然后可以计算出每一格的理论值

p^11=np^1p^1np^12=np^1p^2np^21=np^2p^1np^22=np^2p^2\begin{alignedat} n \hat{p}_{11} &= n \hat{p}_{1\cdot}\hat{p}_{\cdot 1} \\ n \hat{p}_{12} &= n \hat{p}_{1\cdot}\hat{p}_{\cdot 2} \\ n \hat{p}_{21} &= n \hat{p}_{2\cdot}\hat{p}_{\cdot 1} \\ n \hat{p}_{22} &= n \hat{p}_{2\cdot}\hat{p}_{\cdot 2} \end{alignedat}

记下表

AA BB 行和
XX np^11n \hat{p}_{11} np^12n \hat{p}_{12} p1^\hat{p_{1\cdot}}
YY np^21n \hat{p}_{21} np^22n \hat{p}_{22} p2^\hat{p_{2\cdot}}
列和 p1^\hat{p_{\cdot 1}} p2^\hat{p_{\cdot 2}} 11

如果它们之间是独立的,那么实际表格里的数据应该和上表相差不大,检验统计量的计算式子:

χ2=(极大似然估计值观测值)2极大似然估计值\chi^2 = \sum \frac{(\text{极大似然估计值} - \text{观测值})^2}{\text{极大似然估计值}}

这里行r=2r = 2和列c=2c = 2,自由度为(r1)×(c1)=1(r-1) \times (c-1) = 1,若a=0.05a = 0.05,查表有χ0.952=3.84\chi^2_{0.95} = 3.84

  • 如果χ2>3.84\chi^2 > 3.84,与理论数值相差过大,则拒绝原假设H0H_0,认为ABABXYXY有关系
  • 如果χ2<=3.84\chi^2 <= 3.84,与理论数值相差不大,则接受原假设H0H_0,认为它们之间独立