[数理统计] - 假设检验

在总体的分布函数完全未知或只知其形式，但不知道参数的情况，为了推断总体的某些未知特性，提出某些关于总体的假设。最常见的比如，有一组数据，这数据是某机器生产出来的产品的数据，假设机器的误差范围在0.1，那么通过假设检验可以判断机器是否在正常工作。

我们要根据样本对正态总体所提出假设做出是接受，还是拒绝的决策。

检验问题

对于假设检验问题，一般会有2个相反的假设

\begin{aligned} H_0&: \mu = \mu_0 & \text{原假设} \\ H_1&: \mu \neq \mu_0 & \text{备择假设} \end{aligned}

检验的是总体均值 $\mu$ ，利用样本均值 $\overline{X}$ 统计量进行判断
$\overline{X}$ 是 $\mu$ 的无偏估计， $\overline{X}$ 的观察值 $\overline{x}$ 的大小在一定程度上反映 $\mu$ 的大小。

如果假设 $H_0$ 为真，则观察值 $\overline{x}$ 与 $\mu_0$ 的偏差不应该太大，如果 $|\overline{x} - u_0|$ 过大，就怀疑假设 $H_0$ 的正确性而拒绝 $H_0$ ，如果 $H_0$ 为真时，则 $\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0, 1)$ ，衡量 $|\overline{x} - u_0|$ 的大小可以转为衡量 $\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$

选定一正数 $k$ $k$
- 观察值 $\overline{x}$ 满足 $\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \geq k$ ：拒绝假设 $H_0$
- 观察值 $\overline{x}$ 满足 $\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} < k$ ：接受假设 $H_0$

但是这样可能在 $H_0$ 为真时拒绝 $H_0$ （一定概率弃真），也就是在 $H_0$ 为真的时候，在拒绝域之内。即

P(\text{假设为真时拒绝}) = P(|\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}| \geq k) = a

当 $H_0$ 为真的时候 $Z = \frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0, 1)$ ，这样，只允许犯错的概率最大为 $a$ ，也就是上图的阴影部分，从而可以决定 $k$ ，即

k = z_{a/2}

因此， $Z$ 的观察值满足

$|z| = |\frac{\overline{x} - \mu_0}{\sigma/\sqrt{n}}| \geq k = z_{a/2}$ ：拒绝 $H_0$
$|z| = |\frac{\overline{x} - \mu_0}{\sigma/\sqrt{n}}| < k = z_{a/2}$ ：接受 $H_0$

通俗的讲就是 $\overline{x} - \mu_0$ 太大了，而且几乎只有 $a$ 的可能性这么大，于是选择拒绝
但是如果没有那么大，我们也就没有什么证据去拒绝，就只能接受了

这里 $|z| = |\frac{\overline{x} - \mu_0}{\sigma/\sqrt{n}}|$ 计算的值是坐标，然后通过 $a/2$ 去查表，查到 $z_{a/2}$ 的值，然后对比大小

除了上面的弃真错误，我们还可能在假设为假的时候接受，也就是当满足 $H_1$ 的时候，在拒绝域之外。即

P(\text{假设为假时接受}) = \beta

为了尽可能的减少犯错，但是在样本容量固定的时候

减少一类错误的概率，往往会增大另外一类的错误的概率
要使犯两类错误的概率都减少，需要增加样本容量（毕竟可以用作判断的数据更多了）

检验分类：

显著性检验：控制第 $I$ $I$ 类错误的概率，不考虑犯第二类错误的概率
- 双边备择假设双边假设检验
右边检验：关心总体均值是否增大

\begin{aligned} H_0&: \mu \leq \mu_0 \\ H_0&: \mu > \mu_0 \end{aligned}

左边检验：关心总体均值是否减少

\begin{aligned} H_0&: \mu \geq \mu_0 \\ H_0&: \mu < \mu_0 \end{aligned}

原假设： $H_0$
备择假设： $H_1$
拒绝域：拒绝 $H_0$ 时，统计量所在的区域
临界点：拒绝域的边界点 $z_{a/2}$

犯错概率

	接受 $H_0$	拒绝 $H_0$
$H_0$ 为真	$1-a$	一类错误 $a$
$H_0$ 为假	二类错误 $\beta$	$1-\beta$

假设以下假设检验问题的拒绝域是 $\overline{x} \geq c$ ，样本数量是 $n$

\begin{aligned} H_0&: \mu = \mu_0 \\ H_1&: \mu = \mu_1 \end{aligned}

则

\begin{aligned} a &= P(\overline{x} \geq c|H_0) = P(\frac{\overline{x} - \mu_0}{\sigma/\sqrt{n}} \geq \frac{c - \mu_0}{\sigma/\sqrt{n}}) \\ \beta &= P(\overline{x} < c|H_1) = P(\frac{\overline{x} - \mu_1}{\sigma/\sqrt{n}} < \frac{c - \mu_1}{\sigma/\sqrt{n}}) \end{aligned}

即

\begin{aligned} a &= P(x \in \text{拒绝域} |H_0) \\ \beta &= P(x \notin \text{拒绝域} |H_1) \end{aligned}

如果要增加样本数量 $n$ ，使犯错的概率低于一定数值 $c$ ，则

\begin{aligned} a = 1 - \Phi(\frac{\mu_0}{\sigma/\sqrt{n}}) \leq c \\ \beta = 1 - \Phi(\frac{\mu_1}{\sigma/\sqrt{n}}) \leq c \end{aligned}

假设的建立

$u = u_0$
$u > u_0$
$u < u_0$

对于上面3种情况

是对是不是 $u_0$ 进行检定（两边各2.5%）
是对是不是比 $u_0$ 多进行检定，对于少于 $u_0$ 的情况不考虑（右边5%）
是对是不是比 $u_0$ 少进行检定，对于多于 $u_0$ 的情况不考虑（左边5%）

简单假设
- $H_0: u = u_0 \leftrightarrow H_1: u = u_1$
双侧假设：对立假设是双侧的
- $H_0: u = u_0 \leftrightarrow H_1: u \neq u_1$
单侧假设：对立假设是单侧的
- $H_0: u = u_0 \leftrightarrow H_1: u > u_0$
- $H_0: u = u_0 \leftrightarrow H_1: u < u_0$
- $H_0: u \leq u_0 \leftrightarrow H_1: u > u_0$
- $H_0: u \geq u_0 \leftrightarrow H_1: u < u_0$

也就是是否是单双侧和 $H_0$ 无关，只和 $H_1$ 有关

正态总体均值的假设检验

单个正态总体均值差的检验

Z检验法

条件： $\sigma^2$ 已知，关于 $\mu$ 的检验

假设

\begin{aligned} H_0&: \mu = \mu_0 & \text{原假设} \\ H_1&: \mu \neq \mu_0 & \text{备择假设} \end{aligned}

采用分布

\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \sim{} N(0,1)

统计量

Z = \frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}

犯错概率

\begin{aligned} P(\text{假设为真时拒绝}) &\leq a \\ P(\text{假设为真时拒绝}) &= P(|\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}| \geq k) = a \end{aligned}

零界点

k = z_{a/2}

拒绝域

|z| = |\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}| \ge k = z_{a/2}

接受域

|z| = |\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}| < k = z_{a/2}

Z右边检验法

条件： $\sigma^2$ 已知，关于 $\mu$ 的检验

假设

\begin{aligned} H_0&: \mu \leq \mu_0 \\ H_0&: \mu > \mu_0 \end{aligned}

采用分布

\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \sim{} N(0,1)

统计量

Z = \frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}

犯错概率

\begin{aligned} P(\text{假设为真时拒绝}) &\leq a \\ P(\text{假设为真时拒绝}) &= P(\overline{X} \geq k) \\ P(\text{假设为真时拒绝}) &= P(\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \geq \frac{k - \mu_0}{\sigma/\sqrt{n}}) \\ &\leq P(\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} \geq \frac{k - \mu_0}{\sigma/\sqrt{n}}) \end{aligned}

P(\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} \geq \frac{k - \mu_0}{\sigma/\sqrt{n}}) = a

零界点

k = \mu_0 + \frac{\sigma}{\sqrt{n}}z_a

拒绝域

\begin{aligned} \overline{x} &\geq k = \mu_0 + \frac{\sigma}{\sqrt{n}}z_a \\ &\Downarrow \\ z &= \frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}} \geq z_a \end{aligned}

Z左边检验法

条件： $\sigma^2$ 已知，关于 $\mu$ 的检验

拒绝域

\begin{aligned} \overline{x} &\leq k = \mu_0 - \frac{\sigma}{\sqrt{n}}z_a \\ &\Downarrow \\ z &= \frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}} \leq -z_a \end{aligned}

t检验法

条件： $\sigma^2$ 未知，关于 $\mu$ 的检验

假设

\begin{aligned} H_0:& \mu = \mu_0 \\ H_1:& \mu \neq \mu_0 \end{aligned}

统计量

t = \frac{\overline{X}-\mu_0}{S/\sqrt{n}}

采用分布

\begin{aligned} \frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} &\rightarrow \frac{\overline{X}-\mu_0}{S/\sqrt{n}} \sim t(n - 1) \\ \sigma &\rightarrow S = \sqrt{\frac{\sum_{i=1}^n(x_i - \overline{x})^2}{n-1}} \\ \end{aligned}

犯错概率

\begin{aligned} P(\text{假设为真时拒绝}) &\leq a \\ P(\text{假设为真时拒绝}) &= P(|\frac{\overline{X}-\mu_0}{S/\sqrt{n}}| \geq k) = a \end{aligned}

零界点

k = t_{a/2}(n - 1)

拒绝域

\begin{aligned} |t| = |\frac{\overline{x}-\mu_0}{s/\sqrt{n}}| \geq k = t_{a/2}(n - 1) \end{aligned}

两个正态总体均值差的检验

以上都是对一个正态总体进行检验，我们同样可以对具有相同的方差的两正态总体均值差的假设进行检验，设

\begin{aligned} X_1, X_2, \cdots, X_n \\ Y_1, Y_2, \cdots, Y_n \end{aligned}

分布是来此正态总体 $N(\mu_1, \sigma^2), N(\mu_2, \sigma^2)$ 的样本，且两样本独立，分别设他们的样本均值为 $\overline{X}, \overline{Y}$ ，样本方差 $S^2_1, S^2_2$

t检验法（2）

条件：方差相等，但 $\sigma^2$ 未知，关于 $\mu$ 的检验

假设

\begin{aligned} H_0:& \mu_1 - \mu_2 = \delta \\ H_1:& \mu_1 - \mu_2 \neq \delta \end{aligned}

不过通常情况下都是 $\delta = 0$ 的情况

统计量

t = \frac{(\overline{X} - \overline{Y}) - \delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}

其中

S^2_w = \frac{(n_1 - 1)S^2_1 + (n_2 - 1)S^2_2}{n_1 + n_2 - 2} = \frac{\sum^{n_1}_{i=1}(X_i - \overline{X})^2 + \sum^{n_2}_{i=1}(Y_i - \overline{Y})^2}{(n_1 - 1) + (n_2 -1)}

采用分布

\frac{(\overline{X} - \overline{Y}) - \delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t_{a/2}(n_1 + n_2 - 2)

犯错概率

\begin{aligned} P(\text{假设为真时拒绝}) &\leq a \\ P(\text{假设为真时拒绝}) &= P(|\frac{(\overline{x} - \overline{y}) - \delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}| \geq k) = a \end{aligned}

零界点

t_{a/2}(n_1 + n_2 - 2)

拒绝域

|t| = |\frac{(\overline{x} - \overline{y}) - \delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}| \geq t_{a/2}(n_1 + n_2 - 2)

其本质和单个变量的 $t$ 检验是一样的，只是把对应的统计量换为2个变量的时候罢了

	单个	2个
离差(分子)	$\overline{X} - \mu_0$	$(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)$
方差无偏估计	$\frac{\sum_{i=1}^n(x_i - \overline{x})^2}{n-1}$	$\frac{\sum^{n_1}_{i=1}(X_i - \overline{X})^2 + \sum^{n_2}_{i=1}(Y_i - \overline{Y})^2}{(n_1 - 1) + (n_2 -1)}$
分母	$S\sqrt{\frac{1}{n}}$	$S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$
自由度	$n -1$	$(n_1 - 1) + (n_2 - 1)$

正态总体方差的假设检验

一个正态总体均值差的检验

$\sigma^2_0$ 为已知常数，取显著性水平为 $a$ ，由于 $S^2$ 是 $\sigma^2$ 的无偏估计，当 $H_0$ 为真的时候，观察值 $s^2$ 与 $\sigma^2_0$ 的比值 $\frac{s^2}{\sigma^2_0}$ 一般来说在1附件浮动

X检验法

条件： $\sigma^2, \mu$ 未知，关于 $\sigma$ 的检验

假设

\begin{aligned} H_0:& \sigma^2 = \sigma^2_0 \\ H_1:& \sigma^2 \neq \sigma^2_0 \end{aligned}

统计量

\chi^2 = \frac{(n-1)S^2}{\sigma^2_0}

采用分布

\frac{(n-1)S^2}{\sigma^2_0} \sim{} \chi^2(n-1)

犯错概率

P(\text{假设为真时拒绝}) = P((\frac{(n-1)S^2}{\sigma^2_0} \leq k_1) \cup (\frac{(n-1)S^2}{\sigma^2_0} \geq k_2)) = a

为了更好的计算，一般取

P((\frac{(n-1)S^2}{\sigma^2_0} \leq k_1) ) = \frac{a}{2} \quad P((\frac{(n-1)S^2}{\sigma^2_0} \geq k_2) ) = \frac{a}{2}

零界点

\begin{aligned} k_1 &= \chi^2_{1-a/2}(n-1) \\ k_2 &= \chi^2_{a/2}(n-1) \end{aligned}

拒绝域

\begin{aligned} \frac{(n-1)S^2}{\sigma^2_0} &\leq \chi^2_{1-a/2}(n-1) \\ \frac{(n-1)S^2}{\sigma^2_0} &\geq \chi^2_{a/2}(n-1) \end{aligned}

右边检验问题

因 $H_0$ 中的完全 $\sigma^2$ 都比 $H_1$ 中的 $\sigma^2$ 要小，当 $H_1$ 为真的时， $S^2$ 的观察值 $s^2$ 往往偏大
条件： $\sigma^2, \mu$ 未知，关于 $\sigma$ 的检验

假设

\begin{aligned} H_0:& \sigma^2 \leq \sigma^2_0 \\ H_1:& \sigma^2 > \sigma^2_0 \end{aligned}

统计量

\frac{(n-1)S^2}{\sigma^2}

采用分布

\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)

犯错概率

\begin{aligned} P(\text{假设为真时拒绝}) &= P(S^2 \geq k) \\ &= P(\frac{(n-1)S^2}{\sigma^2_0} \geq \frac{(n-1)k}{\sigma^2_0}) \\ &\leq P(\frac{(n-1)S^2}{\sigma^2} \geq \frac{(n-1)k}{\sigma^2_0}) \end{aligned}

P(\frac{(n-1)S^2}{\sigma^2} \geq \frac{(n-1)k}{\sigma^2_0}) = a

零界点

k = \frac{\sigma^2_0}{n-1}\chi^2_a(n-1)

拒绝域

s^2 \geq k

s^2 \geq \frac{\sigma^2_0}{n-1}\chi^2_a(n-1)

即

\chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \geq \chi^2_a(n-1)

左边检验问题

\begin{aligned} H_0:& \sigma^2 \geq \sigma^2_0 \\ H_1:& \sigma^2 < \sigma^2_0 \end{aligned}

可得拒绝域

\chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \leq \chi^2_{1-a}(n-1)

两个正态总体方差比的检验

F检验

条件： $\sigma_1^2, \sigma_2^2, \mu_1, \mu_2$ 未知，关于 $\frac{S^2_1}{S^2_2}$ 的检验

假设

\begin{aligned} H_0:& \sigma_1^2 \leq \sigma^2_2 \\ H_1:& \sigma_1^2 > \sigma^2_2 \end{aligned}

统计量

\frac{s^2_1}{s^2_2}

采用分布

\frac{S^2_1/S^2_2}{\sigma^2_1/\sigma^2_2} \sim F(n_1 - 1, n_2 - 1)

犯错概率

\begin{aligned} P(\text{假设为真时拒绝}) &= P(\frac{S^2_1}{S^2_2} \geq k) \\ &\leq P(\frac{S^2_1/S^2_2}{\sigma^2_1/\sigma^2_2} \geq k) = a (\text{因为}\sigma^2_1/\sigma^2_2 \leq 1) \end{aligned}

零界点

k = F_a(n_1 - 1, n_2 - 1)

拒绝域

F = \frac{s^2_1}{s^2_2} \geq F_a(n_1, n_2 -1)

总结

假设检验的本质：小概率事件原理。

再多解释下，就是"在你的假设下，这事件发生的概率太低了，我根本就不相信！“或者是"在你的假设下，这事件发生的概率不算低，我没理由拒绝你的假设，只好姑且相信。”

名称	原假设 $H_0$	备择假设 $H_1$	检验统计量	拒绝域
$Z$ 检验法	$\begin{aligned}\mu \leq \mu_0\\\mu \geq \mu_0\\\mu = \mu_0\end{aligned}$	$\begin{aligned}\mu > \mu_0\\\mu < \mu_0\\\mu \neq \mu_0\end{aligned}$	$Z = \frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$	$\begin{aligned}z &\geq z_a\\z &\leq -z_a\\\lvert z \rvert &\geq z_{a/2}\end{aligned}$
$t$ 检验法	$\begin{aligned}\mu \leq \mu_0\\\mu \geq \mu_0\\\mu = \mu_0\\\ (\sigma^2\text{未知})\end{aligned}$	$\begin{aligned}\mu > \mu_0\\\mu < \mu_0\\\mu \neq \mu_0\end{aligned}$	$t = \frac{\overline{X}-\mu_0}{S/\sqrt{n}}$	$\begin{aligned}t &\geq t_a(n-1)\\t &\leq -t_a(n-1)\\\lvert t \rvert &\geq t_{a-2}(n-1)\end{aligned}$
$Z$ 检验法(2)	$\begin{aligned}\mu_1 - \mu_2 \leq \mu_0\\\mu_1 - \mu_2 \geq \mu_0\\\mu_1 - \mu_2 = \mu_0\\\ (\sigma_1^2, \sigma_2^2\text{已知})\end{aligned}$	$\begin{aligned}\mu_1 - \mu_2 > \mu_0\\\mu_1 - \mu_2 < \mu_0\\\mu_1 - \mu_2 \neq \mu_0\end{aligned}$	$Z = \frac{(\overline{X} - \overline{Y}) - \delta}{\sqrt{\frac{\sigma^2_1}{n_1}+\frac{\sigma^2_2}{n_2}}}$	$\begin{aligned}z &\geq z_a\\z &\leq -z_a\\\lvert z \rvert &\geq z_{a/2}\end{aligned}$
$t$ 检验法(2)	$\begin{aligned}\mu_1 - \mu_2 \leq \mu_0\\\mu_1 - \mu_2 \geq \mu_0\\\mu_1 - \mu_2 = \mu_0\\\ (\sigma_1^2 = \sigma_2^2\text{未知})\end{aligned}$	$\begin{aligned}\mu_1 - \mu_2 > \mu_0\\\mu_1 - \mu_2 < \mu_0\\\mu_1 - \mu_2 \neq \mu_0\end{aligned}$	$\begin{aligned}\qquad\quad t &= \frac{(\overline{X} - \overline{Y}) - \delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\\S^2_w &= \frac{\sum^n_{i=1}(X_i - \overline{X})^2 + \sum^n_{i=1}(Y_i - \overline{Y})^2}{(n -1) + (m -1)}\end{aligned}$	$\begin{aligned}t &\geq t_a(n_1 + n_2 -2)\\t &\leq t_a(n_1 + n_2 -2)\\\lvert t \rvert &\geq t_{a/2}(n_1 + n_2 -2)\end{aligned}$
$\chi^2$ 检验法	$\begin{aligned}\sigma^2 \leq \sigma_0\\\sigma \geq \sigma_0\\\sigma = \sigma_0\\\ (\mu \text{未知})\end{aligned}$	$\begin{aligned}\sigma^2 > \sigma_0\\\sigma < \sigma_0\\\sigma \neq \sigma_0\end{aligned}$	$\chi^2 = \frac{(n-1)S^2}{\sigma_0^2}$	$\begin{aligned}\chi^2 &\geq \chi^a_a(n-1)\\\chi^2 &\leq \chi^2_{1-a}(n-1)\\\chi^2 \geq \chi^2_{a/2}(n-1) \quad &or \quad \chi^2 \leq \chi^2_{1-a/2}(n-1)\end{aligned}$
$F$ 检验法	$\begin{aligned}\sigma^2_1 &\leq \sigma^2_2\\\sigma^2_1 &\geq \sigma^2_2\\\sigma^2_1 &= \sigma^2_2\\(\mu_1, &\mu_2\text{未知})\end{aligned}$	$\begin{aligned}\sigma^2_1 &> \sigma^2_2\\\sigma^2_1 &< \sigma^2_2\\\sigma^2_1 &\neq \sigma^2_2\end{aligned}$	$F = \frac{S^2_1}{S^2_1}$	$\begin{aligned}F &\geq F_a(n_1 - 1, n_2 - 1)\\F &\leq F_{1-a}(n_1 - 1, n_2 - 1)\\F &\geq F_{a/2}(n_1 - 1, n_2 - 1)\\&\text{或}\\F &\leq F_{1 - a/2}(n_1 - 1, n_2 - 1)\end{aligned}$

            graph TD
            均值还是方差假设检验 --> 均值;
均值还是方差假设检验 --> 方差;
均值 --一个总体--> 一个总体均值的条件;
均值 --两个总体--> 两个总体均值的条件;
一个总体均值的条件 --方差已知--> Z检验法;
一个总体均值的条件 --方差未知--> t检验法;
两个总体均值的条件 --方差未知--> t检验法;
方差 --一个总体--> 一个总体方差的条件;
方差 --两个总体--> 两个总体方差的条件;
一个总体方差的条件 --方差,期望未知--> X检验法;
两个总体方差的条件 --方差,期望未知--> F检验法;

p值检验法

以上的方法都是临界值法，这里介绍 $p$ 值检验法
定义：假设检验问题的 $p$ 值是由检验统计量的样本观察值得出的原假设( $H_0$ )可被拒绝的最小显著性水平。

也就是如果 $p$ 计算出来比 $a$ 小的话，那么就

建立假设
确定统计量
计算出统计量 $C$
计算 $p$ $p$ 值
- $p = P(Z \geq z_0) = P(Z \geq C) = 1 - \Phi(C)$
- $p$ 值就是拒绝域上图形的面积大小
判断
- 拒绝： $a \geq p$
- 接受： $a < p$
单/双问题
- 单（比大小）： $p$ 值即单侧的图形的面积
- 双（比等于）： $p$ 值是单侧的面积 $\times 2$

非参数检验

符号检验

符号检验是一种使用正负号来检验不同假设的非参数检验

\begin{aligned} x &= \text{频率较小的符号出现的次数} \\ n &= \text{正负号合在一起的总数} \end{aligned}

检验统计量：

\begin{aligned} n \leq 25, & x(\text{频率较小的符号出现的次数}) \\ n > 25, & z = \frac{(x + 0.5) - (\frac{n}{2})}{\frac{\sqrt{n}}{2}} \end{aligned}

小于等于25的情况

使用二项分布，假设有10个数据

正负的分布次数有： $2^{10} = 1024$ $2^{10} = 1024$ 种
- 都是正： $C^0_10 = 1$
- 只有一个是正： $C^1_{10} = 10$
- 只有两个是正： $C^2_{10} = 45$
- 只有一个是负： $C^1_{10} = 10$
- 只有两个是负： $C^2_{10} = 45$

所以10个数值里，只有一个符号与其他符号不同的几率为 $\frac{1 + 10}{1024} + \frac{1 + 10}{1024} = \frac{22}{1024} \approx 0.02$ ，也就是P值。

威尔科克森符号秩检验

不需要要求正态纷纷不，只要求对称分布和中间值 $M_0$ 为分布的中心，检验成对观测数据之差是否来自均值为0的总体（产生数据的总体是否具有相同的均值）
原假设是：两配对样本来自的两总体的分布无显著差异

对 $i = 1, 2, \cdots, n$ ，计算 $|X_i - M_0|$ ，它们代表这些样本点到 $M_0$ 的距离
把上面的 $n$ $n$ 个绝对值排序，并找出它们的 $n$ $n$ 个秩
- 如果它们有相同的样本点，每个点取平均秩（如 $1, 4, 4, 5$ 的秩为 $1, 2.5, 2.5, 4$ ）
令
- $W^+$ 等于 $X_i - M_0 > 0$ 的 $|X_i - M_0|$ 的秩的和
- $W^-$ 等于 $X_i - M_0 < 0$ 的 $|X_i - M_0|$ 的秩的和
双边检验
- $H_0: M = M_0$
- $H_1: M \neq M_0$
- 某些时候在零假设下， $W^+$ 和 $W^-$ 相差不大，其中一个很小的时候，应换衣零假设，取检验统计量 $W = min(W^+, W^-)$
单边检验
- $H_0: M > M_0$
由中心极限定理： $W \sim N(\mu, \sigma) \leftrightarrow Z = \frac{W - \mu}{\sigma} \sim N(0, 1)$ $W \sim N (μ, σ) \leftrightarrow Z = \frac{W - μ}{σ} \sim N (0, 1)$
- 期待值： $E(W) = \mu = \frac{n(n + 1)}{4}$
- 方差： $Var(W) = \sigma = \frac{n(n + 1)(2n + 1)}{24}$

例子：

\begin{aligned} H_0: & M = 0 \\ H_0: & M \neq 0 \end{aligned}

$i$	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17
$x_i$	$5.8$	$0.1$	$1.9$	$2.5$	$5.7$	$1.2$	$4.2$	$8.0$	$7.9$	$2.3$	$0.9$	$5.5$	$3.3$	$7.2$	$1.5$	$5.4$	$3.1$
$R_i$	$14$	$1$	$5$	$7$	$13$	$3$	$10$	$17$	$16$	$6$	$2$	$12$	$9$	$15$	$4$	$11$	$8$
$\epsilon_i$	$1$	$1$	$1$	$0$	$1$	$0$	$1$	$1$	$1$	$0$	$1$	$1$	$1$	$0$	$1$	$0$	$1$

\begin{aligned} W &= \sum^n_{i=0} \epsilon_iR_i = 14 + 1 + 5 + 13 + 4 + 10 + 17 + 16 + 2 + 12 + 9 + 8 = 111 \\ \mu &= \frac{17(17 + 1)}{4} = 76.5 \\ \sigma^2 &= \frac{17(17 + 1)(2 * 17 + 1)}{24} \approx 446.25 \\ Z &= \frac{W - \mu}{\sigma} = \frac{111 - 76.5}{\sqrt{446.25}} \approx 1.633 \\ \\ P\text{值} &= 0.1024 (\text{双边检验}*2) \end{aligned}

威尔科克森秩和检验

推断连续型变量的两个独立样本代表的两个总体分布是否由差别，如下： $Y_i$ 的分布和 $X_i + \delta$ 的分布相同

对 $X_i, Y_i$ ，计算 $|X_i - M_0|$ 和 $|Y_i - M_0|$ ，它们代表这些样本点到 $M_0$ 的距离
把上面的 $n$ $n$ 个绝对值排序，并找出它们的 $n$ $n$ 个秩
- 如果它们有相同的样本点，每个点取平均秩（如 $1, 4, 4, 5$ 的秩为 $1, 2.5, 2.5, 4$ ）
假设分布
- $X_1, X_2, \cdots, X_m \sim F(x), i.i.d$
- $Y_1, Y_2, \cdots, Y_m \sim F(y - \delta), i.i.d$
假设
- $H_0: \delta = 0$
- $H_1: \delta \neq 0$
检验统计量： $W = \sum^n_{i=1} R_i$ ，（单纯 $Y_i$ 的秩的和）
由中心极限定理： $W \sim N(\mu, \sigma) \leftrightarrow Z = \frac{W - \mu}{\sigma} \sim N(0, 1)$ $W \sim N (μ, σ) \leftrightarrow Z = \frac{W - μ}{σ} \sim N (0, 1)$
- 期待值： $E(W) = \mu = \frac{n(m + n + 1)}{2}$
- 方差： $Var(W) = \sigma = \frac{mn(m + n + 1)}{12}$

例子：

设有数据

\begin{aligned} X &= [9.5, 13.9, 18.1, 19.9, 20.6, 21.5, 21.8, 22.1, 25.7, 27.9] \\ Y &= [14.7, 19.8, 21.3, 21.6, 21.7, 22.2, 22.4, 22.7, 24.6, 27.1, 27.0, 28.0, 29.3, 37.1] \end{aligned}

\begin{gathered} \mathbf{9.5}, \mathbf{13.9}, 14.7, \mathbf{18.1}, 19.8, \mathbf{19.9}, \mathbf{20.6}, 21.3, \mathbf{21.5}, 21.6, 21.7 \\ \mathbf{21.8}, \mathbf{22.1}, 22.2, 22.4, 22.7, 24.6, \mathbf{25.7}, 27.1, 27.0, \mathbf{27.9}, 28.0, 29.3, 37.1 \end{gathered}

计算

\begin{aligned} W &= \sum^n_{i=1}R_i = 1 + 2 + 4 + 6 + 7 + 9 + 12 + 13 + 18 + 21 = 93 \\ \mu &= \frac{10(14 + 10 + 1)}{2} = 125 \\ \sigma^2 &= \frac{14*10(14 + 10 + 1)}{2} \approx 291.67 \\ Z &= \frac{W - \mu}{\sigma} = \frac{93 - 125}{\sqrt{291.67}} \approx -1.8737 \\ \\ P\text{值} &= 0.0610 (\text{双边检验}*2) \end{aligned}

卡方检验

卡方检验的目标就是检查观测值的频数与期望频数之间的差异显著性。

卡方距离：
- 由于卡方检验的目标是检查观测频数与期望频数之间的差异性水平，因此卡方检验的核心内容就是计算出观测值的频数与期望频数总体差距的统计量
- 卡方值越大，表示距离越大，差异性越强。可以根据卡方值查表推导出卡方检验的概率值，然后根据概率值判定卡方检验的判断结论。
- $\chi^2 = \sum\frac{(X_i - E_i)}{E_i}$

拟合优度检验

卡方独立性检验

也叫独立性检验，是一种统计量的分布在零假设成立时近似服从卡方分布 $\chi^{2}$ 分布的假设检验
在卡方检验的一般运用中，研究人员将观察量的值划分成若干互斥的分类，并且使用一套理论（或零假设）尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。

列联表：测数据按两个或多个（定型变量）分类时所列出的频数表

	$A$	$B$	行和
$X$	$a_{11}$	$a_{12}$	$a_{11}+a_{12}$
$Y$	$a_{21}$	$a_{22}$	$a_{21}+a_{22}$
列和	$a_{11}+a_{21}$	$a_{12}+a_{22}$	$n$

列联表分析的基本问题：考察各属性之间有无关联，即判断两个属性是否独立

$p_{i\cdot}$ ：代表总体中个体仅属于 $X,Y$ 中一项的概率
$p_{\cdot j}$ ：代表总体中个体仅属于 $A,B$ 中一项的概率
$p_{ij}$ ：代表总体中个体仅属于 $X,Y$ 中一项且属于 $A,B$ 中一项的概率

$A, B$ 两属性独立的假设可以表述为

\begin{aligned} H_0&: p_{ij} = p_i \cdot p_j & \text{原假设} \\ H_1&: p_{ij} \neq p_i \cdot p_j & \text{备择假设} \end{aligned}

在原假设下，我们可以计算各个参数的极大似然估计值

\begin{aligned} \hat{p_{1\cdot}} &= \frac{a_{11}+a_{12}}{n} \\ \hat{p_{2\cdot}} &= \frac{a_{21}+a_{22}}{n} \\ \hat{p_{\cdot 1}} &= \frac{a_{11}+a_{21}}{n} \\ \hat{p_{\cdot 2}} &= \frac{a_{12}+a_{22}}{n} \end{aligned}

进而可以计算出 $n \hat{p_{ij}} = n\hat{p}_{i\cdot}\hat{p}_{\cdot j}$ ，即期待频数

\text{期待度数} = \frac{\text{列的周边度数}\times \text{行的周边度数}}{\text{全体的度数}}

然后可以计算出每一格的理论值

\begin{alignedat} n \hat{p}_{11} &= n \hat{p}_{1\cdot}\hat{p}_{\cdot 1} \\ n \hat{p}_{12} &= n \hat{p}_{1\cdot}\hat{p}_{\cdot 2} \\ n \hat{p}_{21} &= n \hat{p}_{2\cdot}\hat{p}_{\cdot 1} \\ n \hat{p}_{22} &= n \hat{p}_{2\cdot}\hat{p}_{\cdot 2} \end{alignedat}

记下表

	$A$	$B$	行和
$X$	$n \hat{p}_{11}$	$n \hat{p}_{12}$	$\hat{p_{1\cdot}}$
$Y$	$n \hat{p}_{21}$	$n \hat{p}_{22}$	$\hat{p_{2\cdot}}$
列和	$\hat{p_{\cdot 1}}$	$\hat{p_{\cdot 2}}$	$1$

如果它们之间是独立的，那么实际表格里的数据应该和上表相差不大，检验统计量的计算式子：

\chi^2 = \sum \frac{(\text{极大似然估计值} - \text{观测值})^2}{\text{极大似然估计值}}

这里行 $r = 2$ 和列 $c = 2$ ，自由度为 $(r-1) \times (c-1) = 1$ ，若 $a = 0.05$ ，查表有 $\chi^2_{0.95} = 3.84$

如果 $\chi^2 > 3.84$ ，与理论数值相差过大，则拒绝原假设 $H_0$ ，认为 $AB$ 和 $XY$ 有关系
如果 $\chi^2 <= 3.84$ ，与理论数值相差不大，则接受原假设 $H_0$ ，认为它们之间独立