在总体的分布函数完全未知或只知其形式,但不知道参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设。最常见的比如,有一组数据,这数据是某机器生产出来的产品的数据,假设机器的误差范围在0.1,那么通过假设检验可以判断机器是否在正常工作。
我们要根据样本对正态总体所提出假设做出是接受,还是拒绝的决策。
检验问题
对于假设检验问题,一般会有2个相反的假设
H0H1:μ=μ0:μ=μ0原假设备择假设
- 检验的是总体均值μ,利用样本均值X统计量进行判断
- X是μ的无偏估计,X的观察值x的大小在一定程度上反映μ的大小。
如果假设H0为真,则观察值x与μ0的偏差不应该太大,如果∣x−u0∣过大,就怀疑假设H0的正确性而拒绝H0,如果H0为真时,则σ/nX−μ0∼N(0,1),衡量∣x−u0∣的大小可以转为衡量σ/nX−μ0
- 选定一正数k
- 观察值x满足σ/nX−μ0≥k:拒绝假设H0
- 观察值x满足σ/nX−μ0<k:接受假设H0
但是这样可能在H0为真时拒绝H0(一定概率弃真),也就是在H0为真的时候,在拒绝域之内。即
P(假设为真时拒绝)=P(∣σ/nX−μ0∣≥k)=a
当H0为真的时候Z=σ/nX−μ0∼N(0,1),这样,只允许犯错的概率最大为a,也就是上图的阴影部分,从而可以决定k,即
k=za/2
因此,Z的观察值满足
- ∣z∣=∣σ/nx−μ0∣≥k=za/2:拒绝H0
- ∣z∣=∣σ/nx−μ0∣<k=za/2:接受H0
通俗的讲就是x−μ0太大了,而且几乎只有a的可能性这么大,于是选择拒绝
但是如果没有那么大,我们也就没有什么证据去拒绝,就只能接受了
这里∣z∣=∣σ/nx−μ0∣计算的值是坐标,然后通过a/2去查表,查到za/2的值,然后对比大小
除了上面的弃真错误,我们还可能在假设为假的时候接受,也就是当满足H1的时候,在拒绝域之外。即
P(假设为假时接受)=β
为了尽可能的减少犯错,但是在样本容量固定的时候
- 减少一类错误的概率,往往会增大另外一类的错误的概率
- 要使犯两类错误的概率都减少,需要增加样本容量(毕竟可以用作判断的数据更多了)
检验分类:
- 显著性检验:控制第I类错误的概率,不考虑犯第二类错误的概率
- 右边检验:关心总体均值是否增大
H0H0:μ≤μ0:μ>μ0
H0H0:μ≥μ0:μ<μ0
原假设:H0
备择假设:H1
拒绝域:拒绝H0时,统计量所在的区域
临界点:拒绝域的边界点za/2
犯错概率
|
接受H0 |
拒绝H0 |
H0为真 |
1−a |
一类错误a |
H0为假 |
二类错误β |
1−β |
假设以下假设检验问题的拒绝域是x≥c,样本数量是n
H0H1:μ=μ0:μ=μ1
则
aβ=P(x≥c∣H0)=P(σ/nx−μ0≥σ/nc−μ0)=P(x<c∣H1)=P(σ/nx−μ1<σ/nc−μ1)
即
aβ=P(x∈拒绝域∣H0)=P(x∈/拒绝域∣H1)
如果要增加样本数量n,使犯错的概率低于一定数值c,则
a=1−Φ(σ/nμ0)≤cβ=1−Φ(σ/nμ1)≤c
假设的建立
- u=u0
- u>u0
- u<u0
对于上面3种情况
- 是对是不是u0进行检定(两边各2.5%)
- 是对是不是比u0多进行检定,对于少于u0的情况不考虑(右边5%)
- 是对是不是比u0少进行检定,对于多于u0的情况不考虑(左边5%)
- 简单假设
- H0:u=u0↔H1:u=u1
- 双侧假设:对立假设是双侧的
- H0:u=u0↔H1:u=u1
- 单侧假设:对立假设是单侧的
- H0:u=u0↔H1:u>u0
- H0:u=u0↔H1:u<u0
- H0:u≤u0↔H1:u>u0
- H0:u≥u0↔H1:u<u0
也就是是否是单双侧和H0无关,只和H1有关
正态总体均值的假设检验
单个正态总体均值差的检验
Z检验法
条件:σ2已知,关于μ的检验
H0H1:μ=μ0:μ=μ0原假设备择假设
σ/nX−μ0∼N(0,1)
Z=σ/nX−μ0
P(假设为真时拒绝)P(假设为真时拒绝)≤a=P(∣σ/nX−μ0∣≥k)=a
k=za/2
∣z∣=∣σ/nx−μ0∣≥k=za/2
∣z∣=∣σ/nx−μ0∣<k=za/2
Z右边检验法
条件:σ2已知,关于μ的检验
H0H0:μ≤μ0:μ>μ0
σ/nX−μ0∼N(0,1)
Z=σ/nX−μ0
P(假设为真时拒绝)P(假设为真时拒绝)P(假设为真时拒绝)≤a=P(X≥k)=P(σ/nX−μ0≥σ/nk−μ0)≤P(σ/nX−μ≥σ/nk−μ0)
P(σ/nX−μ≥σ/nk−μ0)=a
k=μ0+nσza
xz≥k=μ0+nσza⇓=σ/nx−μ0≥za
Z左边检验法
条件:σ2已知,关于μ的检验
xz≤k=μ0−nσza⇓=σ/nx−μ0≤−za
t检验法
条件:σ2未知,关于μ的检验
H0:H1:μ=μ0μ=μ0
t=S/nX−μ0
σ/nX−μ0σ→S/nX−μ0∼t(n−1)→S=n−1∑i=1n(xi−x)2
P(假设为真时拒绝)P(假设为真时拒绝)≤a=P(∣S/nX−μ0∣≥k)=a
k=ta/2(n−1)
∣t∣=∣s/nx−μ0∣≥k=ta/2(n−1)
两个正态总体均值差的检验
以上都是对一个正态总体进行检验,我们同样可以对具有相同的方差的两正态总体均值差的假设进行检验,设
X1,X2,⋯,XnY1,Y2,⋯,Yn
分布是来此正态总体N(μ1,σ2),N(μ2,σ2)的样本,且两样本独立,分别设他们的样本均值为X,Y,样本方差S12,S22
t检验法(2)
条件:方差相等,但σ2未知,关于μ的检验
H0:H1:μ1−μ2=δμ1−μ2=δ
不过通常情况下都是δ=0的情况
t=Swn11+n21(X−Y)−δ
其中
Sw2=n1+n2−2(n1−1)S12+(n2−1)S22=(n1−1)+(n2−1)∑i=1n1(Xi−X)2+∑i=1n2(Yi−Y)2
Swn11+n21(X−Y)−δ∼ta/2(n1+n2−2)
P(假设为真时拒绝)P(假设为真时拒绝)≤a=P(∣Swn11+n21(x−y)−δ∣≥k)=a
ta/2(n1+n2−2)
∣t∣=∣Swn11+n21(x−y)−δ∣≥ta/2(n1+n2−2)
其本质和单个变量的t检验是一样的,只是把对应的统计量换为2个变量的时候罢了
|
单个 |
2个 |
离差(分子) |
X−μ0 |
(X−Y)−(μ1−μ2) |
方差无偏估计 |
n−1∑i=1n(xi−x)2 |
(n1−1)+(n2−1)∑i=1n1(Xi−X)2+∑i=1n2(Yi−Y)2 |
分母 |
Sn1 |
Swn11+n21 |
自由度 |
n−1 |
(n1−1)+(n2−1) |
正态总体方差的假设检验
一个正态总体均值差的检验
σ02为已知常数,取显著性水平为a,由于S2是σ2的无偏估计,当H0为真的时候,观察值s2与σ02的比值σ02s2一般来说在1附件浮动
X检验法
条件:σ2,μ未知,关于σ的检验
H0:H1:σ2=σ02σ2=σ02
χ2=σ02(n−1)S2
σ02(n−1)S2∼χ2(n−1)
P(假设为真时拒绝)=P((σ02(n−1)S2≤k1)∪(σ02(n−1)S2≥k2))=a
为了更好的计算,一般取
P((σ02(n−1)S2≤k1))=2aP((σ02(n−1)S2≥k2))=2a
k1k2=χ1−a/22(n−1)=χa/22(n−1)
σ02(n−1)S2σ02(n−1)S2≤χ1−a/22(n−1)≥χa/22(n−1)
右边检验问题
因H0中的完全σ2都比H1中的σ2要小,当H1为真的时,S2的观察值s2往往偏大
条件:σ2,μ未知,关于σ的检验
H0:H1:σ2≤σ02σ2>σ02
σ2(n−1)S2
σ2(n−1)S2∼χ2(n−1)
P(假设为真时拒绝)=P(S2≥k)=P(σ02(n−1)S2≥σ02(n−1)k)≤P(σ2(n−1)S2≥σ02(n−1)k)
P(σ2(n−1)S2≥σ02(n−1)k)=a
k=n−1σ02χa2(n−1)
s2≥k
s2≥n−1σ02χa2(n−1)
即
χ2=σ02(n−1)s2≥χa2(n−1)
左边检验问题
H0:H1:σ2≥σ02σ2<σ02
可得拒绝域
χ2=σ02(n−1)s2≤χ1−a2(n−1)
两个正态总体方差比的检验
F检验
条件:σ12,σ22,μ1,μ2未知,关于S22S12的检验
H0:H1:σ12≤σ22σ12>σ22
s22s12
σ12/σ22S12/S22∼F(n1−1,n2−1)
P(假设为真时拒绝)=P(S22S12≥k)≤P(σ12/σ22S12/S22≥k)=a(因为σ12/σ22≤1)
k=Fa(n1−1,n2−1)
F=s22s12≥Fa(n1,n2−1)
总结
假设检验的本质:小概率事件原理。
再多解释下,就是"在你的假设下,这事件发生的概率太低了,我根本就不相信!“或者是"在你的假设下,这事件发生的概率不算低,我没理由拒绝你的假设,只好姑且相信。”
名称 |
原假设H0 |
备择假设H1 |
检验统计量 |
拒绝域 |
Z检验法 |
μ≤μ0μ≥μ0μ=μ0 |
μ>μ0μ<μ0μ=μ0 |
Z=σ/nX−μ0 |
zz∣z∣≥za≤−za≥za/2 |
t检验法 |
μ≤μ0μ≥μ0μ=μ0 (σ2未知) |
μ>μ0μ<μ0μ=μ0 |
t=S/nX−μ0 |
tt∣t∣≥ta(n−1)≤−ta(n−1)≥ta−2(n−1) |
Z检验法(2) |
μ1−μ2≤μ0μ1−μ2≥μ0μ1−μ2=μ0 (σ12,σ22已知) |
μ1−μ2>μ0μ1−μ2<μ0μ1−μ2=μ0 |
Z=n1σ12+n2σ22(X−Y)−δ |
zz∣z∣≥za≤−za≥za/2 |
t检验法(2) |
μ1−μ2≤μ0μ1−μ2≥μ0μ1−μ2=μ0 (σ12=σ22未知) |
μ1−μ2>μ0μ1−μ2<μ0μ1−μ2=μ0 |
tSw2=Swn11+n21(X−Y)−δ=(n−1)+(m−1)∑i=1n(Xi−X)2+∑i=1n(Yi−Y)2 |
tt∣t∣≥ta(n1+n2−2)≤ta(n1+n2−2)≥ta/2(n1+n2−2) |
χ2检验法 |
σ2≤σ0σ≥σ0σ=σ0 (μ未知) |
σ2>σ0σ<σ0σ=σ0 |
χ2=σ02(n−1)S2 |
χ2χ2χ2≥χa/22(n−1)≥χaa(n−1)≤χ1−a2(n−1)orχ2≤χ1−a/22(n−1) |
F检验法 |
σ12σ12σ12(μ1,≤σ22≥σ22=σ22μ2未知) |
σ12σ12σ12>σ22<σ22=σ22 |
F=S12S12 |
FFFF≥Fa(n1−1,n2−1)≤F1−a(n1−1,n2−1)≥Fa/2(n1−1,n2−1)或≤F1−a/2(n1−1,n2−1) |
graph TD
均值还是方差假设检验 --> 均值;
均值还是方差假设检验 --> 方差;
均值 --一个总体--> 一个总体均值的条件;
均值 --两个总体--> 两个总体均值的条件;
一个总体均值的条件 --方差已知--> Z检验法;
一个总体均值的条件 --方差未知--> t检验法;
两个总体均值的条件 --方差未知--> t检验法;
方差 --一个总体--> 一个总体方差的条件;
方差 --两个总体--> 两个总体方差的条件;
一个总体方差的条件 --方差,期望未知--> X检验法;
两个总体方差的条件 --方差,期望未知--> F检验法;
p值检验法
以上的方法都是临界值法,这里介绍p值检验法
定义:假设检验问题的p值是由检验统计量的样本观察值得出的原假设(H0)可被拒绝的最小显著性水平。
也就是如果p计算出来比a小的话,那么就
- 建立假设
- 确定统计量
- 计算出统计量C
- 计算p值
- p=P(Z≥z0)=P(Z≥C)=1−Φ(C)
- p值就是拒绝域上图形的面积大小
- 判断
- 拒绝:a≥p
- 接受:a<p
- 单/双问题
- 单(比大小):p值即单侧的图形的面积
- 双(比等于):p值是单侧的面积×2
非参数检验
符号检验
符号检验是一种使用正负号来检验不同假设的非参数检验
xn=频率较小的符号出现的次数=正负号合在一起的总数
检验统计量:
n≤25,n>25,x(频率较小的符号出现的次数)z=2n(x+0.5)−(2n)
小于等于25的情况
使用二项分布,假设有10个数据
- 正负的分布次数有:210=1024种
- 都是正:C100=1
- 只有一个是正:C101=10
- 只有两个是正:C102=45
- 只有一个是负:C101=10
- 只有两个是负:C102=45
所以10个数值里,只有一个符号与其他符号不同的几率为10241+10+10241+10=102422≈0.02,也就是P值。
威尔科克森符号秩检验
不需要要求正态纷纷不,只要求对称分布和中间值M0为分布的中心,检验成对观测数据之差是否来自均值为0的总体(产生数据的总体是否具有相同的均值)
原假设是:两配对样本来自的两总体的分布无显著差异
- 对i=1,2,⋯,n,计算∣Xi−M0∣,它们代表这些样本点到M0的距离
- 把上面的n个绝对值排序,并找出它们的n个秩
- 如果它们有相同的样本点,每个点取平均秩(如1,4,4,5的秩为1,2.5,2.5,4)
- 令
- W+等于Xi−M0>0的∣Xi−M0∣的秩的和
- W−等于Xi−M0<0的∣Xi−M0∣的秩的和
- 双边检验
- H0:M=M0
- H1:M=M0
- 某些时候在零假设下,W+和W−相差不大,其中一个很小的时候,应换衣零假设,取检验统计量W=min(W+,W−)
- 单边检验
- H0:M>M0
- 由中心极限定理:W∼N(μ,σ)↔Z=σW−μ∼N(0,1)
- 期待值:E(W)=μ=4n(n+1)
- 方差:Var(W)=σ=24n(n+1)(2n+1)
例子:
H0:H0:M=0M=0
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
xi |
5.8 |
0.1 |
1.9 |
2.5 |
5.7 |
1.2 |
4.2 |
8.0 |
7.9 |
2.3 |
0.9 |
5.5 |
3.3 |
7.2 |
1.5 |
5.4 |
3.1 |
Ri |
14 |
1 |
5 |
7 |
13 |
3 |
10 |
17 |
16 |
6 |
2 |
12 |
9 |
15 |
4 |
11 |
8 |
ϵi |
1 |
1 |
1 |
0 |
1 |
0 |
1 |
1 |
1 |
0 |
1 |
1 |
1 |
0 |
1 |
0 |
1 |
Wμσ2ZP值=i=0∑nϵiRi=14+1+5+13+4+10+17+16+2+12+9+8=111=417(17+1)=76.5=2417(17+1)(2∗17+1)≈446.25=σW−μ=446.25111−76.5≈1.633=0.1024(双边检验∗2)
威尔科克森秩和检验
推断连续型变量的两个独立样本代表的两个总体分布是否由差别,如下:Yi的分布和Xi+δ的分布相同
- 对Xi,Yi,计算∣Xi−M0∣和∣Yi−M0∣,它们代表这些样本点到M0的距离
- 把上面的n个绝对值排序,并找出它们的n个秩
- 如果它们有相同的样本点,每个点取平均秩(如1,4,4,5的秩为1,2.5,2.5,4)
- 假设分布
- X1,X2,⋯,Xm∼F(x),i.i.d
- Y1,Y2,⋯,Ym∼F(y−δ),i.i.d
- 假设
- H0:δ=0
- H1:δ=0
- 检验统计量:W=∑i=1nRi,(单纯Yi的秩的和)
- 由中心极限定理:W∼N(μ,σ)↔Z=σW−μ∼N(0,1)
- 期待值:E(W)=μ=2n(m+n+1)
- 方差:Var(W)=σ=12mn(m+n+1)
例子:
设有数据
XY=[9.5,13.9,18.1,19.9,20.6,21.5,21.8,22.1,25.7,27.9]=[14.7,19.8,21.3,21.6,21.7,22.2,22.4,22.7,24.6,27.1,27.0,28.0,29.3,37.1]
9.5,13.9,14.7,18.1,19.8,19.9,20.6,21.3,21.5,21.6,21.721.8,22.1,22.2,22.4,22.7,24.6,25.7,27.1,27.0,27.9,28.0,29.3,37.1
计算
Wμσ2ZP值=i=1∑nRi=1+2+4+6+7+9+12+13+18+21=93=210(14+10+1)=125=214∗10(14+10+1)≈291.67=σW−μ=291.6793−125≈−1.8737=0.0610(双边检验∗2)
卡方检验
卡方检验的目标就是检查观测值的频数与期望频数之间的差异显著性。
- 卡方距离:
- 由于卡方检验的目标是检查观测频数与期望频数之间的差异性水平,因此卡方检验的核心内容就是计算出观测值的频数与期望频数总体差距的统计量
- 卡方值越大,表示距离越大,差异性越强。可以根据卡方值查表推导出卡方检验的概率值,然后根据概率值判定卡方检验的判断结论。
- χ2=∑Ei(Xi−Ei)
拟合优度检验
卡方独立性检验
也叫独立性检验,是一种统计量的分布在零假设成立时近似服从卡方分布χ2分布的假设检验
在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。
- 列联表:测数据按两个或多个(定型变量)分类时所列出的频数表
|
A |
B |
行和 |
X |
a11 |
a12 |
a11+a12 |
Y |
a21 |
a22 |
a21+a22 |
列和 |
a11+a21 |
a12+a22 |
n |
列联表分析的基本问题:考察各属性之间有无关联,即判断两个属性是否独立
- pi⋅:代表总体中个体仅属于X,Y中一项的概率
- p⋅j:代表总体中个体仅属于A,B中一项的概率
- pij:代表总体中个体仅属于X,Y中一项且属于A,B中一项的概率
A,B两属性独立的假设可以表述为
H0H1:pij=pi⋅pj:pij=pi⋅pj原假设备择假设
在原假设下,我们可以计算各个参数的极大似然估计值
p1⋅^p2⋅^p⋅1^p⋅2^=na11+a12=na21+a22=na11+a21=na12+a22
进而可以计算出npij^=np^i⋅p^⋅j,即期待频数
期待度数=全体的度数列的周边度数×行的周边度数
然后可以计算出每一格的理论值
p^11np^12np^21np^22=np^1⋅p^⋅1=np^1⋅p^⋅2=np^2⋅p^⋅1=np^2⋅p^⋅2
记下表
|
A |
B |
行和 |
X |
np^11 |
np^12 |
p1⋅^ |
Y |
np^21 |
np^22 |
p2⋅^ |
列和 |
p⋅1^ |
p⋅2^ |
1 |
如果它们之间是独立的,那么实际表格里的数据应该和上表相差不大,检验统计量的计算式子:
χ2=∑极大似然估计值(极大似然估计值−观测值)2
这里行r=2和列c=2,自由度为(r−1)×(c−1)=1,若a=0.05,查表有χ0.952=3.84
- 如果χ2>3.84,与理论数值相差过大,则拒绝原假设H0,认为AB和XY有关系
- 如果χ2<=3.84,与理论数值相差不大,则接受原假设H0,认为它们之间独立