点估计
设总体X的分布函数的形式已知,但它的一个或多个参数未知,借助于总体X的一个样本来估计总体未知参数的值的问题称为参数的点估计问题
点估计问题的一般提法如下:设
名称 |
值 |
总体X的分布函数 |
F(x;θ) |
X的一个样本 |
X1,X2,⋯,Xn |
相应的一个样本值 |
x1,x2,⋯,xn |
点估计问题就是要构造一个适当的统计量
θ^(X1,X2,⋯,Xn)
同它的客观值
θ^(x1,x2,⋯,xn)
作为未知参数θ的近似值,我们称θ^(X1,X2,⋯,Xn)为θ的估计量,称θ^(x1,x2,⋯,xn)为θ的估计值
一般,我们有2种点估计的方法
矩估计法
设X为连续型随机变量,其概率密度为
f(x;θ1,θ2,⋯,θn)
或X为离散型随机变量,其分布律为
P(X=x)=p(x;θ1,θ2,⋯,θn)
其中θ1,θ2,⋯,θn为待估计参数,X1,X2,⋯,Xn是来自X的样本,假设总体X的前k阶矩
{μ1μ1=E(Xl)=∫∞∞xlf(x;θ1,θ2,⋯,θn)dx=E(Xl)=∑x∈RXxlf(x;θ1,θ2,⋯,θn)连续型离散型
其中RX是X可能取值的范围,一般来说,他们是θ1,θ2,⋯,θn的函数,
- 基于样本矩依概率收敛与相应的总体矩μ1(l=1,2,⋯,k)
- 样本矩的连续函数以概率收敛于相应的总体矩的连续函数
Al=n1i=1∑nXil
- 就用样本矩作为相应的总体矩的估计量,
- 样本矩的连续函数作为相应的总体矩的连续函数的估计量
这种估计方法就是矩估计法
矩估计法的具体做法
待续
最大近然估计法
的目:就是利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值
设X1,X2,⋯,Xn是来自X的样本,则X1,X2,⋯,Xn的联合分布律
i=1∏np(xi,θ)
记x1,x2,⋯,xn是样本X1,X2,⋯,Xn的样本值,则取到这样一组观察值的概率为
f(x1∣θ)×f(x2∣θ)×⋯×f(xn∣θ)=i=1∏np(xi,θ)
记为L(θ),称作似然函数(这实际是个常数,一个概率)
- 因为是从样本观察值反推总体,x1,x2,⋯,xn都是已知的常数
- 我们取到了x1,x2,⋯,xn这样一组样本值,表明取到的概率L(θ)较大
- 对于θ可取的值里,如果θ0使得L(θ)取得最大值,我们就只考虑这个θ0
- 在θ可取的值Θ里,挑选一个使似然函数L(θ)达到最大的参数值θ^,作为参数θ的估计值
L(θ^)=θ∈ΘmaxL(θ)
- 最大似然估计值:θ^与x1,x2,⋯,xn有关,从而记为θ^(x1,x2,⋯,xn)
- 最大似然估计量:θ^(X1,X2,⋯,Xn)
似然函数
对于离散型和连续型随机变量,极大似然估计值θ^都满足:
L(θ^)=maxL(θ)
- 离散型随机变量:L(θ)=∏i=1NP(xi)
- 连续型随机变量:L(θ)=∏i=1Nf(xi)
确定最大似然估计量
通过上面的似然函数,可以把确定最大似然估计量的问题转化为微积分中求最大值的问题
在很多情况下,p(x:θ)和f(x:θ)关于θ可微
dθdL(θ)
解得,又因L(θ)与lnL(θ)在同一个θ的地方取得极值,因此,θ的最大似然估计θ可以从方程
dθdlnL(θ)=0
求出,称为对数似然方程
一般来说,确定最大似然估计量分为4个步骤
step1. 确定分布律/分布函数P
step2. 计算L(p)=∏i=inP
step3. 计算lnL(p)
step4. 计算dpdlnL(p)=0,解出p
估计量的评选标准
对于用不同估计方法求出的估计量,我们希望知道采用哪一个估计量更好,对此,我们有3个性质来确定
无偏性
设X1,X2,⋯,Xn时总体X的一个样本,θ∈Θ时包含在总体X的分布中的待估参数,Θ是θ的取值范围
无偏性:若估计量θ^=θ^(X1,X2,⋯,Xn)的数学期望E(θ^)存在,且∀θ∈Θ有
E(θ^)=θ
则称θ^是θ的无偏估计量
无偏性:估计量可能偏大偏小,反复将这一估计量使用多次,就"平均"来说其偏差为零
无论总体服从什么分布
- 样本均值X是总体均值μ的无偏估计
- 样本方差S2=n−11∑i=1n(XI−X)2是总体方差的无偏估计
有效性
假设有θ^1和θ^2两个估计量,如果θ^1的观察值较θ^2更密集在真值θ的附加,则认为θ^1较θ^2为理想
有效性:设θ^1=θ^1(X1,X2,⋯,Xn)与θ^2=θ^2(X1,X2,⋯,Xn)都是θ的无偏估计量,若∀θ∈Θ,有
D(θ^1)≤D(θ^)2
且至少对于某一个θ∈Θ上式成立,则称θ^1较θ^2有效
相合性
假设样本容量不固定,我们希望估计量随着样本容量的增大,其值稳定于待估参数的真值。
相合性:设θ^=θ^(X1,X2,⋯,Xn)为参数θ的估计量,若对于任意θ∈Θ,当n→∞时θ^(X1,X2,⋯,Xn)依概率收敛于θ,则称θ^为θ的相合估计量
n→∞limP(∣θ^−θ∣<ε)=1.∀ε>0
区间估计
对于一个未知量,我们在测量或者计算的时候,还需要估计它的误差,需要知道真值所在的范围,类似的,对于未知参数θ除了求出它的点估计θ^外,我们还希望求出一个范围,并且知道这个范围包含参数θ真值的可信程度,这样的范围称为区间估计
置信区间
设总体X的分布函数F(x:θ)含有一个未知参数θ,对于给定值a,a∈(0,1),若来自X的样本
X1,X2,⋯,Xn
确定的两个统计量θ<θ
θθ=θ(X1,X2,⋯,Xn)=θ(X1,X2,⋯,Xn)
对于任意θ满足
P(θ<θ<θ)≥1−a
则称随机区间
(θ,θ)
是θ的置信水平为1−a的置信区间,θ和θ分别称为置信水平为1−a的双侧置信区间的置信下限和置信上限,1−a称为置信水平。(这里的a不是假设检验里面a)
对于X是连续型随机变量时,对于给定的a,我们可以求出置信区间
但是当X是离散型随机变量时,对于给定的a,常常找不到一个区间使得置信区间恰好为1−a,此时我们需要找置信区间至少为1−a且尽可能的接近。
设总体X∼N(μ,σ2),σ2为已知,μ为未知,设
X1,X2,⋯,Xn
是来自X的样本,求μ的置信水平为1−a的置信区间。
解:我们知道X是μ的无偏估计,且
σ/nX−μ∼N(0,1)
σ/nX−μ所服从的分布N(0,1)不依赖于任何未知参数,按照标准正态分布的上a分位点的定义,有
P(∣σ/nX−μ∣<za/2)=1−a
也就是
P(∣X−nσza/2∣<μ<∣X+nσza/2∣)=1−a
于是就有了μ的这么一个置信水平为1−a的置信区间
(X−nσza/2,X+nσza/2)
例子:取1−a=0.95,σ=1,n=16,得za/2=z0.025=1.96,那么区间就是
(X−161×1.96,X+161×1.96)
其含义为:μ的真值在区间(X−1611.96,X+1611.96)的概率是95%
双侧置信区间
正态总体均值与方差的区间估计
单个总体
总体:N(μ,σ2)
样本:X1,X2,⋯,Xn
置信水平:1−a
样本均值,方差:X,S2
单个总体均值的置信区间
σ2已知,采用枢轴量S/nX−μ,则置信区间为:(X±nσza/2)
σ2未知,利用σ2的无偏估计S2,利用抽样分布的定理S/nX−μ∼t(n−1),这里t(n−1)分布不依赖其他任何未知参数,即可得
P(−ta/2(n−1)<S/nX−μ<ta/2(n−1))=1−a
化简可得
P(X−nSta/2(n−1)<μ<X+nSta/2(n−1))
得到μ的这么一个置信水平为1−a的置信区间
(X±nSta/2(n−1))
单个总体方差的置信区间
μ2未知,利用σ2的无偏估计S2,利用抽样分布的定理σ2(n−1)S2∼χ2(n−1),这里χ2(n−1)分布不依赖其他任何未知参数,枢轴量为σ2(n−1)S2,即可得
P(χ1−a/22(n−1)<σ2(n−1)S2<χa/22(n−1))=1−a
化简可得
P(χa/22(n−1)(n−1)S2<σ2<χ1−a/22(n−1)(n−1)S2)
得到σ2的这么一个置信水平为1−a的置信区间
(χa/22(n−1)(n−1)S2,χ1−a/22(n−1)(n−1)S2)
单个总体置信区间总结
graph TD
是求均值还是方差置信区间 --均值--> 方差是否已知;
是求均值还是方差置信区间 --方差--> 均值是否已知;
方差是否已知 --以知--> 正态分布;
方差是否已知 --未知--> t分布;
均值是否已知 --未知--> x分布;
两个总体
总体:N(μ1,σ12),N(μ2,σ22)
样本:X1,X2,⋯,Xn和Y1,Y2,⋯,Yn
置信水平:1−a
样本均值,方差:X,S12和Y,S22
两个总体方差均值之差的置信区间
σ12,σ22已知,因X,Y分别为μ1,μ2的无偏估计,所以X−Y是μ1−μ2的无偏估计,根据X,Y的独立性,计算出期望和方差,按照单个总体的的步骤,得
X−Y∼N(μ1−μ2,n1σ12+n2σ22)
进行标准化
n1σ12+n2σ22(X−Y)−(μ1−μ2)∼N(0,1)
取n1σ12+n2σ22(X−Y)−(μ1−μ2)作为枢轴量,得到u1−u2的置信水平1−a置信区间
(X−Y±za/2n1σ12+n2σ22)
σ12=σ22=σ2,但是σ2未知,利用抽样分布的定理S/nX−μ∼t(n−1),这里t(n−1)分布不依赖其他任何未知参数,即可得
Swn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)
取Swn11+n21(X−Y)−(μ1−μ2)作为枢轴量,得到u1−u2的置信水平1−a置信区间
(X−Y±ta/2(n1+n2−2)Swn11+n21)
这里
Sw2=n1+n2−2(n1−1)S12+(n2−1)S22,Sw=Sw2
两个总体方差方差之比的置信区间
μ1,μ2未知,利用σ2的无偏估计S2,利用抽样分布的定理σ12/σ22S12/S22∼F(n1−1,n2−1),这里F(n1−1,n2−1)分布不依赖其他任何未知参数,枢轴量为σ12/σ22S12/S22,即可得
P(F1−a/2(n1−1,n2−1)<σ12/σ22S12/S22<Fa/2(n1−1,n2−1))=1−a
即
P(S22S12Fa/2(n1−1,n2−1)1<σ22σ12<S22S12F1−a/2(n1−1,n2−1)1)=1−a
得到σ12/σ22的这么一个置信水平为1−a的置信区间
(S22S12Fa/2(n1−1,n2−1)1,S22S12F1−a/2(n1−1,n2−1)1)
两个总体置信区间总结
graph TD
是求均值还是方差置信区间 --均值--> 方差是否已知;
是求均值还是方差置信区间 --方差--> 均值是否已知;
方差是否已知 --以知--> 正态分布;
方差是否已知 --未知,但相等--> t分布;
均值是否已知 --未知--> f分布;
单侧置信区间
在上面,对于未知参数θ,我们给出2个统计量θ,θ,得到θ的双侧置信区间(θ,θ),但是在某些实际问题中,我们关心的只是θ的下限或上限,于是就有了单侧置信区间
对于给定值a,a∈(0,1),若来自X的样本
X1,X2,⋯,Xn
确定的统计量θ,对于任意θ满足
P(θ<θ)≥1−a
称随机区间(θ,∞)是θ的置信水平为1−a的单侧置信区间,θ称为θ的置信水平为1−a的单侧置信下限
若统计量θ,对于任意θ满足
P(θ<θ)≤1−a
称随机区间(−∞,θ)是θ的置信水平为1−a的单侧置信区间,θ称为θ的置信水平为1−a的单侧置信上限
0-1分布参数的区间估计
设样本来自X∼0−1(p)分布的总体X,X的分布律为
f(x;p)=px(1−p)1−x,x=0,1
p为未知参数,求p的置信水平为1−a的置信区间
- 均值:u=p
- 方差:σ2=p(1−p)
设X1,X2,⋯,Xn是一个样本,由中心极限定理知
np(1−p)∑i=1nXi−np=np(1−p)xX−np
近似的服从正态分布,于是可以得到
P(−za/2<np(1−p)xX−np<za/2)≈1−a
不等式等价于
(n+za/22)p2−(2nX+za/22)p+nX2<0
得区间为
(2a1(−b−b2−4ac),2a1(−b+b2−4ac))
{a=n+za/22b=−(2nX+za/22)