数学期望
离散型随机变量
设离散型随机变量X的分布律为
P(X=xk)=pkk=1,2,⋯
若级数
k=1∑∞xkpk
绝对收敛,则称级数∑k=1∞xkpk为随机变量X的数学期望,记为E(X)
连续型随机变量
设连续型随机变量的概率密度函数为
f(x)
若积分
∫−∞∞xf(x)dx
绝对收敛,则称积分∫∞∞xf(x)dx为随机变量X的数学期望,记为E(X)
数学期望的性质
- E(c)=c
- E(cX)=cE(X)
- E(X+Y)=E(X)+E(Y)
- E(XY)=E(X)E(Y)X,Y相互独立
- 设Y是随机变量X的函数Y=g(X)(g是连续函数),则有
- X是离散型:E(Y)=E(g(X))=∑k=1∞g(xk)pk
- X是连续型:E(Y)=E(g(X))=∫∞∞g(x)f(x)dx
条件期望的性质
- E[a∣Y]=a
- E[aX+bZ∣Y]=aE[X∣Y]+bE[Z∣Y]
- E[X∣Y]=E[X](独立)
- E[E[X∣Y]]=E[X]
- E[Xg(Y)∣Y]=g(Y)E[X∣Y]
- E[X∣Y,g(Y)]=E[X∣Y]
- E[E[X∣Y,Z]]=E[X∣Y]
期待频数
期待度数=全体的度数列的周边度数×行的周边度数
离差
定义:X−E(X)
方差
设X是一个随机变量,若E((X−E(X))2)存在,则称
D(X)=E((X−E(X))2)
为随机变量X的方差,记为D(X)或Var(X)
方差 - 离散型随机变量
D(X)=k=1∑∞[xk−E(X)]2pk
方差 - 连续型随机变量
D(X)=∫−∞∞[x−E(X)]2f(x)dx
方差的性质
- D(c)=0
- D(cX)=c2D(x)
- D(X)=E(X2)−E(X)2
- D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
条件方差的性质
- Var[Y∣X]=E[Y−E[Y∣X]2∣X]
- E[Var[Y∣X]]=E[E[Y2∣X]]−E[E[Y∣X]2]=E[Y2]−E[E[Y∣X]2]
- Var[E[Y∣X]]=E[E[Y∣X]2]−E[E[Y∣X]]2=E[E[Y∣X]2]−E[Y]2
- E[Var[Y∣X]]+Var[E[Y∣X]]=E[Y2]−E[Y]2=Var[Y]
标准差(均方差)
σ(X)=D(X)=N1i=1∑N(xi−μ)2
- σ(X+c)=σ(X)
- σ(cX)=c⋅σ(X)
- σ(X+Y)=σ2(X)+σ2(Y)+2Cov(X,Y)
协方差
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=n−1∑i=1n(Xi−X)(Yi−Y)
协方差的意义
- Cov(X,Y)>0,正相关
- Cov(X,Y)<0,负相关
- Cov(X,Y)=0,不相关
协方差的计算
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY−XE(Y)−YE(X)+E(X)+E(Y))=E(XY)−E(X)E(Y)−E(Y)E(X)+E(X)E(Y)=E(XY)−E(X)E(Y)
协方差的性质
- Cov(aX,bY)=abCov(X,Y),a,b是常数
- Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
- Cov(X,X)=E(X2)−E(X)2=D(X)
相关系数
表示2个随机变量之间线性相关密切程度的特征数
ρXY=D(X)D(Y)Cov(X,Y)=∑i=1n(xi−x)2∑i=1n(yi−y)2∑i=1n(xi−x)(yi−y)
相关系数的意义
- ρXY较大时,X,Y的线性关系程度较好
- ρXY较小时,X,Y的线性关系程度较差
- ρXY=1,X,Y为严格线性关系
- ρXY=0,X,Y没有线性关系
相关系数的性质
- ∣ρXY∣≤1
- ∣ρXY∣=1⇔P(Y=a+bX)=1
- ρXY=0→X,Y不相关(相互独立)
偏相关系数
在多要素构成的系统中,研究某一个要素对另外一个要素的影响或相关程度,把其他要素的影响视作常数,单独研究两个要素直接按的相互关系的密切程度,其数值即为偏相关系数
例:
- 因素:x,y,z
- ρxy:x,y相关系数
- ρyz:y,z相关系数
- ρxz:x,z相关系数
- 求:除去z影响的x,y的偏相关系数ρxy⋅z
ρxy⋅z=1−rxz21−ryz2ρxy−ρxzryz
其性质和相关系数一样
假设两个对同一因素的线性回归模型的残差分别为e1,e2,则除去这一因素的相关系数(即偏相关系数)为两残差的相关系数
Spearman相关系数
i |
xi |
yi |
转换 |
Rix |
Riy |
1 |
1 |
1 |
→ |
1.5 |
1.5 |
2 |
1 |
2 |
→ |
1.5 |
3.5 |
3 |
2 |
1 |
→ |
3.5 |
1.5 |
4 |
2 |
3 |
→ |
3.5 |
5 |
5 |
3 |
2 |
→ |
5 |
3.5 |
6 |
6 |
6 |
→ |
6 |
6 |
然后按照右边的数据计算相关系数即可,不容易收到离群值的影响
在没有相同位的情况下
r=1−n(n2−1)6i=1∑n(Rix−Riy)2
例子:
Rix |
Riy |
(Rix−Riy)2 |
1 |
3 |
4 |
2 |
1 |
1 |
3 |
2 |
1 |
4 |
5 |
1 |
5 |
4 |
1 |
6 |
7 |
1 |
7 |
6 |
1 |
8 |
8 |
0 |
r=1−8(82−1)6×10=0.881
标准误差
样本均值的估计标准误差,简称**平均值标准误差**
SDx=nσ
但是通常σ未知,此时可以用样本的标准差s来估计SDx
SEx=ns
- SDx:样本平均值的标准差
- s:样本的标准差
- SEx:样本平均值的标准误
如果随机变量服从正态分布,则95%置信区间可以表示为
[x±(SEx×1.96)]
变异系数
cv=μσ
矩
X,Y为一个随机变量,k=1,2,⋯
- 若E(Xk)存在,则称之为X的k阶(原点)矩
- 若E[(X−E(X))k]存在,则称之为X的k阶中心矩
- 若E(XkYl)存在,则称之为X与Y的k+l阶混合(原点)矩
- 若E[(X−E(X))k(Y−E(Y))l]存在,则称之为X与Y的k阶混合中心矩
期望:1阶原点矩
方差:2阶中心矩
尖度
E[(σX−μ)3]
峰度
E[(σX−μ)4]
概率母函数
GX(t)=i=0∑∞P(X=i)ti=E(tX)∣t∣≤1
一个离散随机变量的概率母函数是指该随机变量的概率质量函数的幂级数表达式。
GX(1)GX′(1)G′′(1)+G′(1)(1−G′(1))GX(0)=1=E(X)=var(X)=p0
常见概率母函数
伯努利分布
GX(t)=q+pt
几何分布
GX(t)=1−qtpt∣t∣<q−1
二项分布
GX(t)=(q+pt)n(q=1−p)
泊松分布
GX(t)=k=0∑∞k!1λke−λtk=eλ(t−1)
负二项分布
GX(t)=k=0∑∞(k−1n−1)pnqk−ntk=(1−qtpt)n∣t∣<q−1,p+q=1
唯一性定理
如果对于所有t
GX(t)=GY(t)
则
P(X=k)=P(Y=k)
矩母函数
M(t)=n=0∑∞n!tnE[Xn]=E(etX)
性质:0处的n阶导数为X的n阶(原点)矩
E(Xn)=M(n)(0)
与概率母函数关系
MX(log(t))=E(etlog(X))=E(Xt)=GX(t)
特征函数
特征函数
针对收敛半径为0的矩母函数的情况,好处是总是收敛。性质和矩母函数都差不多,就是有的地方多出了一个i。
离散:连续:ϕ(t)=n=0∑∞n!(it)nE[Xn]=M(it)=E(eitX)∫eitXf(X)dX
设Z=X+Y,X,Y相互独立,则
ϕZ(t)=E(eitZ)=E(eit(X+Y))=E(eitXeitY)=E(eitX)E(eitY)=ϕX(t)ϕY(t)
一般的
ϕX1+X2+⋯+Xn(t)=ϕX1(t)ϕX2(t)⋯ϕXn(t)
雅可比矩阵
多元函数在一个点的微分是一个局部线性变换,将该点的一个邻域映到一个开集,因此微分可以用矩阵的形式给出,每个列向量是偏导数,这个形式被称为雅可比矩阵
J=[∂x1∂f⋯∂xn∂f]=⎣⎢⎡∂x1∂f1⋮∂x1∂fm⋯⋱⋯∂xn∂f1⋮∂xn∂fm⎦⎥⎤
雅可比矩阵Jf(p)就是函数f在n维空间某点p处的导数
若Y=g(X),则
fY(y)=fX(g−1(y))∣∣J∣∣
参考