基本概念
- 样本空间:随机试验E的所有可能结果组成的集合,记为S
- 样本点:E的每个结果
- 随机事件:试验E的样本空间S的子集,简称事件
- 事件发生:当且仅当这一子集中的一个样本点出现的情况
- 必然事件:每次实验中总是发生的
- 不可能事件:每次实验中都不发生。记作∅
事件关系
- 包含:若A⊂B,则称事件B包含事件A,指事件A发生必导致事件B发生
- 相等:若A⊂B且B⊂A,既A=B,称事件A与事件B相等
- 和事件:事件A∪B={x∣x∈A或x∈B}称为事件A与事件B的和事件
- 积事件:事件A∩B={x∣x∈A且x∈B}称为事件A与事件B的积事件
- 差事件:事件A−B={x∣x∈A且x∈/B}称为事件A与事件B的差事件
- 互不相容:A∩B=∅,称为互不相容或互斥的
- 逆事件:A∪B=S,称为逆事件或者对立事件,B相对于A记作A
k=1⋃nAkk=1⋂nAk和事件 积事件
频率
在相同的条件下,进行了n此实验
- 频数:事件A发生的次数nA
- 频率:比值nA/n,记作fn(A)
频率的性质:
- 0≤fn(A)≤1
- fn(S)=1
- fn(⋃k=1nAk)=∑k=1nf(Ak)
概率
概率:设E是随机实验,S是他的样本空间,对于E的每一事件A赋予一个实数,记为P(A)
- 非负性:对于每一个事件有P(A)≥0
- 规范性:对于必然事件S,有P(S)=1
- 可列可加性:设Ai,Aj是两两互不相容事件,则AiAj=∅,i=j
P(Ai∪Aj)=P(Ai)+P(Aj)
如果不是互不相容,则
P(Ai∪Aj)=P(Ai)+P(Aj)−P(AiAj)
实际推断原理:概率很小的事件在一次试验中实际上几乎是不发生的
等可能概率
- 试验的样本空间只包含有限个元素
- 试验中每个基本事件发生的可能性相同
这种试验称为等可能概率,也称为古典概率,
设试验的样本空间为S={e1,e2,⋯,en}
P({e1})=P({e2})=⋯=P({e1})
条件概率
事件A发生的条件下事件B发生的条件概率
P(B∣A)=P(A)P(AB)
- P(B∣A):事件A已经发生的条件下事件B发生的概率
- P(AB):事件A与事件B同时发生的概率
性质:
- 非负性:对于每一个事件有P(B∣A)≥0
- 规范性:对于必然事件S,有P(S∣A)=1
- 可列可加性:设B1,B2,⋯是两两互不相容事件,则
P(i=1⋃∞Bi∣A)=i=1∑∞P(Bi∣A)
乘法定理
设P(A)>0,则有乘法公式:
P(AB)P(ABC)=P(B∣A)P(A)=P(C∣AB)P(B∣A)P(A)
可推广到n个事件
P(A1A2⋯An)=P(An∣A1A2⋯An−1)P(An−1∣A1A2⋯An−2)⋯P(A2∣A1)P(A1)
划分
设S为试验E的样本空间,B1,B2,⋯,Bn为E的一组事件,若
- BiBj=∅,i=j,i,j=1,2,⋯,n
- ⋃k=1nBk=S
则称B1,B2,⋯,Bn为样本空间S的一个划分
全概率公式
设试验E的样本空间为S,A为E的事件,B1,B2,⋯,Bn为S的一个划分,且P(Bi)>0(i=1,2,⋯,n),则
P(A)=P(A∣B1)P(B1)+P(A∣B2)P(B2)+⋯+P(A∣Bn)P(Bn)=i=1∑nP(A∣Bi)P(Bi)
贝叶斯公式
设试验E的样本空间为S,A为E的事件,B1,B2,⋯,Bn为S的一个划分,且P(A)>0,P(Bi)>0(i=1,2,⋯,n),则
P(Bi∣A)=P(A)P(BiA)=∑j=1nP(A∣Bj)P(Bj)P(A∣Bi)P(Bi),i=1,2,⋯,n
独立性
设A,B是两事件,如果满足等式
P(AB)=P(A)P(B)
则称事件A,B相互独立,简称A,B独立
- A,B相互独立与A,B互不相容不能同时成立
- 若A,B相互独立,则P(B∣A)=P(B)
- 若A,B相互独立,则A与B,A与B,A与B也相互独立
随机变量
随机变量:设随机试验的样本空间为S={e},X=X(e)是定义在样本空间S上的实值单值函数,称X=X(e)为随机变量,简称为X
离散型随机变量
离散型随机变量:取到的值是有无限个或可列无限多个。
设离散型随机变量X所有可能的取值为xk(k=1,2,⋯),X取各个可能值的概率,即事件{X=xk}的概率为
P(X=xk)=pk,k=1,2,⋯
此式为离散型随机变量X的分布律
- pk≥0,k=1,2,⋯
- ∑n=1∞pk=1
离散型随机变量分布函数
设X是一个随机变量,x是任意实数,函数
F(x)=P(X≤x),∞<x<∞
称为X的分布函数
对于任意实数x1,x2(x1<x2),有
P(x1<X≤x2)=P(X≤x2)−P(X≤x1)=F(x2)−F(x2)
- 分布函数F(x)在x处的函数值就表示X落在区间(−∞,x]上的概率
- F(x)是一个不减函数
- 0≤F(x)≤1,limx→±∞F(x)=0
连续性随机变量
对于随机变量X的分布函数F(x),存在非负函数f(x),使对于任意实数x有
F(x)=∫−∞xf(t)dt
则称X为连续型随机变量
连续性随机变量概率密度
函数f(x)称为X的概率密度函数,简称概率密度
- f(x)≥0
- ∫−∞∞f(x)dx=1
- ∀x1,x2(x1≤x2)→P(x1<X≤x2)=F(x2)−F(x1)=∫x1x2f(x)dx
- 若f(x)在点x处连续,则有F′(x)=f(x)
多维随机变量
设E是一个随机试验,他的样本空间是S={e},设X=X(e)和Y=Y(e)是定义在S上的随机变量,他们组成一个向量(X,Y)叫做二维随机向量或二维随机变量
- 二元随机变量的性质依赖X和Y,和它们之间的相互关系
二维随机变量分布函数
设(X,Y)是二维随机变量,对于任意实数x,y,二元函数
F(x,y)=P((X≤x)∪(Y≤y))=P(X≤x,Y≤y)
称为二维随机变量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数
- F(x,y)是变量x和y的不减函数
- 0≤F(x,y)≤1
- F(x+0,y)=F(x,y),F(x,y+0)=F(x,y)
二维离散型的随机变量
如果二维随机变量(X,Y)全部取到的值是有限对或可列无限多对,则为离散型的随机变量
设二维随机变量(X,Y)全部取到的值为(xi,yj),i,j=1,2,⋯,即P(X=xi,Y=yi)=pij,则有
pij≥0i=1∑∞j=1∑∞pij=1
我们称P(X=xi,Y=yi)=pij,i,j=1,2,⋯为二维离散型随机变量(X,Y)的分布律,或随机变量X和Y的联合分布律
二维连续型的随机变量
对于二维随机变量(X,Y)的分布函数F(x,y),如果存在非负的函数f(x,y)使对于任意x,y有
F(x,y)=∫−∞y∫−∞xf(u,v)du,dv
则称(X,Y)是连续型的二维随机变量,函数f(x,y)称为二维随机变量(X,Y)的概率密度或联合概率密度
- f(x,y)≥0
- ∫−∞∞∫−∞∞f(x,y)dxdy=F(∞,∞)=1
- 设G是xOy平面上的区域,点(X,Y)落在G内的概率为P((X,Y)∈G)=∬Gf(x,y)dxdy
- 若f(x)在点x处连续,则有∂x∂y∂2F(x,y)=f(x,y)
边缘分布
二元随机变量(X,Y)作为一个整体,具有分布函数F(x,y)
X和Y也各自有分布函数,记作FX(x),FY(y),依次称为二维随机变量(X,Y)关于X和Y的边缘分布函数
FX(x)FY(y)=P(X≤x)=P(X≤x,Y<∞)=F(x,∞)=P(Y≤y)=P(X<∞,Y≤y)=F(∞,x)
离散型随机变量边缘分布
FX(x)=F(x,∞)=xi≤x∑j=1∑∞pij
可得
P(X=xi)P(Y=yi)=j=1∑∞pij,i=1,2,⋯=i=1∑∞pij,j=1,2,⋯
记
pi⋅p⋅j=j=1∑∞pij=P(X=xi),i=1,2,⋯=i=1∑∞pij=P(Y=yi),j=1,2,⋯
分别称pi⋅和p⋅j为(X,Y)关于X和关于Y的边缘分布律
连续型随机变量边缘分布
FX(x)=F(x,∞)=∫−∞x[∫∞∞f(x,y)dy]dx
可得
fX(x)fY(y)=∫−∞∞f(x,y)dy=∫−∞∞f(x,y)dx
分别称fX(x)和fY(y)为(X,Y)关于X和关于Y的边缘概率密度
条件分布
二维离散型随机变量条件分布
设(X,Y)是二维离散型随机变量,其分布律为
P(X=xi,Y=yi)=pij,i,j=1,2,⋯
(X,Y)关于X和关于Y的边缘分布律分别为
P(X=xi)P(Y=yi)=Pi⋅=j=1∑∞pij,i=1,2,⋯=P⋅j=j=1∑∞pij,j=1,2,⋯
现在考虑在事件Y=yi已发生的条件下X=xi发生的概率,也就是求
P(X=xi∣Y=yi)=P(Y=yi)P(X=xi,Y=yi)=p⋅jpij,i=1,2,⋯
- P(X=xi∣Y=yi)≤0
- ∑i=1∞P(X=xi∣Y=yi)=∑i=1∞p⋅jpij=p⋅j1∑i=1∞pij=p⋅jpij,i=1,2,⋯
在Y=yj条件下随机变量X的条件分布律
P(X=xi∣Y=yi)=P(Y=yj)P(X=xi,Y=yi)=p⋅jpij,i=1,2,⋯
在X=xi条件下随机变量Y的条件分布律
P(Y=yi∣X=xi)=P(X=xi)P(X=xi,Y=yi)=pi⋅pij,j=1,2,⋯
二维连续型随机变量条件分布
设二元随机变量(X,Y)的概率密度为f(x,y),(X,Y)关于Y的边缘概率密度为fY(y),若对于固定的y,fY(y)>0,则称fY(y)f(x,y)为在Y=y的条件下X的条件概率密度,记为
fX∣Y(x∣y)=fY(y)f(x,y)
称
∫−∞xfX∣Y(x∣y)dx=∫−∞xfY(y)f(x,y)dx
为在Y=y的条件下X的条件分布函数,记为P(X≤x∣Y=y)或FX∣Y(x∣y)
同理,称
∫−∞yfY∣X(y∣x)dy=∫−∞yfX(x)f(y,x)dy
为在X=x的条件下Y的条件分布函数,记为P(Y≤y∣X=x)或FY∣X(y∣x)
相互独立的随机变量
设F(x,y)及FX(x),FY(y)分别是二维随机变量(X,Y)的分布函数及边缘函数,若对于所有x,y有
P(X≤x,Y≤y)F(x,y)=P(X≤x)P(Y≤y)=FX(x)FY(y)
连续型随机变量相互独立
设(X,Y)是连续型随机变量,f(x,y),fX(x),fY(y)分布为(X,Y)的概率密度和边缘概率密度,则X和Y相互独立的条件为
f(x,y)=fX(x)fY(y)
离散型随机变量相互独立
设(X,Y)是离散型随机变量,P(X=xi,Y=yj),P(X=xi),P(Y=yi)分布为(X,Y)的联合分布律和边缘分布律,则X和Y相互独立的条件为
P(X=xi,Y=yj)=P(X=xi)P(Y=yi)
总结
|
离散型随机变量 |
连续型随机变量 |
概率 |
P(X=xk)=pk,k=1,2,⋯ |
f(x) |
(分布/概率密度)函数 |
F(x)=P(X≤x),∞<x<∞ |
F(x)=∫−∞xf(t)dt |
|
离散型二维随机变量 |
连续型二维随机变量 |
联合(分布/概率)函数 |
F(x,y)=P((X≤x)∪(Y≤y))=P(X≤x,Y≤y) |
F(x,y)=∫−∞y∫−∞xf(u,v)du,dv |
边缘分布函数 |
pi⋅=j=1∑∞pij=P(X=xi),i=1,2,⋯p⋅j=i=1∑∞pij=P(Y=yi),j=1,2,⋯ |
fX(x)=∫−∞∞f(x,y)dyfY(y)=∫−∞∞f(x,y)dx |
条件分布 |
P(X=xi∣Y=yi)=P(Y=yj)P(X=xi,Y=yi)=p⋅jpij,i=1,2,⋯P(Y=yi∣X=xi)=P(X=xi)P(X=xi,Y=yi)=pi⋅pij,j=1,2,⋯ |
∫−∞xfX∣Y(x∣y)dx=∫−∞xfY(y)f(x,y)dx∫−∞yfY∣X(y∣x)dy=∫−∞yfX(x)f(y,x)dy |
相互独立 |
P(X=xi,Y=yj)=P(X=xi)P(Y=yi) |
f(x,y)=fX(x)fY(y) |
公式
把n个物品,分配到x,y,z三组的分法:
p=x!⋅y!⋅z!n!
- 1−P(A)=P(A)
- 1−P(A∣B)=P(A∣B)
- P(A)=P(AB∪AB)=P(AB)+P(AB)
- P(A∪B)=P(A)+P(B)−P(AB)