Courant Fischer定理给出了一个关于Hermitian矩阵特征值的变分特性描述
推导
Hermitian矩阵定义
满足以下式子的矩阵称为Hermitian矩阵
H=H∗,H∗=HT
性质
- 若A是Hermitian矩阵,则∀x∈Cn,xTAx是实数
- Hermitian矩阵的特征值都是实数
- Hermitian矩阵属于不同特征值的特征向量都互为正交
Rayleigh 商(Rayleigh Quotient)
R=x∗xx∗Ax
极大极小定理
设A∈Rn×n的Hermitian矩阵,且特征值为λ1≥λ2≥⋯≥λn,则有
maxmin=x∗xx∗Ax=λ1=x∗xx∗Ax=λnx∈Rn,x∈/Ox∈Rn,x∈/O
即Rayleigh商的上界是最大特征值λ1,下界是最小特征值λn,令
ΛU=⎣⎢⎢⎢⎡λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λn⎦⎥⎥⎥⎤=[u1u2⋯un]
其中ui为λi对应的特征向量,且为标准正交基,即
∥ui∥uiTuj=1=0(i=j)
则有
R=x∗xx∗Ax=x∗Ixx∗UΛU∗x=x∗UU∗xx∗UΛU∗x
令z=U∗x=[zi],则
R=z∗zz∗Λz≤∣z1∣2+⋯+∣zn∣2λ1(∣z1∣2+⋯+∣zn∣2)=λ1
同理
R=z∗zz∗Λz≥∣z1∣2+⋯+∣zn∣2λn(∣z1∣2+⋯+∣zn∣2)=λn
当x=u1,即z=U∗u1=[10⋯0]T,故z∗zz∗Λz=λ1
当x=un,即z=U∗un=[00⋯1]T,故z∗zz∗Λz=λn
以上式子表明:Rayleigh商的最大值与最小值分別发生于对应 λ1 与 λn 的特征向量u1 和 un。
几何意义
Rayleigh定理的几何意义在于,如果限制x为单位向量,λ1和λn给出二次型X∗Ax的最大值与最小值,考虑Ii=[00⋯010⋯0]T,其中第i个元素为1,则
ei∗Aei=aii
Rayleigh定理有这个必然结果:Hermitian矩阵A=[aij]的任意元素主对角元也落在λ1和λn之间,即λn≤aii≤λi,可以利用此性质估计Hermitian矩阵的最大特征值的下界和最小特征值的上界。
A=⎣⎡123254349⎦⎤
即可知道A的最大特征值≥9,最小特征值≤1
其他特征值
我们可以通过Rayleigh定理求出Hermitian矩阵的最大和最小特征值,我们还可以求出其他特征值λ2,⋯,λn−1,我们考虑与u1的正交补空间里的向量x,既有x⊥u1,则
z=U∗x=[u1u2⋯un]=(0z2⋯zn)T
即
z∗zz∗Λz=∣z1∣2+⋯+∣zn∣2λ2∣z2∣2+⋯+λn∣zn∣2≤∣z1∣2+⋯+∣zn∣2λ2(∣z2∣2+⋯+∣zn∣2)=λ2
也就可以得出
max(x∗xx∗Ax)=λ2,(x⊥u1,x=0)
分割定理
设A∈Rn×n的Hermitian矩阵,B=UHAU,其中U是n×(n−1)阶矩阵,且UHU=In−1,即
U=[0TIn−1]=⎣⎢⎢⎢⎢⎢⎡010⋮0001⋮0⋯⋯⋯⋱⋯000⋮1⎦⎥⎥⎥⎥⎥⎤
再设A与B的特征值分别为
λ1≥λ2≥⋯≥λnμ1≥μ2≥⋯≥μn
则
λ1≥μ1≥λ2≥μu≥⋯≥μn−1≥λn