若函数f:Rn→R可以表示为
f=xTAx
其中x∈R,A是n×n的对称矩阵,那么称f为R2上的二次型,A为二次型矩阵
主轴定理
由于A为对称矩阵,存在正交矩阵P,使得A=PΛPT,Λ为A的特征值矩阵,有
Λ=P−1A(PT)−1=PTAP
其中P的列向量的集合是Rn的一个基,由基变换中过渡矩阵一定是非奇异矩阵(可逆矩阵 ⇒ 行满秩矩阵,列满秩矩阵),其中因为P是正交矩阵(PT=P−1),则任意标准基下的向量x都可以表示为P下的向量y的乘积
x=Py
上述变换:变量变换
当P为正交矩阵的时候,上述变换为:正交变量变换
- m×n矩阵:
- A与B等价:存在m阶可逆矩阵P和n阶可逆矩阵,使得PAQ=B
- n×n矩阵:
- A与B相似⇔存在可逆矩阵P,使得P−1AP=B
- A与B合同⇔存在可逆矩阵P,使得PTAP=B
- A与B正交相似⇔存在正交矩阵P,使得PTAP=P−1AP=B
相似,合同,正交相似,都是等价的一种,正交相似关系最强,等价关系最弱
二次型规范形
将上述式子带入到二次型当中,得到
f=xTAx=(Py)TA(Py)=yTΛy=λ1y12+λ2y22+⋯+λnyn2
上述中P为二次型xTAx的主轴
二次型标准形
任给二次型f=∑i,j=1naijxixj(aij=aji),总存在正交变换x=Py,使得f化为标准型
f=λ1y12+λ2y22+⋯+λnyn2
- 二次型标准形不是唯一的,但是标准形中所含的项数是确定的
- 二次型矩阵有很多,但是只有一个是对称的,也就是Hermitian矩阵(A∗=A)
- 在限定变换为实变换的时候,标准形中正系数的个数是不变的
其中λi为f的矩阵A的特征值
初等变换法
任意实对称矩阵可以同时进行相同行和列的初等变换化为对角形
对一个n阶实对称矩阵A,都存在可逆矩阵C,使得
CTAC=diag(d1,d2,⋯,dn)
- C不一定实正交矩阵
- d1,d2,⋯,dn不一定是A的特征值
- 如果C是正交矩阵,则di为特征值
初等变换,就是对矩阵乘上初等矩阵
PiTAPi⇓PkT⋯P2TP1TAP1P2⋯Pn
记C=P1P2⋯Pn,则
CTAC
为了得到C,可以对单位矩阵进行同等操作
(AI)⟶(CTACC)
惯性定理
设二次型f(x)=xTAx,它的秩为r,有2个可逆变换
x=Cyx=Pz
使得
ff=k1y12+k2y22+⋯+kryr2=λ1y12+λ2y22+⋯+λryr2(ki=0)(λi=0)
则k1,k2,⋯,kr中正数的个数与λ1,λ2,⋯,λr中正数的个数相对
- 正系数的个数,称为二次型的正惯性指数
- 负系数的个数,称为二次型的负惯性指数
- 正,负惯性指数的差,称为符号差
若二次型f的正惯性指数为p,秩为r,则f的规范性为
f=y12+⋯+yp2−yp+12−⋯−yr2
A≃diag(1,⋯,1,−1,⋯,−1,0,⋯,0)
其中1有p个,−1有q个
正定性
- 如果对任意x=0,都有f(x)>0,则称f为正定二次型,称矩阵A为正定矩阵
- 如果对任意x=0,都有f(x)<0,则称f为负定二次型,称矩阵A为负定矩阵
- 如果对任意x=0,f(x)≤0,则称f为半正定二次型,称矩阵A为正定矩阵
- 如果对任意x=0,f(x)≥0,则称f为负定二次型,称矩阵A为负定矩阵
正定和半正定,以及负定和半负定⼆次型,统称为有定⼆次型,如果⼆次型不是有定的,就称为不定二次型
正定
二次型是正定的充要条件为
- A的正惯性指数为n,即A≃I
- 存在可逆矩阵P,使得A=PTP
- A的n个特征值全为正
- A的n个顺序主子式全为正,即
a11>0∣∣∣∣a11a21a12a22∣∣∣∣>0∣∣∣∣∣∣∣a11⋮an1⋯⋯a1n⋮ann∣∣∣∣∣∣∣>0
正定矩阵性质2
必要性:因为A为正定矩阵,所以A≃I,即存在可逆矩阵C,使得CTAC=I,即
A=−(C−1)TC−1
取P=C−1,则有P可逆,且A=PTP
充分性:因为存在可逆矩阵P使得A=PTP,即
(PT)−1AP−1=I
从而A≃I,所以A为正定矩阵
正定矩阵性质3
AxxTAx=λx=λxTx
其中xTAx>0,xTx>0,则可得λ>0
负定
二次型是负定的充要条件为
- A的负惯性指数为n,即A≃−I
- 存在可逆矩阵P,使得A=−PTP
- A的n个特征值全为负
- 奇数阶顺序主子式为负,偶数阶顺序主兹式为正,即
(−1)r∣∣∣∣∣∣∣a11⋮ar1⋯⋯a1r⋮arr∣∣∣∣∣∣∣>0(r=1,2,⋯,n)
实对称
设A是n阶实对称矩阵的充要条件为
- A的正惯性指数<n
- 存在降序矩阵P(r(P)<n),使得A=PTP
- A的n个特征值全为非负,但至少有一个等于0
- A的各阶主子式非负,但是至少有一个为0
XY的二次型
f(x,y)=a11x2+a22y2+2a12xy+2b1x+2b2y+c=0=(xy)A(xy)+2(b1b2)∗(xy)+c=(xy1)⎝⎛a11a21b1a12a22b2b1b2c⎠⎞∗⎝⎛xy1⎠⎞
A^=⎝⎛a11a21b1a12a22b2b1b2c⎠⎞A=(a11a21a12a22)
记
- p为A的正固有值数量
- q为A的负固有值数量
- p^为A^的正固有值数量
- q^为A^的负固有值数量
则有一下关系
p |
q |
p^ |
q^ |
形状 |
2 |
0 |
2 |
1 |
椭圆 |
1 |
1 |
2 |
1 |
双曲线 |
1 |
1 |
1 |
1 |
相交的两条直线 |
1 |
0 |
2 |
1 |
抛物线 |
1 |
0 |
1 |
1 |
平行的两条直线 |
同理,取
A^=⎝⎜⎜⎛a11a21a31b1a12a22a32b2a13a23a33b3b1b2b3c⎠⎟⎟⎞A=⎝⎛a11a21a31a12a22a32a13a23a33⎠⎞
令r~=p~+q~,则
p |
q |
p^ |
q^ |
r~ |
形状 |
3 |
0 |
3 |
1 |
|
椭圆面 |
2 |
1 |
2 |
2 |
|
单叶双曲面 |
2 |
1 |
3 |
1 |
|
双叶双曲面 |
2 |
1 |
2 |
1 |
|
二次锥面 |
2 |
0 |
|
|
4 |
椭圆抛物面 |
2 |
0 |
2 |
1 |
|
椭圆柱 |
1 |
1 |
|
|
4 |
双面抛物面 |
1 |
1 |
|
|
3 |
双曲柱体 |
1 |
1 |
|
|
2 |
相交的两各面 |
1 |
0 |
|
|
3 |
抛物面柱体 |
1 |
0 |
1 |
1 |
|
平行的两各面 |
无约束凸二次规划
设有二次凸函数
f(x)=21xTAx+bTx+c
名称 |
式子 |
∇f(x) |
Ax+b |
∇2f(x) |
A |
无约束凸函数任何局部极小点x∗都是该函数的一个全局极小点,若该函数时可微的,则满足∂x∂f(x)=0
∇f(x)=Ax+b=0
得到最优解
x=−A−1b
牛顿法求解
x1=x0−A−1∇f(x0)=x0−A−1(Ax+b)=A−1b
即1次迭代到极小点,这种性质称为二次终止性
二次规划
mins.t.f(x)=21xTPx+qTx+rGx⪯hAx=b
其中
- Pi∈R+n
- G∈Rm×n
- A∈Rp×n
线性规划
若A=0,二次规划问题则变为线性规划问题
mins.t.f(x)=cTx+dGx⪯hAx=b
等式约束二次规划
mins.t.f(x)=21xTP0x+c0Tx+d021xTPix+ciTx+di≤0i=1,⋯,mAx=b
其中
- Pi∈R+n
利用Lagrange乘子法
L(x,λ)=21xTAx+cTx+λT(Ax−b)
令L(x,λ)对x和λ的导数为零,得
Ax+cT+ATλ=0Ax−b=0
解得x即可
二次约束二次规划
mins.t.f(x)=21xTP0x+c0Tx+d021xTPix+ciTx+di≤0i=1,⋯,mAx=b
其中
- Pi∈R+n