什么是线性空间
定义:设F是一个非空数集,且0,1∈F,若对F中任意元素a,b,有
a+ba−ba⋅ba/b∈F∈F∈F∈F(b=0)
则称F为数域
定义:设F是一个数域,V是一非空集合,对V中的任意元素a,b,定义加法运算+,且有
a+b∈V
对F中任意元素k,以及V中任意元素a,定义数乘运算⋅,且有
k⋅a∈V
若加法与数乘满足一下性质,则称V为数域F上的线性空间,记为V(F)
-
加法
- 交换率:a+b=b+a
- 结合率:(a+b)+c=a+(b+c)
- 零元: ∃O∈V,∀a∈V→O+a=a
- 负元: ∀a∈V,∃b∈V→a+b=O
-
数乘
- 结合率:∀k,l∈F,a∈V→(kl)a=k(la)
- 单位元:∀a→1a=a
- 分配律:∀k,l∈F,a∈V→(k+l)a=ka+la
- 分配律:∀k∈F,a,b∈V→k(a+b)=ka+kb
线性空间里的元素称为向量
实线性空间:数域F是实数域
复线性空间:数域F是复数域
线性空间本质
实际就是个给元素装配了加法和数乘的非空集合
你要想玩代数游戏,就必须要有游戏规则和场地范围。
线性空间的性质
- 线性空间V(F)中的零元是唯一的
- 线性空间V(F)中的负元是唯一的
- ∀a∈V(F)→0⋅a=O,(−1)⋅a=−a
- ∀a∈V(F)→k⋅O=O
线性相关
设{a1,a2,⋯,an}是线性空间V中的一组向量,若存在一组不全为0的的数:
{x1,x2,⋯,xn}
使得
x1a1+x2a2+⋯+xnan=0
则称向量组{a1,a2,⋯,an}线性相关
线性无关
设{a1,a2,⋯,an}是线性空间V中的一组向量,若存在一组不全为0的的数:
{x1,x2,⋯,xn}
均有
x1a1+x2a2+⋯+xnan=0
则称向量组{a1,a2,⋯,an}线性无关
基与维数
设{a1,a2,⋯,an}是线性空间V中的一组线性无关向量组,若对V中任意向量b,存在一组数:
{x1,x2,⋯,xn}
使得b=x1a1+x2a2+⋯+xnan
则称向量组{a1,a2,⋯,an}为V的基,称V为n维线性空间,记为Vn,维数记为dimV=n
简单来说就是线性空间V中的任意向量都能由这一组线性无关向量组线性表示出来,由此可见
一个线性空间可以有多组基。不同的基与基之间可以通过过渡矩阵进行变换。
向量的坐标
设{a1,a2,⋯,an}是线性空间Vn中的基,则对Vn中任意向量b,有唯一的线性表示:
b=x1a1+x2a2+⋯+xnan
记x=[x1,x2,⋯,xn]T
称x为向量b在基{a1,a2,⋯,an}下的坐标
记B={a1,a2,⋯,an}
则有
b=x1a1+x2a2+⋯+xnan=Bx
过渡矩阵
设Ba={a1,a2,⋯,an},Bb={b1,b2,⋯,bn}是Vn的两个基,对基Bb中任意向量bi,可以求出在基Ba下的坐标。设为
Pi=[pi1pi2⋯pin]
写成向量形式:
bi=BaPi(i=1,2,⋯,n)
记P=[P1,P2,⋯,Pn],由此得到
Bb=Ba⋅P
过度矩阵性质
- 过度矩阵是满秩矩阵
- 若P是基Ba到基Bb的过渡矩阵,则P−1是基Bb到基Ba的过渡矩阵
- 若向量a在基Ba下的坐标是x,即a=Bax,则向量a在Bb下的坐标是y=P−1x
子空间
设V是数域F上的线性空间,是W的V子集,若对W中的任意元素a,b,及数k∈F,按V中的加法和数乘有:
a+bka∈W∈W
则W也是数域F上的线性空间,称W为V的线性子空间
常见子空间
- 零空间:N(A)={x∈R∣Ax=0}
- dimN(A)=n−rankA=n−r
- 列空间:R(A)={Ax∣x∈Rn}
- dimR(A)=rankA=r
Span
设{a1,a2,⋯,an}是线性空间V的一向量,记
Span{a1,a2,⋯,an}={a=i=l∑rkiai∣k1,k2,⋯,kr∈F}
则Span{a1,a2,⋯,an}是V的子空间,称为由{a1,a2,⋯,an}张成的子空间
- 若{a1,a2,⋯,an}是子空间W的基,则有
W=span{a1,a2,⋯,an}
- 设A∈Rm×n,记A=[A1A2⋯An],其中Ai∈Rm,i=1,2,⋯,n
则有
R(A)={Ax∣x∈Rn}=Span{A1,A2,⋯,An}
基扩张定理
设{a1,a2,⋯,ar}是Vn中一组线性无关向量,则存在Vn中n−r个向量{ar+1,ar+2,⋯,an}使得
{a1,a2,⋯,ar,ar+1,⋯,an}
构成Vn的基
和空间与交空间
- 和空间:W1∩W2
- 交空间:W1+W2
设有W1=Span{a1,⋯,ar},W2=Span{b1,⋯,br},则有
W1+W2=Span{a1,⋯,ar,b1,⋯,br}
维数公式
设W1,W2是线性空间V的两个子空间,则有
dim(W1+W2)+dim(W1∩W2)=dimW1+dimW2
直和
设W1和W2是线性空间V的子空间,若对∀a∈W1+W2,∃a=a1+a2(a1∈W1,a2∈W2)且是唯一的,这个和W1+W2就称为直和,记为
W1⊕W2
也就是,W1,W2中的任一向量只能唯一地分解为W1中的一个向量与W2中的一个向量直和,则W1+W2为W1和W2的直和
下列条件等价
- W1+W2=W1⊕W2
- W1∩W2={O}
- dim(W1+W2)=dimW1+dimW2
- O=a1+a2,a1∈W1,a2∈W2,则有a1=O,a2=O
线性变换
定义: 设V1,V2是同一数域F上的线性空间,T是V1→V2的映射,若对V1中任意向量a,b,以及数域F中任意元素k,有
T(a+b)T(ka)=Ta+Tb=kTa
则称T为线性空间V1到V2的线性变换
线性变换的矩阵表示
设T是Vn→Vm的线性变换,Ba={a1,a2,⋯,an}与Bb={b1,b2,⋯,bn}分别是Vn,Vm的基,则
Vn→TVm
因为Tai∈Vm,设Tai在基Bb={b1,b2,⋯,bm}下的坐标为
Ai=[a1ia2i⋯ami]
既有Tai=BnAi(i=1,2,⋯,n)
记TBa={Ta1,Ta2,⋯,Tan}
则有
TBa={Ta1,Ta2,⋯,Tan}={BbA1,BbA2,⋯,BbAn}=Bb{A1,A2,⋯,An}=BbA
定义:称矩阵A为线性变换T在奇偶{Ba,Bb}下的矩阵,若T是Vn→Vn(自身)的线性变换,则取Bb=Ba,此时A是方阵,简称为T在基Ba下的矩阵
A=[a1a2⋯an]
其中Ai是像Tai在像空间基Bb下的坐标。
零空间与值空间
设T是Vn→Vm的线性变换,记
T的零空间(核):N(T)={x∈Vn∣Tx=O}
T的值空间(值域):R(T)={Tx∈Vm∣x∈Vn}
如果把T看作矩阵A,则变为矩阵的零空间,值空间。
null(T)=dimN(T):为T的零度
rank(T)=dimR(T):为T的秩
因为Tai∈Vm,i=1,2,⋯,n
设Tai在基Bb={b1,b2,⋯,bm}下的坐标为
A=[a1ia2i⋯ani]
既有Tai=BbAi,i=1,2,⋯,n
设T是Vn→Vm的线性变换,Ba={a1,a2,⋯,an}与Bb={b1,b2,⋯,bn}分别是Vn,Vm的基,则
- null(T)=dimN(A)=n−rank(A)
- rank(T)=dimR(A)=rank(A)
- rank(T)+null(T)=n
T是抽象的,难以计算,而A实际存在,方便计算。
线性变换在不同奇偶下的矩阵
设T是Vn→Vm的线性变换
Ba,Ba~是Vn的两个基,Bb,Bb~是Vm的两个基
T在奇偶{Ba,Bb}下的矩阵为A,即TBa=BbA
T在奇偶{Ba~,Bb~}下的矩阵为B,即TBa~=Bb~A
矩阵A与B有什么关系?
设Ba到Ba~的过渡矩阵为P,Bb到Bb~的过渡矩阵为Q。
即
{Ba~=BaPBb~=BbQ
我们先看
TBaBa~=BbA=BaP
我们在两边同时乘上T
TBa~=T(BaP)=T(Ba)P=(BbA)P=Bb(AP)
再看
TBa~Bb~=Bb~A=BbP
我们在两边同时乘上T
TBa~=Bb~B=(Bb~Q)B=Bb(QB)
由矩阵坐标的唯一性,我们可以得到
AP=QB⇒A=QBP−1
我们重新假设T是Vn→Vn的线性变换,也就是指向自身的线性变换。我们同样可以得到
AP=PB⇒A=PBP−1
寻找线性变换T
目标:找到Vn上的一个基B,使得T在基B下的矩阵具有比较简单的形式
不变子空间
设T是Vn上的线性变换,W是Vn的子空间,若对∀a∈W→Ta∈W,称W是T的不变子空间。
设T是Vn上的线性变换,则
- T的零空间N(T)是T的不变子空间
- T的值空间R(T)是T的不变子空间
线性变换的特征值与特征向量
设T是Vn上的线性变换,若存在数λ,及非零向量ξ,使得
Tξ=λξ
则称λ为T的特征值,称ξ为T关于λ的特征向量
记Vλ={ξ∈Vn∣Tξ=λξ}
则Vλ是Vn的子空间,称之为T关于特征值λ的特征子空间,称dimVλ为λ的集合重数
设B={a1,a2,⋯,an}是Vn的基,T在基B下的矩阵为A,
设向量ξ在基B下的坐标为x,即ξ=Bx,则
Tξ=T(Bx)=(TB)x=BAx
所以
Tξ=λξ⇔BAx=Bλx⇔Ax=λx
即λ是T的特征值,当且仅当λ是A的特征值。
线性变换的对角化
设T是Vn上的线性变换,若存在Vn上的一个基B,使得T在该基下的矩阵是对角阵,则称T可对角化
T可对角化的充要条件是下列等价条件之一成立
- T有n个线性无关的特征向量
- Vn=Vλ1⊕Vλ2⊕⋯⊕Vλs,其中λ1,λ2,⋯,λs是T的所有可能特征值。
内积
设V是实数域R上的线性空间,∀x,y∈V,V上的内积是这样一个映射V×V→R,记为<x,y>,满足以下性质
- 对称性:<x,y>=<y,x>
- 可加性:<x+y,z>=<x,z>+<y,z>
- 齐次性:<kx,y>=k<x,y>
- 非负性:<x,x>≥0,仅当x=0时有<x,x>=0
则称<x,y>为a与b的内积
定义了内积的实线性空间称为欧氏空间(实内积空间)
设V是复线性空间,∀x,y∈V,V上的内积是这样一个映射V×V→R,记为<x,y>,满足以下性质
- 共轭对称性:<x,y>=<y,x>
- 可加性:<x+y,z>=<x,z>+<y,z>
- 齐次性:<kx,y>=k<x,y>
- 非负性:<x,x>≥0,仅当x=0时有<x,x>=0
则称<x,y>为a与b的内积
定义了内积的复线性空间称为酉空间
内积的定义
对任意的xy∈Rn,令
<x,y>=xTy=yTx=i=1∑nxiyi
易验证上式子定义的<x,y>是内积
设A∈Rn×n是给定的一个正定矩阵,对任意的x,y∈Rn,令
<x,y>=xTAy=yTAx=i=1∑nj=1∑nxiaijyj
可验证上式定义的<x,y>是内积
内积的性质
- <a,O>=0
- <a,b+ξ>=<a,b>+<a+ξ>
- <a,kb>=k<a,b>
- <∑i=1nxiai,∑j=1myjbj>=∑i=1n∑j=1nxi<ai,bj>yj
向量长度
设V是欧氏空间,对任意的a∈V,称
∣a∣=<a,a>
为向量a的长度,称长度为1的向量为**单位向量
若a=O,记a0=∣a∣a,称为向量a的单位化向量
向量的正交
设V是欧氏空间,a,b∈V,若
<a,b>=0
则称向量a与b相互正交,记为a⊥b
勾股定理
设V是欧氏空间a,b∈V,若
a⊥b
即向量a与b正交,则有
∣a+b∣2=∣a∣2+∣b∣2
正交向量组
设a1,a2,⋯,an是欧式空间V中的非零向量,若a1,a2,⋯,an两两正交,则称之为正交向量组
若a1,a2,⋯,an两两正交,则他们线性无关
标准正交基
设B={a1,a2,⋯,an}是n维欧式空间Vn中的正交向量组,则称B为Vn的正交基
又若B={a1,a2,⋯,an}中向量均为单位向量,则称B为Vn的单位正交基
正交补空间
设W1,W2都是欧式空间V中的子空间,若对任意的a∈W1,b∈W2,都有
<a,b>=0,a⊥b
则称W1与W2相互正交,记为W1⊥W2
若W1⊥W2,则W1+W2=W1⊕W2
正交补
设W1,W2都是欧式空间V中的子空间,若有
W1⊥W2,V=W1⊕W2
则称W1与W2互为正交补,记为
W1=W2⊥,W2=W1⊥
称
V=W1⊕W1⊥=W2⊕W2⊥
为V的正交直和分解
欧氏空间Vn的任一子空间W都有唯一的正交补W⊥
正交变换
设T是欧氏空间Vn上的线性变换,若对任意的a,b∈Vn,有
<Ta,Tb>=<a,b>
称T为Vn上的正交变换
下列条件等价:
- T是正交变换
- T是保持向量长度不变,即对任意的a∈Vn,有∣Ta∣=∣a∣
- T将标准正交基映射为标准正交基
- T在标准正交基下的矩阵为正交矩阵
镜像变换
在平面上取定一单位向量ω,以及与ω正交且过原点的一条直线l,讲任一向量a映射为与直线l对称的向量b
即定义了平面上的一映射
Ta=b
因为在平面上,向量a−b与ω均与直线l正交,所以向量a−b与ω线性相关
设a−b=kω
- ξ⊥ω
- ξ=a−2a−b=a−2kw
0=<ξ,ω>=<a,ω>−2k<ω,ω>
由此的k=2<a,ω>
既有b=Ta=a−2<a,ω>ω
b=Ta=a−2<a,ω>ω=a−2wω<a,ω>=a−2ω(ωTa)=a−2ωωTa=(I−2ωωT)a
记Hω=I−2ωωT,则有
- HωT=Hω
- Hω2=I
- Hω是正交矩阵
镜像变换定义
在Rn中取定一单位向量ω,令
Hω=I−2ωωT
则对任意向量a,定义线性变换T如下
Ta=Hωa
称之为镜像变换(或Householder变换
)
称矩阵H=I−2ωωT为Householder矩阵
易知T是正交变换
对称变换
设T是欧氏空间Vn上的线性变换,则T是对称变换的充要条件是T在标准正交基下的矩阵是对称矩阵
奇异矩阵
当∣A∣=0,时,A称为奇异矩阵,否则称为非奇异矩阵
奇异矩阵就是Singular Matrix。看见Singular,那么就是单身了,也就是这个矩阵时没有对象的(逆矩阵)
酉矩阵
设A是n阶复方阵,若有
AHA=AAH=I
则称A为酉矩阵.
- 酉矩阵是正交矩阵的推广,且A−1=AH
- A是酉矩阵⇔A的列向量两两正交
正定矩阵
当且经当对于所有的非零实系数向量z,都有zTAz>0的矩阵A是正定矩阵
- 矩阵A的所有特征值都是正的
- 所有的主子矩阵Ak都具有正的行列式,Ak=A(1:k,1:k)由矩阵A的第1∼k行和第1∼k列组成
- 存在一个非奇异的n×n矩阵R使得A=RTR
- 存在一个非奇异的n×n矩阵P使得PTAP是正定的。
定理
若A是非奇异矩阵,那么ATA为正定矩阵
证明:
设x=0,有
xT(ATA)x=(Ax)T(Ax)=∥Ax∥2≥0
因为A是非奇异矩阵(A的列向量线性无关),所以仅当x=0时才有Ax=0,因此ATA为正定矩阵。
正规矩阵
设A是n阶复方阵,若有
AAH=AHA
则称A为正规矩阵
- 设A为正规矩阵,A与B酉相似,则B为正规矩阵
证明:
BBBH=U−1AU=UHAU=UHAU(UHAU)H=UHAUUHAHU=UHAAHU=UHAHAU=UHAHUUHAU=(UHAU)H(UHAU)=BHB
Hermite矩阵
设A是n阶复方阵,若有
AH=A
则称A为Hermite矩阵
Hermite矩阵性质
A是正定矩阵
证明:
A的特征值全是实数
证明:
令λ和μ分别是Hermite矩阵A特征值和与之对应的特征向量,即
Aμ=λμ
计算二项式μHAμ
μHAμμHAHμ=μH(Aμ)=μH(λμ)=λμHμ=(μHAH)μ=(Aμ)Hμ=(λμ)Hμ=λHμHμ
两式相减
(λ−λH)μHμ=0
因为μHμ=∑i=1n∥ui∥2=0,则
λ−λHλ=0=λH
说明特征值全为实数。
A的属于不同特征值的特征向量相互正交
设λ1,μ1和λ2,μ2是Hermite矩阵A的2对特征对。则
Au1Au2=λ1μ1=λ2μ2
相互乘对方的共轭转置
μ2TAμ1μ1TAμ2=λ1μ2Tμ1=λ2μ1Tμ2
对其中一个式子取共轭转置
μ1TAμ2=λ1μ1Tμ2
可以得出
λ1μ1Tμ2=λ2μ1Tμ2
两式相减
(λ1−λ2)μ1Tμ2=0
因为λ1=λ2,则μ1Tμ2=0,所以μ1μ2相互正交。
A−1的特征值是λ−1
设λ,μ是Hermite矩阵A的特征对。若A可逆,则λ1,μ是逆矩阵A−1的特征对
证明:
Aμμλ−1μ=λμ=λA−1μ=A−1μ
Schur定理
设A是n阶复方阵,则存在一酉矩阵U,使得U−1AU是上三角矩阵,即
U−1AU=UHAU=⎣⎢⎢⎢⎡λ10⋮0∗λ2⋮0⋯⋯⋱⋯∗∗⋮λn⎦⎥⎥⎥⎤
其中λ1,λ2,⋯,λn是A的特征值
若A是n阶Hermite矩阵,则存在一酉矩阵U,使得U−1AU是对角阵,即
U−1AU=UHAU=⎣⎢⎢⎢⎡λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λn⎦⎥⎥⎥⎤
其中λ1,λ2,⋯,λn是A的特征值
若A是实对称矩阵,则存在一正交矩阵Q,使得Q−1AQ=QTAQ是对角阵,即
Q−1AQ=QTAQ=⎣⎢⎢⎢⎡λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λn⎦⎥⎥⎥⎤
其中λ1,λ2,⋯,λn是A的特征值
正交投影变换
设W是欧氏空间Vn的子空间,则对任意的ξ∈Vn,有唯一分解式
ξ=a+b(a∈W,b∈W⊥)
定义Vn上的映射T
Tξ=a
- T是线性变换,称之为投影变换
- 设ξ∈Vn,但ξ∈/W,则有
∣ξ−Tξ∣≤∣ξ−γ∣,∀γ∈W
投影矩阵
假设a1与a2是V的一个基,那么必然存在x1^,x2^使得p=x1^+x2^。我们令
Ax^=[a1a2]=[x1^x2^]
那么就有
p=Ax^
因为e⊥V,因此e也垂直V的基,即e⊥a1,e⊥a2,即
{a1Te=0a2Te=0⇒[a1Ta2T](b−p)=0⇒AT(b−Ax^)=0
通过计算
ATb−ATAx^ATAx^x^=0=ATb=(ATA)−1ATb
两边同乘A
Ax^p=A(ATA)−1ATb=A(ATA)−1ATb
令
P=A(ATA)−1AT
得
p=Pb
这里P的作用是将向量b投影到平面V,因此叫做投影矩阵。
这里将b推广到Rm中一个向量,V是Rm下的n(n≤m)维子空间,a1,a2,⋯,an是V的一个基,那么b在V上的投影p可以表示为:p=x1^a1+x2^a2+⋯+xn^an=Ax^,以上等式依旧成立。
矩阵的相似对角化
相似矩阵
设A,B是n方阵,若存在可逆方阵P,使得
B=P−1AP
则称A与B相似,或者称A相似于B,记为A∼B
矩阵相似是一种等价关系:
- 反射性:A∼A
- 对称性:A∼B→B∼A
- 传递性:A∼B,B∼C→A∼C
若A与B相似,则有
- A与B有相同的特征多项式与特征值
- A与B有相同的秩与行列式
- A与B有相同的迹
- 设y=f(x)是多项式,则f(A)与F(B)相似
相似对角化
设A是n阶方阵,若存在可逆方阵P,使得
P−1AP=PHAP=⎣⎢⎢⎡λ1λ2⋱λn⎦⎥⎥⎤
则称矩阵A可相似对角化,P称为相似变换矩阵
- n阶方阵A可相似对角化的充要条件是→A有n个线性无关的特征向量
- 若n阶方阵A有n个不同的特征值,则A可对角化
特征子空间
设λ0是n阶方阵A的特征值,记
Eλ0={x∈Cn∣Ax=λ0x}
Eλ0:A关于λ0的特征子空间
k0=dimEλ0:特征值λ0的几何重数
广义逆矩阵
一个方阵不一定可逆,长方矩阵更没有逆。那么是否推广矩阵逆的概念,让任何矩阵在某种意义下都可逆。
定义
设A∈Cm×n,若存在矩阵G∈Gn×m,使得
- AGA=A
- GAG=G
- (AG)H=AG
- (GA)H=GA
则称G为A的Morre-Penrose广义逆,记为A+
性质
- (A+)+=A
- (A∗)+=(A+)∗,(AT)+=(A+)T
- (λA)+=λ+A+
- diag(λ1,⋯,λn)+=diag(λ1+,⋯,λn+)
- A+AA∗=A∗,A∗AA+=A∗,AA+A∗=A∗,A∗A+A=A∗
- (A∗A)+=A+(A+)∗
- A+=(A∗A)+A∗
- 若A是可逆,则有A+=A−1
- 若F是列满秩,则有F+=FL−1=(FHF)−1FH
- 若G是行满秩,则有G+=GR−1=GH(GGH)−1
- 对任意矩阵A∈Cm×n,设A的满秩分解为A=FG,则有A+=G+F+=GH(GGH)−1(FHF)−1FH
- 设A∈Cm×n,则A的加号逆A+存在且唯一
- 设A的奇异值分解为A=UDV∗,则A+=VD+U∗
证明:
令G=VΣ+UH。于是有
AGAGAGAGGA=(UΣVH)(VΣ+UH)(UΣVH)=UΣΣ+ΣVH=UΣVH=A=(VΣ+UH)(UΣVH)(VΣ+UH)=VΣ+ΣΣUH=VΣUH=G=(UΣVH)(VΣ+UH)=UΣΣ+UH=(AG)H=(VΣ+UH)(UΣVH)=VΣ+ΣVH=(GA)H
A+的满秩算法
- 设A为列满秩矩阵,则A+=(A∗A)−1A∗
- 设A为行满秩矩阵,则A+=A∗(AA∗)−1
矩阵总结
过渡矩阵:Bb=BaP
正交矩阵:AT=A−1
酉矩阵:AHA=AAH=E
正规矩阵:AHA=AAH
投影矩阵:A=A2=AT
Hermite矩阵:A=AH
反Hermite矩阵:A=−AH
相似矩阵:B=P−1AP
参考资料