[线性代数] - 矩阵论

什么是线性空间

定义:设FF是一个非空数集,且0,1F0,1\in F,若对FF中任意元素a,ba,b,有

a+bFabFabFa/bF(b0)\begin{aligned} a + b &\in F \\ a - b &\in F \\ a \cdot b &\in F \\ a / b &\in F (b \neq 0) \end{aligned}

则称F为数域

定义:设FF是一个数域,VV是一非空集合,对VV中的任意元素a,ba,b,定义加法运算++,且有

a+bVa + b \in V

FF中任意元素kk,以及VV中任意元素aa,定义数乘运算\cdot,且有

kaVk \cdot a \in V

若加法与数乘满足一下性质,则称VV为数域FF上的线性空间,记为V(F)V(F)

  • 加法

    • 交换率:a+b=b+aa + b = b + a
    • 结合率:(a+b)+c=a+(b+c)(a+b)+c=a+(b+c)
    • 零元: OV,aVO+a=a\exists O \in V, \forall a \in V \rightarrow O + a = a
    • 负元: aV,bVa+b=O\forall a \in V, \exists b \in V \rightarrow a + b = O
  • 数乘

    • 结合率:k,lF,aV(kl)a=k(la)\forall k, l \in F, a \in V \rightarrow (kl)a = k(la)
    • 单位元:a1a=a\forall a \rightarrow 1a = a
    • 分配律:k,lF,aV(k+l)a=ka+la\forall k, l \in F, a \in V \rightarrow (k+l)a = ka + la
    • 分配律:kF,a,bVk(a+b)=ka+kb\forall k \in F, a, b \in V \rightarrow k(a+b) = ka + kb

线性空间里的元素称为向量
实线性空间:数域FF是实数域
复线性空间:数域FF是复数域

线性空间本质

实际就是个给元素装配了加法和数乘的非空集合
你要想玩代数游戏,就必须要有游戏规则和场地范围。

线性空间的性质

  • 线性空间V(F)V(F)中的零元是唯一的
  • 线性空间V(F)V(F)中的负元是唯一的
  • aV(F)0a=O,(1)a=a\forall a \in V(F) \rightarrow 0 \cdot a = O, (-1) \cdot a = -a
  • aV(F)kO=O\forall a \in V(F) \rightarrow k \cdot O = O

线性相关

{a1,a2,,an}\lbrace a_1, a_2, \cdots, a_n \rbrace是线性空间VV中的一组向量,若存在一组不全为00的的数:

{x1,x2,,xn}\lbrace x_1, x_2, \cdots, x_n \rbrace

使得

x1a1+x2a2++xnan=0x_1a_1 + x_2a_2 + \cdots + x_na_n = 0

则称向量组{a1,a2,,an}\lbrace a_1, a_2, \cdots, a_n\rbrace线性相关

线性无关

{a1,a2,,an}\lbrace a_1, a_2, \cdots, a_n\rbrace是线性空间VV中的一组向量,若存在一组不全为00的的数:

{x1,x2,,xn}\lbrace x_1, x_2, \cdots, x_n \rbrace

均有

x1a1+x2a2++xnan0x_1a_1 + x_2a_2 + \cdots + x_na_n \neq 0

则称向量组{a1,a2,,an}\lbrace a_1, a_2, \cdots, a_n\rbrace线性无关

基与维数

{a1,a2,,an}\lbrace a_1, a_2, \cdots, a_n\rbrace是线性空间VV中的一组线性无关向量组,若对VV中任意向量bb,存在一组数:

{x1,x2,,xn}\lbrace x_1, x_2, \cdots, x_n \rbrace

使得b=x1a1+x2a2++xnanb = x_1a_1 + x_2a_2 + \cdots + x_na_n
则称向量组{a1,a2,,an}\lbrace a_1, a_2, \cdots, a_n\rbraceVV的基,称VVnn维线性空间,记为VnV^n,维数记为dimV=n\dim{V}=n

简单来说就是线性空间VV中的任意向量都能由这一组线性无关向量组线性表示出来,由此可见

一个线性空间可以有多组基。不同的基与基之间可以通过过渡矩阵进行变换。

向量的坐标

{a1,a2,,an}\lbrace a_1,a_2,\cdots,a_n\rbrace是线性空间VnV^n中的基,则对VnV^n中任意向量bb,有唯一的线性表示:

b=x1a1+x2a2++xnanb = x_1a_1 + x_2a_2 + \cdots + x_na_n

x=[x1,x2,,xn]T\mathbf{x} = [x_1, x_2, \cdots, x_n]^T
xx为向量bb在基{a1,a2,,an}\lbrace a_1, a_2, \cdots, a_n \rbrace下的坐标

B={a1,a2,,an}B = \lbrace a_1, a_2, \cdots, a_n \rbrace
则有

b=x1a1+x2a2++xnan=Bxb = x_1a_1 + x_2a_2 + \cdots + x_na_n = Bx

过渡矩阵

Ba={a1,a2,,an},Bb={b1,b2,,bn}B_a=\lbrace a_1, a_2, \cdots, a_n\rbrace, B_b=\lbrace b_1,b_2,\cdots,b_n\rbraceVnV^n的两个基,对基BbB_b中任意向量bib_i,可以求出在基BaB_a下的坐标。设为

Pi=[pi1pi2pin]P_i = \begin{bmatrix} p_{i1} & p_{i2} & \cdots & p_{in} \end{bmatrix}

写成向量形式:

bi=BaPi(i=1,2,,n)b_i = B_aP_i \quad (i = 1, 2, \cdots, n)

P=[P1,P2,,Pn]P=[P_1, P_2, \cdots, P_n],由此得到

Bb=BaPB_b = B_a \cdot P

过度矩阵性质

  • 过度矩阵是满秩矩阵
  • PP是基BaB_a到基BbB_b的过渡矩阵,则P1P^{-1}是基BbB_b到基BaB_a的过渡矩阵
  • 若向量aa在基BaB_a下的坐标是xx,即a=Baxa=B_ax,则向量aaBbB_b下的坐标是y=P1xy=P^{-1}x

子空间

VV是数域FF上的线性空间,是WWVV子集,若对WW中的任意元素a,ba,b,及数kFk\in F,按VV中的加法和数乘有:

a+bWkaW\begin{aligned} a+b &\in W \\ ka &\in W \end{aligned}

WW也是数域FF上的线性空间,称WWVV的线性子空间

常见子空间

  • 零空间:N(A)={xRAx=0}N(A) = \lbrace x \in R | Ax = 0\rbrace
    • dimN(A)=nrankA=nr\dim{N(A)} = n -rankA = n -r
  • 列空间:R(A)={AxxRn}R(A) = \lbrace Ax | x \in R^n\rbrace
    • dimR(A)=rankA=r\dim{R(A)} = rankA = r

Span

{a1,a2,,an}\lbrace a_1, a_2, \cdots, a_n\rbrace是线性空间VV的一向量,记

Span{a1,a2,,an}={a=i=lrkiaik1,k2,,krF}Span\lbrace a_1, a_2, \cdots, a_n\rbrace = \lbrace a = \sum^r_{i=l}k_ia_i | k_1, k_2, \cdots, k_r \in F\rbrace

Span{a1,a2,,an}Span\lbrace a_1, a_2, \cdots, a_n\rbraceVV的子空间,称为由{a1,a2,,an}\lbrace a_1, a_2, \cdots, a_n\rbrace张成的子空间

  • {a1,a2,,an}\lbrace a_1, a_2, \cdots, a_n\rbrace是子空间WW的基,则有

W=span{a1,a2,,an}W = span\lbrace a_1, a_2, \cdots, a_n\rbrace

  • ARm×nA \in \mathbb{R}^{m\times n},记A=[A1A2An]A = \begin{bmatrix}A_1 & A_2 & \cdots & A_n\end{bmatrix},其中AiRm,i=1,2,,nA_i \in \mathbb{R}^m, i = 1,2, \cdots, n
    则有

R(A)={AxxRn}=Span{A1,A2,,An}R(A) = \lbrace Ax | x \in \mathbb{R}^n\rbrace = Span\lbrace A_1, A_2, \cdots, A_n\rbrace

基扩张定理

{a1,a2,,ar}\lbrace a_1, a_2, \cdots, a_r\rbraceVnV^n中一组线性无关向量,则存在VnV^nnrn-r个向量{ar+1,ar+2,,an}\lbrace a_{r+1}, a_{r+2}, \cdots, a_n\rbrace使得

{a1,a2,,ar,ar+1,,an}\lbrace a_1, a_2, \cdots, a_r, a_{r+1}, \cdots, a_n\rbrace

构成VnV^n的基

和空间与交空间

  • 和空间:W1W2W_1 \cap W_2
  • 交空间:W1+W2W_1 + W_2

设有W1=Span{a1,,ar},W2=Span{b1,,br}W_1 = Span\lbrace a_1, \cdots, a_r\rbrace, W_2 = Span\lbrace b_1, \cdots, b_r\rbrace,则有

W1+W2=Span{a1,,ar,b1,,br}W_1 + W_2 = Span\lbrace a_1, \cdots, a_r, b_1, \cdots, b_r\rbrace

维数公式

W1,W2W_1, W_2是线性空间VV的两个子空间,则有

dim(W1+W2)+dim(W1W2)=dimW1+dimW2\dim{(W_1+W_2)}+\dim{(W_1 \cap W_2)}=\dim{W_1}+dim{W_2}

直和

W1W_1W2W_2是线性空间VV的子空间,若对aW1+W2,a=a1+a2(a1W1,a2W2)\forall a \in W_1+W_2, \exists a = a_1 + a_2 (a_1∈W_1, a_2∈W_2 )且是唯一的,这个和W1+W2W_1+W_2就称为直和,记为

W1W2W_1 \oplus W_2

也就是,W1,W2W_1, W_2中的任一向量只能唯一地分解为W1W_1中的一个向量与W2W_2中的一个向量直和,则W1+W2W_1+W_2W1W_1W2W_2直和

下列条件等价

  • W1+W2=W1W2W_1 + W_2 = W_1 \oplus W_2
  • W1W2={O}W_1 \cap W_2 = \lbrace O\rbrace
  • dim(W1+W2)=dimW1+dimW2\dim{(W_1 + W_2)} = \dim{W_1} + \dim{W_2}
  • O=a1+a2,a1W1,a2W2O = a_1 + a_2, a_1 \in W_1, a_2 \in W_2,则有a1=O,a2=Oa_1 = O, a_2 = O

线性变换

定义: 设V1,V2V_1, V_2是同一数域FF上的线性空间,TTV1V2V_1 \rightarrow V_2的映射,若对V1V_1中任意向量a,ba, b,以及数域FF中任意元素kk,有

T(a+b)=Ta+TbT(ka)=kTa\begin{aligned} T(a+b) &= Ta+Tb \\ T(ka) &= kTa \end{aligned}

则称TT为线性空间V1V_1V2V_2的线性变换

线性变换的矩阵表示

TTVnVmV^n \rightarrow V^m的线性变换,Ba={a1,a2,,an}B_a = \lbrace a_1, a_2, \cdots, a_n\rbraceBb={b1,b2,,bn}B_b = \lbrace b_1, b_2, \cdots, b_n\rbrace分别是Vn,VmV^n, V^m的基,则

VnTVmV^n \stackrel{T}{\rightarrow} V^m

因为TaiVmTa_i \in V^m,设TaiTa_i在基Bb={b1,b2,,bm}B_b = \lbrace b_1, b_2, \cdots, b_m\rbrace下的坐标为

Ai=[a1ia2iami]A_i = \begin{bmatrix} a_{1i} & a_{2i} & \cdots & a_{mi} \end{bmatrix}

既有Tai=BnAi(i=1,2,,n)Ta_i = B_nA_i (i = 1, 2, \cdots, n)

TBa={Ta1,Ta2,,Tan}TB_a = \lbrace Ta_1, Ta_2, \cdots, Ta_n\rbrace
则有

TBa={Ta1,Ta2,,Tan}={BbA1,BbA2,,BbAn}=Bb{A1,A2,,An}=BbA\begin{aligned} TB_a &= \lbrace Ta_1, Ta_2, \cdots, Ta_n\rbrace \\ &= \lbrace B_bA_1, B_bA_2, \cdots, B_bA_n\rbrace \\ &= B_b\lbrace A_1, A_2, \cdots, A_n\rbrace \\ &= B_bA \end{aligned}

定义:称矩阵AA为线性变换TT在奇偶{Ba,Bb}\lbrace B_a,B_b\rbrace下的矩阵,若TTVnVnV^n \rightarrow V^n(自身)的线性变换,则取Bb=BaB_b = B_a,此时AA是方阵,简称为TT在基BaB_a下的矩阵

A=[a1a2an]A = \begin{bmatrix} a_{1} & a_{2} & \cdots & a_{n} \end{bmatrix}

其中AiA_i是像TaiTa_i在像空间基BbB_b下的坐标。

零空间与值空间

TTVnVmV^n \rightarrow V^m的线性变换,记
T的零空间(核)N(T)={xVnTx=O}N(T) = \lbrace x \in V^n | Tx = O\rbrace
T的值空间(值域)R(T)={TxVmxVn}R(T) = \lbrace Tx \in V^m | x \in V^n\rbrace

如果把TT看作矩阵AA,则变为矩阵的零空间,值空间。

null(T)=dimN(T)null(T)=\dim{N(T)}:为TT的零度
rank(T)=dimR(T)rank(T)=\dim{R(T)}:为TT的秩

因为TaiVm,i=1,2,,nTa_i \in V^m, i =1, 2, \cdots, n
TaiTa_i在基Bb={b1,b2,,bm}B_b = \lbrace b_1, b_2, \cdots, b_m\rbrace下的坐标为

A=[a1ia2iani]A= \begin{bmatrix} a_{1i} & a_{2i} & \cdots & a_{ni} \end{bmatrix}

既有Tai=BbAi,i=1,2,,nTa_i = B_bA_i, i = 1, 2, \cdots, n
TTVnVmV^n \rightarrow V^m的线性变换,Ba={a1,a2,,an}B_a = \lbrace a_1, a_2, \cdots, a_n\rbraceBb={b1,b2,,bn}B_b = \lbrace b_1, b_2, \cdots, b_n\rbrace分别是Vn,VmV^n, V^m的基,则

  • null(T)=dimN(A)=nrank(A)null(T) = \dim{N(A)} = n - rank(A)
  • rank(T)=dimR(A)=rank(A)rank(T) = \dim{R(A)} = rank(A)
  • rank(T)+null(T)=nrank(T) + null(T) = n

TT是抽象的,难以计算,而AA实际存在,方便计算。

线性变换在不同奇偶下的矩阵

TTVnVmV^n \rightarrow V^m的线性变换
Ba,Ba~B_a, B_{\tilde{a}}VnV^n的两个基,Bb,Bb~B_b, B_{\tilde{b}}VmV^m的两个基
TT在奇偶{Ba,Bb}\lbrace B_a, B_b\rbrace下的矩阵为A,即TBa=BbATB_a = B_bA
TT在奇偶{Ba~,Bb~}\lbrace B_{\tilde{a}}, B_{\tilde{b}}\rbrace下的矩阵为B,即TBa~=Bb~ATB_{\tilde{a}} = B_{\tilde{b}}A

矩阵AABB有什么关系?
BaB_aBa~B_{\tilde{a}}的过渡矩阵为P,BbB_bBb~B_{\tilde{b}}的过渡矩阵为Q。

{Ba~=BaPBb~=BbQ\begin{cases} B_{\tilde{a}} = B_aP \\ B_{\tilde{b}} = B_bQ \end{cases}

我们先看

TBa=BbABa~=BaP\begin{aligned} TB_a &= B_bA \\ B_{\tilde{a}} &= B_aP \end{aligned}

我们在两边同时乘上T

TBa~=T(BaP)=T(Ba)P=(BbA)P=Bb(AP)\begin{aligned} TB_{\tilde{a}} &= T(B_aP) \\ &= T(B_a)P \\ &= (B_bA)P \\ &= B_b(AP) \end{aligned}

再看

TBa~=Bb~ABb~=BbP\begin{aligned} TB_{\tilde{a}} &= B_{\tilde{b}}A \\ B_{\tilde{b}} &= B_bP \end{aligned}

我们在两边同时乘上T

TBa~=Bb~B=(Bb~Q)B=Bb(QB)\begin{aligned} TB_{\tilde{a}} &= B_{\tilde{b}}B \\ &= (B_{\tilde{b}}Q)B \\ &= B_b(QB) \end{aligned}

由矩阵坐标的唯一性,我们可以得到

AP=QBA=QBP1AP = QB \Rightarrow A = QBP^{-1}

说明:线性变换在不同奇偶下的矩阵是等价的

我们重新假设T是VnVnV_n \rightarrow V_n的线性变换,也就是指向自身的线性变换。我们同样可以得到

AP=PBA=PBP1AP = PB \Rightarrow A = PBP^{-1}

说明:线性变换在不同奇偶下的矩阵是相似的

寻找线性变换TT

目标:找到VnV^n上的一个基BB,使得TT在基BB下的矩阵具有比较简单的形式

  • 对角阵
  • 分块对角阵

不变子空间

TTVnV^n上的线性变换,WWVnV^n的子空间,若对aWTaW\forall a \in W \rightarrow Ta \in W,称WWTT的不变子空间。
TTVnV^n上的线性变换,则

  • TT的零空间N(T)N(T)TT的不变子空间
  • TT的值空间R(T)R(T)TT的不变子空间

线性变换的特征值与特征向量

TTVnV^n上的线性变换,若存在数λ\lambda,及非零向量ξ\xi,使得

Tξ=λξT\xi = \lambda \xi

则称λ\lambda为T的特征值,称ξ\xiTT关于λ\lambda的特征向量
Vλ={ξVnTξ=λξ}V_\lambda = \lbrace \xi \in V^n | T\xi = \lambda \xi\rbrace
VλV_\lambdaVnV^n的子空间,称之为TT关于特征值λ\lambda特征子空间,称dimVλ\dim{V_\lambda}λ\lambda集合重数

B={a1,a2,,an}B = \lbrace a_1, a_2, \cdots, a_n\rbraceVnV^n的基,TT在基BB下的矩阵为AA
设向量ξ\xi在基BB下的坐标为xx,即ξ=Bx\xi = Bx,则

Tξ=T(Bx)=(TB)x=BAxT \xi = T(Bx) = (TB)x = BAx

所以

Tξ=λξBAx=BλxAx=λxT \xi = \lambda \xi \Leftrightarrow BAx = B\lambda x \Leftrightarrow Ax = \lambda x

λ\lambdaTT的特征值,当且仅当λ\lambdaAA的特征值。

线性变换的对角化

TTVnV^n上的线性变换,若存在VnV^n上的一个基BB,使得TT在该基下的矩阵是对角阵,则称TT可对角化
TT可对角化的充要条件是下列等价条件之一成立

  • TTnn个线性无关的特征向量
  • Vn=Vλ1Vλ2VλsV^n = V_{\lambda 1} \oplus V_{\lambda 2} \oplus \cdots \oplus V_{\lambda s},其中λ1,λ2,,λs\lambda_1, \lambda_2, \cdots, \lambda_sTT的所有可能特征值。

内积

VV是实数域R上的线性空间,x,yV\forall x, y \in VVV上的内积是这样一个映射V×VRV×V→R,记为<x,y><x, y>,满足以下性质

  • 对称性:<x,y>=<y,x><x, y> =<y, x>
  • 可加性:<x+y,z>=<x,z>+<y,z><x+y, z> =<x, z>+<y, z>
  • 齐次性:<kx,y>=k<x,y><kx, y> =k<x, y>
  • 非负性:<x,x>0<x, x> ≥ 0,仅当x=0x=0时有<x,x>=0<x, x>=0

则称<x,y><x, y>aabb内积
定义了内积的实线性空间称为欧氏空间(实内积空间)


VV是复线性空间,x,yV\forall x, y \in VVV上的内积是这样一个映射V×VRV×V→R,记为<x,y><x, y>,满足以下性质

  • 共轭对称性:<x,y>=<y,x><x, y> = \overline{<y, x>}
  • 可加性:<x+y,z>=<x,z>+<y,z><x+y, z> = <x, z>+<y, z>
  • 齐次性:<kx,y>=k<x,y><kx, y> = k<x, y>
  • 非负性:<x,x>0<x, x> ≥ 0,仅当x=0x=0时有<x,x>=0<x, x>=0

则称<x,y><x, y>aabb内积
定义了内积的复线性空间称为酉空间

内积的定义

对任意的xyRnx y \in \mathbb{R}^n,令

<x,y>=xTy=yTx=i=1nxiyi<x, y> = x^Ty = y^Tx = \sum_{i=1}^n x_iy_i

易验证上式子定义的<x,y<x, y>是内积


ARn×nA \in \mathbb{R}^{n\times n}是给定的一个正定矩阵,对任意的x,yRnx, y \in \mathbb{R}^n,令

<x,y>=xTAy=yTAx=i=1nj=1nxiaijyj<x, y> = x^TAy = y^TAx = \sum^n_{i=1} \sum^n_{j=1} x_{i}a_{ij}y_{j}

可验证上式定义的<x,y><x, y>是内积

内积的性质

  • <a,O>=0<a, O> = 0
  • <a,b+ξ>=<a,b>+<a+ξ><a, b + \xi> = <a, b> + <a + \xi>
  • <a,kb>=k<a,b><a, kb> = k<a, b>
  • <i=1nxiai,j=1myjbj>=i=1nj=1nxi<ai,bj>yj<\sum^n_{i=1}x_ia_i, \sum^m_{j=1}y_jb_j> = \sum^n_{i=1}\sum^n_{j=1}x_i<a_i, b_j>y_j

向量长度

VV是欧氏空间,对任意的aVa \in V,称

a=<a,a>|a| = \sqrt{<a, a>}

为向量aa的长度,称长度为11的向量为**单位向量
aOa \neq O,记a0=aaa^0 = \frac{a}{|a|},称为向量aa的单位化向量

向量的正交

VV是欧氏空间,a,bVa, b \in V,若

<a,b>=0<a, b> = 0

则称向量aabb相互正交,记为aba \perp b

勾股定理

VV是欧氏空间a,bVa, b \in V,若

aba \perp b

即向量aabb正交,则有

a+b2=a2+b2|a+b|^2 = |a|^2 + |b|^2

正交向量组

a1,a2,,ana_1, a_2, \cdots, a_n是欧式空间VV中的非零向量,若a1,a2,,ana_1, a_2, \cdots, a_n两两正交,则称之为正交向量组

a1,a2,,ana_1, a_2, \cdots, a_n两两正交,则他们线性无关

标准正交基

B={a1,a2,,an}B = \lbrace a_1, a_2, \cdots, a_n\rbracenn维欧式空间VnV^n中的正交向量组,则称BBVnV^n正交基

又若B={a1,a2,,an}B = \lbrace a_1, a_2, \cdots, a_n\rbrace中向量均为单位向量,则称BBVnV^n单位正交基

nn维欧式空间VnV^n必存在标准正交基

正交补空间

W1,W2W_1, W_2都是欧式空间VV中的子空间,若对任意的aW1,bW2a \in W_1, b \in W_2,都有

<a,b>=0,ab<a, b> = 0, \quad a \perp b

则称W1W_1W2W_2相互正交,记为W1W2W_1 \perp W_2

W1W2W_1 \perp W_2,则W1+W2=W1W2W_1 + W_2 = W_1 \oplus W_2

正交补

W1,W2W_1, W_2都是欧式空间VV中的子空间,若有

W1W2,V=W1W2W_1 \perp W_2, V = W_1 \oplus W_2

则称W1W_1W2W_2互为正交补,记为

W1=W2,W2=W1W_1 = W_2^\perp, W_2 = W_1^\perp

V=W1W1=W2W2V = W_1 \oplus W_1^\perp = W_2 \oplus W_2^\perp

VV正交直和分解

欧氏空间VnV^n的任一子空间WW都有唯一的正交补WW^\perp

正交变换

TT是欧氏空间VnV^n上的线性变换,若对任意的a,bVna, b \in V^n,有

<Ta,Tb>=<a,b><Ta, Tb> = <a, b>

TTVnV^n上的正交变换

下列条件等价:

  • TT是正交变换
  • TT是保持向量长度不变,即对任意的aVna \in V^n,有Ta=a|Ta| = |a|
  • TT将标准正交基映射为标准正交基
  • TT在标准正交基下的矩阵为正交矩阵

镜像变换

在平面上取定一单位向量ω\omega,以及与ω\omega正交且过原点的一条直线ll,讲任一向量aa映射为与直线ll对称的向量bb

即定义了平面上的一映射

Ta=bTa = b

因为在平面上,向量aba-bω\omega均与直线ll正交,所以向量aba-bω\omega线性相关
ab=kωa-b = k\omega

  • ξω\xi \perp \omega
  • ξ=aab2=akw2\xi = a - \frac{a-b}{2} = a - \frac{kw}{2}

0=<ξ,ω>=<a,ω>k<ω,ω>2\begin{aligned} 0 &= <\xi, \omega> \\ &= <a, \omega> - \frac{k<\omega, \omega>}{2} \end{aligned}

由此的k=2<a,ω>k = 2<a, \omega>
既有b=Ta=a2<a,ω>ωb = Ta = a - 2<a, \omega>\omega

b=Ta=a2<a,ω>ω=a2wω<a,ω>=a2ω(ωTa)=a2ωωTa=(I2ωωT)a\begin{aligned} b &= Ta = a - 2 <a, \omega>\omega \\ &= a - 2w\omega<a, \omega> = a - 2\omega(\omega^Ta) \\ &= a - 2\omega\omega^Ta = (I - 2\omega\omega^T)a \end{aligned}

Hω=I2ωωTH_\omega = I - 2\omega\omega^T,则有

  • HωT=HωH_\omega^T = H_\omega
  • Hω2=IH_\omega^2 = I
  • HωH_\omega是正交矩阵

镜像变换定义

Rn\mathbb{R}^n中取定一单位向量ω\omega,令

Hω=I2ωωTH_\omega = I - 2\omega\omega^T

则对任意向量aa,定义线性变换TT如下

Ta=HωaTa = H_\omega a

称之为镜像变换(或Householder变换)
称矩阵H=I2ωωTH = I - 2\omega\omega^THouseholder矩阵
易知TT是正交变换

对称变换

TT是欧氏空间VnV^n上的线性变换,则TT是对称变换的充要条件是TT在标准正交基下的矩阵是对称矩阵

奇异矩阵

A=0|A| = 0,时,AA称为奇异矩阵,否则称为非奇异矩阵

奇异矩阵就是Singular Matrix。看见Singular,那么就是单身了,也就是这个矩阵时没有对象的(逆矩阵)

酉矩阵

AAnn阶复方阵,若有

AHA=AAH=IA^HA=AA^H=I

则称AA酉矩阵.

  • 酉矩阵是正交矩阵的推广,且A1=AHA^{-1} = A^H
  • AA是酉矩阵A\Leftrightarrow A的列向量两两正交

正定矩阵

当且经当对于所有的非零实系数向量zz,都有zTAz>0z^TAz > 0的矩阵AA是正定矩阵

  • 矩阵AA的所有特征值都是正的
  • 所有的主子矩阵AkA_k都具有正的行列式,Ak=A(1:k,1:k)A_k = A(1 : k,1 : k)由矩阵AA的第1k1 ∼ k行和第1k1 ∼k列组成
  • 存在一个非奇异的n×nn \times n矩阵RR使得A=RTRA = R^TR
  • 存在一个非奇异的n×nn \times n矩阵PP使得PTAPP^TAP是正定的。

定理

AA是非奇异矩阵,那么ATAA^TA为正定矩阵
证明:
x0x \neq 0,有

xT(ATA)x=(Ax)T(Ax)=Ax20x^T(A^TA)x = (Ax)^T(Ax)=\parallel Ax\parallel^2 \geq 0

因为AA是非奇异矩阵(AA的列向量线性无关),所以仅当x=0x = 0时才有Ax=0Ax = 0,因此ATAA^TA为正定矩阵。

正规矩阵

AAnn阶复方阵,若有

AAH=AHAAA^H=A^HA

则称AA正规矩阵

  • AA为正规矩阵,AABB酉相似,则BB为正规矩阵
    证明:

B=U1AU=UHAUBBH=UHAU(UHAU)H=UHAUUHAHU=UHAAHU=UHAHAU=UHAHUUHAU=(UHAU)H(UHAU)=BHB\begin{aligned} B &= U^{-1}AU \\ &= U^HAU \\ \\ BB^H &= U^HAU(U^HAU)^H \\ &= U^HAUU^HA^HU \\ &= U^HAA^HU \\ &= U^HA^HAU \\ &= U^HA^HUU^HAU \\ &= (U^HAU)^H(U^HAU) = B^HB \end{aligned}

Hermite矩阵

AAnn阶复方阵,若有

AH=AA^H=A

则称AA为Hermite矩阵

Hermite矩阵是对称矩阵的推广

Hermite矩阵性质

AA是正定矩阵

证明:

AA的特征值全是实数

证明:
λ\lambdaμ\mu分别是Hermite矩阵AA特征值和与之对应的特征向量,即

Aμ=λμA\mu=\lambda\mu

计算二项式μHAμ\mu^HA\mu

μHAμ=μH(Aμ)=μH(λμ)=λμHμμHAHμ=(μHAH)μ=(Aμ)Hμ=(λμ)Hμ=λHμHμ\begin{aligned} \mu^HA\mu &= \mu^H (A \mu) \\ &= \mu^H (\lambda \mu) \\ &= \lambda \mu^H \mu \\ \\ \mu^H A^H \mu &= (\mu^H A^H) \mu \\ &= (A\mu)^H \mu \\ &= (\lambda\mu)^H \mu \\ &= \lambda^H \mu^H \mu \end{aligned}

两式相减

(λλH)μHμ=0(\lambda - \lambda^H)\mu^H\mu = 0

因为μHμ=i=1nui20\mu^H\mu = \sum_{i=1}^n\parallel u_i\parallel ^2 \neq 0,则

λλH=0λ=λH\begin{aligned} \lambda - \lambda^H &= 0 \\ \lambda &= \lambda^H \end{aligned}

说明特征值全为实数。

AA的属于不同特征值的特征向量相互正交

λ1,μ1\lambda_1, \mu_1λ2,μ2\lambda_2, \mu_2是Hermite矩阵AA的2对特征对。则

Au1=λ1μ1Au2=λ2μ2\begin{aligned} Au_1 &= \lambda_1 \mu_1 \\ Au_2 &= \lambda_2 \mu_2 \end{aligned}

相互乘对方的共轭转置

μ2TAμ1=λ1μ2Tμ1μ1TAμ2=λ2μ1Tμ2\begin{aligned} \mu^T_2A\mu_1 &= \lambda_1 \mu^T_2 \mu_1 \\ \mu^T_1A\mu_2 &= \lambda_2 \mu^T_1 \mu_2 \end{aligned}

对其中一个式子取共轭转置

μ1TAμ2=λ1μ1Tμ2\mu^T_1A\mu_2 = \lambda_1 \mu^T_1 \mu_2

可以得出

λ1μ1Tμ2=λ2μ1Tμ2\lambda_1 \mu^T_1 \mu_2 = \lambda_2 \mu^T_1 \mu_2

两式相减

(λ1λ2)μ1Tμ2=0(\lambda_1 - \lambda_2) \mu^T_1 \mu_2 = 0

因为λ1λ2\lambda_1 \neq \lambda_2,则μ1Tμ2=0\mu^T_1 \mu_2 = 0,所以μ1μ2\mu_1 \mu_2相互正交。

A1A^{-1}的特征值是λ1\lambda^{-1}

λ,μ\lambda, \mu是Hermite矩阵AA的特征对。若AA可逆,则1λ,μ\frac{1}{\lambda}, \mu是逆矩阵A1A^{-1}的特征对
证明:

Aμ=λμμ=λA1μλ1μ=A1μ\begin{aligned} A\mu &= \lambda \mu \\ \mu &= \lambda A^{-1}\mu \\ \lambda^{-1}\mu &= A^{-1}\mu \end{aligned}

Schur定理

AAnn阶复方阵,则存在一酉矩阵UU,使得U1AUU^{-1}AU是上三角矩阵,即

U1AU=UHAU=[λ10λ200λn]U^{-1}AU = U^HAU = \begin{bmatrix} \lambda_1 & * & \cdots & * \\ 0 & \lambda_2 & \cdots & * \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{bmatrix}

其中λ1,λ2,,λn\lambda_1, \lambda_2, \cdots, \lambda_nAA的特征值


AAnn阶Hermite矩阵,则存在一酉矩阵UU,使得U1AUU^{-1}AU是对角阵,即

U1AU=UHAU=[λ1000λ2000λn]U^{-1}AU = U^HAU = \begin{bmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{bmatrix}

其中λ1,λ2,,λn\lambda_1, \lambda_2, \cdots, \lambda_nAA的特征值


AA是实对称矩阵,则存在一正交矩阵QQ,使得Q1AQ=QTAQQ^{-1}AQ = Q^TAQ是对角阵,即

Q1AQ=QTAQ=[λ1000λ2000λn]Q^{-1}AQ = Q^TAQ = \begin{bmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{bmatrix}

其中λ1,λ2,,λn\lambda_1, \lambda_2, \cdots, \lambda_nAA的特征值

对称变换一定可以对角化

正交投影变换

WW是欧氏空间VnV^n的子空间,则对任意的ξVn\xi \in V^n,有唯一分解式

ξ=a+b(aW,bW)\xi = a + b (a \in W, b \in W^\perp)

定义VnV^n上的映射TT

Tξ=aT\xi = a

  • TT是线性变换,称之为投影变换
  • ξVn\xi \in V^n,但ξW\xi \notin W,则有

ξTξξγ,γW|\xi - T\xi| \leq |\xi - \gamma|, \forall \gamma \in W

投影矩阵

假设a1a_1a2a_2VV的一个基,那么必然存在x1^,x2^\hat{x_1}, \hat{x_2}使得p=x1^+x2^p = \hat{x_1} + \hat{x_2}。我们令

A=[a1a2]x^=[x1^x2^]\begin{aligned} A &= \begin{bmatrix} a_1 & a_2 \end{bmatrix} \\ \hat{x} &= \begin{bmatrix} \hat{x_1} \\ \hat{x_2} \end{bmatrix} \end{aligned}

那么就有

p=Ax^p = A\hat{x}

因为eVe \perp V,因此ee也垂直VV的基,即ea1,ea2e \perp a_1, e \perp a_2,即

{a1Te=0a2Te=0[a1Ta2T](bp)=0AT(bAx^)=0\begin{cases} \mathbf{a}_1^T \mathbf{e} = 0 \\ \mathbf{a}_2^T \mathbf{e} = 0 \end{cases} \Rightarrow \begin{bmatrix} \mathbf{a}_1^T \\ \mathbf{a}_2^T \end{bmatrix} (b - p) = 0 \Rightarrow A^T (b - A\hat{x}) = 0

通过计算

ATbATAx^=0ATAx^=ATbx^=(ATA)1ATb\begin{aligned} A^Tb - A^TA\hat{x} &= 0 \\ A^TA\hat{x} &= A^Tb \\ \hat{x} &= (A^TA)^{-1}A^Tb \end{aligned}

两边同乘AA

Ax^=A(ATA)1ATbp=A(ATA)1ATb\begin{aligned} A\hat{x} &= A(A^TA)^{-1}A^Tb \\ p &= A(A^TA)^{-1}A^Tb \end{aligned}

P=A(ATA)1ATP = A(A^TA)^{-1}A^T

p=Pbp = Pb

这里PP的作用是将向量bb投影到平面VV,因此叫做投影矩阵

这里将bb推广到Rm\mathbb{R}^m中一个向量,VVRm\mathbb{R}^m下的n(nm)n(n \leq m)维子空间,a1,a2,,ana_1, a_2, \cdots, a_nVV的一个基,那么bbVV上的投影pp可以表示为:p=x1^a1+x2^a2++xn^an=Ax^p = \hat{x_1}a_1 + \hat{x_2}a_2 + \cdots + \hat{x_n}a_n = A\hat{x},以上等式依旧成立。

矩阵的相似对角化

相似矩阵

A,BA,Bnn方阵,若存在可逆方阵PP,使得

B=P1APB=P^{-1}AP

则称AABB相似,或者称AA相似于BB,记为ABA \sim B

矩阵相似是一种等价关系:

  • 反射性:AAA \sim A
  • 对称性:ABBAA \sim B \rightarrow B \sim A
  • 传递性:AB,BCACA \sim B, B \sim C \rightarrow A \sim C

AABB相似,则有

  • AABB有相同的特征多项式与特征值
  • AABB有相同的秩与行列式
  • AABB有相同的迹
  • y=f(x)y = f(x)是多项式,则f(A)f(A)F(B)F(B)相似

相似对角化

AAnn阶方阵,若存在可逆方阵PP,使得

P1AP=PHAP=[λ1λ2λn]P^{-1}AP = P^HAP = \begin{bmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{bmatrix}

则称矩阵AA相似对角化PP称为相似变换矩阵

  • nn阶方阵AA可相似对角化的充要条件是\rightarrowAAnn个线性无关的特征向量
  • nn阶方阵AAnn个不同的特征值,则AA可对角化

特征子空间

λ0\lambda_0nn阶方阵AA的特征值,记

Eλ0={xCnAx=λ0x}E_{\lambda_0} = \lbrace x \in \mathbb{C}^n | Ax = \lambda_0x \rbrace

Eλ0E_{\lambda_0}AA关于λ0\lambda_0特征子空间
k0=dimEλ0k_0 = \dim E_{\lambda_0}:特征值λ0\lambda_0几何重数

广义逆矩阵

一个方阵不一定可逆,长方矩阵更没有逆。那么是否推广矩阵逆的概念,让任何矩阵在某种意义下都可逆。

定义

ACm×nA \in \mathbb{C}^{m \times n},若存在矩阵GGn×mG \in \mathbb{G}^{n \times m},使得

  • AGA=AAGA = A
  • GAG=GGAG = G
  • (AG)H=AG(AG)^H = AG
  • (GA)H=GA(GA)^H = GA

则称GGAA的Morre-Penrose广义逆,记为A+A^+

性质

  • (A+)+=A(A^+)^+ = A
  • (A)+=(A+)(A^*)^+ = (A^+)^*(AT)+=(A+)T(A^T)^+ = (A^+)^T
  • (λA)+=λ+A+(\lambda A)^+ = \lambda^+A^+
  • diag(λ1,,λn)+=diag(λ1+,,λn+)diag(\lambda_1, \cdots, \lambda_n)^+ = diag(\lambda_1^+, \cdots, \lambda_n^+)
  • A+AA=A,AAA+=A,AA+A=A,AA+A=AA^+AA^* = A^*, A^*AA^+ = A^*, AA^+A^* = A^*, A^*A^+A = A^*
  • (AA)+=A+(A+)(A^*A)^+ = A^+(A^+)^*
  • A+=(AA)+AA^+ = (A^*A)^+A^*
  • AA是可逆,则有A+=A1A^+ = A^{-1}
  • FF是列满秩,则有F+=FL1=(FHF)1FHF^+ = F^{-1}_L = (F^HF)^{-1}F^H
  • GG是行满秩,则有G+=GR1=GH(GGH)1G^+ = G^{-1}_R = G^H(GG^H)^{-1}
  • 对任意矩阵ACm×nA \in \mathbb{C}^{m\times n},设AA的满秩分解为A=FGA=FG,则有A+=G+F+=GH(GGH)1(FHF)1FHA^+ = G^+F^+ = G^H(GG^H)^{-1}(F^HF)^{-1}F^H
  • ACm×nA \in \mathbb{C}^{m \times n},则AA的加号逆A+A^+存在且唯一
  • AA的奇异值分解为A=UDVA = UDV^*,则A+=VD+UA^+ = VD^+U^*

证明:
G=VΣ+UHG = V\Sigma^+U^H。于是有

AGA=(UΣVH)(VΣ+UH)(UΣVH)=UΣΣ+ΣVH=UΣVH=AGAG=(VΣ+UH)(UΣVH)(VΣ+UH)=VΣ+ΣΣUH=VΣUH=GAG=(UΣVH)(VΣ+UH)=UΣΣ+UH=(AG)HGA=(VΣ+UH)(UΣVH)=VΣ+ΣVH=(GA)H\begin{aligned} AGA &= (U\Sigma V^H)(V\Sigma^+U^H)(U\Sigma V^H) \\ &= U\Sigma\Sigma^+\Sigma V^H = U\Sigma V^H = A \\ GAG &= (V\Sigma^+U^H)(U\Sigma V^H)(V\Sigma^+U^H) \\ &= V\Sigma^+\Sigma\Sigma U^H = V\Sigma U^H = G \\ AG &= (U\Sigma V^H)(V\Sigma^+U^H) \\ &= U\Sigma \Sigma^+U^H = (AG)^H \\ GA &= (V\Sigma^+U^H)(U\Sigma V^H) \\ &= V\Sigma^+\Sigma V^H = (GA)^H \end{aligned}

A+A^+的满秩算法

  • AA为列满秩矩阵,则A+=(AA)1AA^+ = (A^*A)^{-1}A^*
  • AA为行满秩矩阵,则A+=A(AA)1A^+ = A^*(AA^*)^{-1}

矩阵总结

过渡矩阵:Bb=BaPB_b = B_aP

对称矩阵:A=ATA = A^T

正交矩阵:AT=A1A^{T} = A^{-1}

酉矩阵:AHA=AAH=EA^HA = AA^H = E

正规矩阵:AHA=AAHA^HA = AA^H

奇异矩阵:A=0|A| = 0

幂等矩阵:A=A2A = A^2

投影矩阵:A=A2=ATA = A^2 = A^T

Hermite矩阵:A=AHA = A^H

反Hermite矩阵:A=AHA = -A^H

相似矩阵:B=P1APB=P^{-1}AP

广义逆矩阵:AGA=AAGA = A

参考资料