[线性代数] - 投影

简介

投影是从向量空间映射到自身的一种线性变换PP,满足P2=PP^2 = P,就是说,当PP两次作用于某个值,与作用一次得到的结果相同。

投影 - 定理一

PP是投影P2=P\Leftrightarrow P^2 = P

证明()(\Rightarrow)

xC(P), yCn\forall \mathbf{x} \in C(P),\ \exists \mathbf{y} \in \mathbb{C}^n,使得

x=Py\mathbf{x} = P\mathbf{y}

可以得到

{Px=P2y=P(Py)Px=x=PyP2=P\begin{cases} P\mathbf{x} = P^2\mathbf{y} = P(P\mathbf{y}) \\ P\mathbf{x} = \mathbf{x} = P\mathbf{y} \end{cases} \Rightarrow \color{red}{P^2 = P}

证明()(\Leftarrow)

xC(P), yCn\forall \mathbf{x} \in C(P),\ \exists \mathbf{y} \in \mathbb{C}^n,使得

x=Py\mathbf{x} = P\mathbf{y}

可以得到

Px=P2y=Py=xPx=xP\mathbf{x} = P^2\mathbf{y} = P\mathbf{y} = \mathbf{x} \Rightarrow \color{red}{P\mathbf{x} = \mathbf{x}}

投影 - 定理二

令空间W=C(P)N(P)\mathbf{W} = C(P) \oplus N(P),取xC(P), yN(P)\mathbf{x} \in C(P),\ \mathbf{y} \in N(P),对于zW\forall \mathbf{z} \in W,都可以唯一分解为z=x+y\mathbf{z} = \mathbf{x} + \mathbf{y}

证明

z=(P+IP)z\mathbf{z} = (P + I - P)\mathbf{z},令

x=Pzy=(IP)z\begin{aligned} \mathbf{x} &= P\mathbf{z} \\ \mathbf{y} &= (I - P)\mathbf{z} \end{aligned}

其中xC(P)\mathbf{x} \in C(P),把第二个式子两边同乘PP

Py=P(IP)z=(PP2)z=0P\mathbf{y} = P(I - P)\mathbf{z} = (P - P^2)\mathbf{z} = 0

yN(P)\mathbf{y} \in N(P),就得到

W=C(P)+N(P)\color{red}{W = C(P) + N(P)}

aC(P)N(P)a \in C(P) \cap N(P),即

aC(P)aN(P)a=PaPa=0\begin{aligned} \mathbf{a} \in C(P) \\ \mathbf{a} \in N(P) \end{aligned} \Rightarrow \begin{aligned} \mathbf{a} = P\mathbf{a} \\ P\mathbf{a} = 0 \end{aligned}

可得

a=Pa=0\mathbf{a} = P\mathbf{a} = 0

所以

C(P)N(P)={0}\color{red}{C(P) \cap N(P) = \{0\}}

正交补空间

与子空间S\mathbf{S}的所有向量都正交的集合,称为S\mathbf{S}的正交补空间,记作S\mathbf{S}^\perp

S={xxTy=0, yS}\mathbf{S}^\perp = \{\mathbf{x} | \mathbf{x}^T\mathbf{y} = 0,\ \forall \mathbf{y} \in \mathbf{S}\}

子空间与他的正交补S\mathbf{S}^\perp的维数满足关系式

dim(S)+dim(S)=dim(V)dim(\mathbf{S}) + dim(\mathbf{S}^\perp) = dim(\mathbf{V})

正交投影

正交投影指的是当C(P)C(P)N(P)N(P)这两个子空间互相垂直的时候的投影PP,即

xC(P)yN(P)xTy=0\begin{aligned} \forall \mathbb{x} \in C(P) \\ \forall \mathbb{y} \in N(P) \end{aligned} \Rightarrow \mathbb{x}^T\mathbb{y} = 0

也就是说C(P)C(P)的正交补是N(P)N(P)

正交投影 - 定理一

PP是正交投影{P2=PP=PT\Leftrightarrow \begin{cases} P^2 = P \\\\ P = P^T \end{cases},就是

{P2=PP=PTxC(P), Px=xxCn, (xPx)C(P)\begin{cases} P^2 = P \\ P = P^T \end{cases} \Leftrightarrow \begin{aligned} &\forall \mathbb{x} \in C(P),\ P\mathbb{x} = \mathbb{x} \\ &\forall \mathbb{x} \in \mathbb{C}^n,\ (\mathbb{x} - P\mathbb{x}) \in C(P)^\perp \end{aligned}

其中P2=PP^2 = P是投影的性质已经在上面证明,下面给出P=PTP = P^T的证明

证明()(\Rightarrow)

xC(P)\forall \mathbf{x} \in C(P)使得

xPxC(P)\mathbf{x} - P\mathbf{x} \in C(P)^\perp

那么对yCn\forall \mathbb{y} \in \mathbb{C}^n,有

xPxPy\mathbf{x} - P\mathbf{x} \perp P\mathbf{y}

(Py)T(xPx)=yTPT(xPx)=yT(PTxPTPx)=yT(PTPTP)x\begin{aligned} (P\mathbf{y})^T(\mathbf{x} - P\mathbf{x}) &= \mathbf{y}^TP^T(\mathbf{x} - P\mathbf{x}) \\ &= \mathbf{y}^T(P^T\mathbf{x} - P^TP\mathbf{x}) \\ &= \mathbf{y}^T(P^T - P^TP)\mathbf{x} \end{aligned}

其中x,y\mathbf{x}, \mathbf{y}是任意向量,即

PTPTP=0PT=PTP(PT)T=(PTP)TP=PTP=PTP=PT\begin{aligned} P^T - P^TP &= 0 \\ P^T &= P^TP \\ (P^T)^T &= (P^TP)^T \\ P &= P^TP = P^T \\ &\downarrow \\ \color{red}{P} &\color{red}{=} \color{red}{P^T} \end{aligned}

证明()(\Leftarrow)

xC(A), yN(A)\forall \mathbf{x} \in C(A),\ \forall \mathbf{y} \in N(A),即

Px=xPy=0\begin{aligned} P\mathbf{x} &= \mathbf{x} \\ P\mathbf{y} &= 0 \end{aligned}

计算

xTy=(Px)Ty=xTPTy=xT(Py)=0xyC(A)N(A)\begin{aligned} \mathbf{x}^T\mathbf{y} = (P\mathbf{x})^T\mathbf{y} = \mathbf{x}^T&P^T\mathbf{y} = \mathbf{x}^T(P\mathbf{y)} = 0 \\ &\downarrow \\ \mathbf{x} \perp \mathbf{y} &\rightarrow \color{red}{C(A) \perp N(A)} \end{aligned}

正交投影 - 定理二

A\mathbf{A}m×nm \times n的矩阵,则有定理

P=A(ATA)1ATP是正交投影P = \mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T \Leftrightarrow P\text{是正交投影}

证明()(\Rightarrow)

P2=(A(ATA)1AT)2=(A(ATA)1AT)T(A(ATA)1AT)=(A(ATA)1AT)(A(ATA)1AT)=A(ATA)1(ATA)(ATA)1AT=A(ATA)1AT=PPT=(A(ATA)1AT)T=A(ATA)1AT=P\begin{aligned} P^2 &= (\mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T)^2 \\ &= (\mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T)^T(\mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T) \\ &= (\mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T)(\mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T) \\ &= \mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}(\mathbf{A}^T\mathbf{A})(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T \\ &= \mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T \\ &= P \\ \\ P^T &= (\mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T)^T \\ &= \mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T \\ &= P \end{aligned}

因为

P=P2P=PT\begin{aligned} P = P^2 \\ P = P^T \end{aligned}

所以PP是正交投影矩阵

证明()(\Leftarrow)

xCn, cC(A)\mathbf{x} \in \mathbb{C}^n,\ \exists \mathbf{c} \in C(A),使得

Px=AcP\mathbf{x} = \mathbf{A}\mathbf{c}

两边同乘AT\mathbf{A}^T,得

ATPx=ATAcc=(ATA)1ATPx\begin{aligned} \mathbf{A}^TP\mathbf{x} &= \mathbf{A}^T\mathbf{A}\mathbf{c} \\ \mathbf{c} &= (\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^TP\mathbf{x} \end{aligned}

两边同乘A\mathbf{A},得

Ac=Px=A(ATA)1ATPx\mathbf{A}\mathbf{c} = P\mathbf{x} = \mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^TP\mathbf{x}

即可得

P=A(ATA)1ATPP = \mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^TP

再看xPxC(A)\mathbf{x} - P\mathbf{x} \in C(A)^\perp

xPxA\mathbf{x} - P\mathbf{x} \perp \mathbf{A}

AT(xPx)=0ATx=ATPxAT=ATP\begin{aligned} \mathbf{A}^T(\mathbf{x} - P\mathbf{x}) &= 0 \\ \mathbf{A}^T\mathbf{x} &= \mathbf{A}^TP\mathbf{x} \\ \mathbf{A}^T &= \mathbf{A}^TP \end{aligned}

即可得出

{P=A(ATA)1ATPAT=ATPP=A(ATA)1AT\begin{cases} P = \mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^TP \\ \mathbf{A}^T = \mathbf{A}^TP \end{cases} \Rightarrow \color{red}{P = \mathbf{A}(\mathbf{A}^T\mathbf{A})^{-1}\mathbf{A}^T}

正交补空间的正交投影

已知从正交投影至子空间C(A)C(\mathbf{A})的矩阵为PP,那么投影到N(AT)N(\mathbf{A}^T)的矩阵为IPI - P

证明:

xCn\forall\mathbf{x} \in \mathbb{C}^n,使得

xPxC(A)\mathbf{x} - P\mathbf{x} \in C(A)^\perp

也就是cRn\exists \mathbf{c} \in \mathbb{R}^n,使得

xPx=ATc\mathbf{x} - P\mathbf{x} = \mathbf{A}^T\mathbf{c}

两边同乘A\mathbf{A}

A(xPx)=AATcA(IP)x=AATc\begin{aligned} \mathbf{A}(\mathbf{x} - P\mathbf{x}) &= \mathbf{A}\mathbf{A}^T\mathbf{c} \\ \mathbf{A}(I - P)\mathbf{x} &= \mathbf{A}\mathbf{A}^T\mathbf{c} \end{aligned}

c=(AAT)1A(IP)xATc=AT(AAT)1A(IP)x(IP)x=AT(AAT)1A(IP)x(IP)=AT(AAT)1A(IP)\begin{aligned} \mathbf{c} &= (\mathbf{A}\mathbf{A}^T)^{-1}\mathbf{A}(I - P)\mathbf{x} \\ \mathbf{A}^T\mathbf{c} &= \mathbf{A}^T(\mathbf{A}\mathbf{A}^T)^{-1}\mathbf{A}(I - P)\mathbf{x} \\ (I - P)\mathbf{x} &= \mathbf{A}^T(\mathbf{A}\mathbf{A}^T)^{-1}\mathbf{A}(I - P)\mathbf{x} \\ (I - P) &= \mathbf{A}^T(\mathbf{A}\mathbf{A}^T)^{-1}\mathbf{A}(I - P) \end{aligned}

同理x(IP)xC(AT)\mathbf{x} - (I - P)\mathbf{x} \in C(A^T)^\perp可得

A(x(IP)x)=0Ax=A(IP)xA=A(IP)\begin{aligned} \mathbf{A}(\mathbf{x} - (I - P)\mathbf{x}) &= 0 \\ \mathbf{A}\mathbf{x} &= \mathbf{A}(I - P)\mathbf{x} \\ \mathbf{A} &= \mathbf{A}(I - P) \end{aligned}

即可得出

{(IP)=AT(AAT)1A(IP)A=A(IP)(IP)=AT(AAT)1A\begin{cases} (I - P) &= \mathbf{A}^T(\mathbf{A}\mathbf{A}^T)^{-1}\mathbf{A}(I - P) \\ \mathbf{A} &= \mathbf{A}(I - P) \end{cases} \Rightarrow \color{red}{(I - P) = \mathbf{A}^T(\mathbf{A}\mathbf{A}^T)^{-1}\mathbf{A}}