值域—零空間分解

本文的閱讀等級:中級

\mathcal{U}\mathcal{W} 為有限維向量空間 \mathcal{V} 的兩個子空間,且 \mathcal{U}\cap\mathcal{W}=\mathcal{O}\equiv\{\mathbf{0}\}。子空間 \mathcal{U}\mathcal{W} 的直和 (direct sum) 也是一個子空間 (見“補子空間與直和”),

\mathcal{U}\oplus\mathcal{W}=\{\mathbf{u}+\mathbf{w}\vert\mathbf{u}\in\mathcal{U}, \mathbf{w}\in\mathcal{W}\}

如果 \mathcal{U}\oplus\mathcal{W}=\mathcal{V},我們說 \mathcal{U}\mathcal{W} 在向量空間 \mathcal{V} 中互為補子空間 (complementary subspace),並稱 \mathcal{U}\oplus\mathcal{W}\mathcal{V} 的直和分解。有別於一般矩陣分解如 LU 分解、QR 分解,直和分解的作用在於切割向量空間,例如,\mathbb{R}^3 的 XY 平面 \mathcal{U}=\{(x,y,0)\vert x,y\in\mathbb{R}\} 和 Z 軸 \mathcal{W}=\{(0,0,z)\vert z\in\mathbb{R}\} 是一個直和分解。明顯地,\mathbb{R}^n\mathbb{C}^n 存在無窮多直和分解。如果給定一 n\times n 階矩陣 A,如何由 A 的四個基本子空間衍生具實用價值的直和分解?本文將探討這個問題[1]。以下將向量空間限定於 \mathbb{R}^n,但本文所述內容皆可延伸至 \mathbb{C}^n,惟 A^T 必須改為 A^\ast

 
對於一 n\times n 階實矩陣 A,秩─零度定理描述了 A 的行空間 (column space,即值域) C(A) 和零空間 (nullspace,即核) N(A) 的維數關係:

\dim C(A)+\dim N(A)=n

列空間 (row space) C(A^T) 是零空間 N(A) 的正交補餘 (見“線性代數基本定理(二)”),記為 C(A^T)=N(A)^{\perp},意思是 {C}(A^T)\oplus{N}(A)=\mathbb{R}^nC(A^T)\perp N(A)。另一方面,矩陣的行秩等於列秩,\dim C(A)=\dim C(A^T),我們不免懷疑行空間 C(A) 與零空間 N(A) 是否也為補子空間?若 A 為可逆矩陣,則 N(A)=\mathcal{O},推知 C(A)\cap N(A)=\mathcal{O},兩者確為補子空間。若 A 不可逆,C(A)N(A) 未必沒有交集。例如,A=\begin{bmatrix}    0&1\\    0&0    \end{bmatrix} 的行空間與零空間同由 \begin{bmatrix}    1\\    0    \end{bmatrix} 擴張而成,C(A)\cap N(A)\neq\mathcal{O}。進一步考慮 A 的冪矩陣,計算發現 A^2=0,也就有 C(A^2)=\mathcal{O}N(A^2)=\mathbb{R}^2,所以 C(A^2)\oplus N(A^2)=\mathbb{R}^2。上例顯示直和分解可以透過解析冪矩陣來實現,此結果稱為值域─零空間分解 (Range-nullspace decomposition),或稱行空間─零空間分解:給定一 n\times n 階不可逆矩陣 A,存在一正整數 k 使得

C(A^k)\oplus N(A^k)=\mathbb{R}^n

滿足上式的最小正整數 k 稱為 A 的指標 (index),記為 \mathrm{index}(A)=k。如果 A 為一可逆矩陣,我們定義 \mathrm{index}(A)=0

 
值域─零空間分解的推導過程牽涉與冪矩陣相關的向量空間性質,以下分為五個性質討論。當 k 改變時,性質1說明行空間 C(A^k) 和零空間 N(A^k) 各自的包容關係。

性質1. 對於一 n\times n 階實矩陣 A

\mathcal{O}\subseteq{N}(A)\subseteq{N}(A^2)\subseteq\cdots\subseteq{N}(A^k)\subseteq\cdots\subseteq\mathbb{R}^n

\mathbb{R}^n\supseteq{C}(A)\supseteq{C}(A^2)\supseteq\cdots\supseteq{C}(A^k)\supseteq\cdots\supseteq\mathcal{O}

證明於下。設 \mathbf{x}\in{N}(A^k),即 A^k\mathbf{x}=\mathbf{0},就有 A^{k+1}\mathbf{x}=A(A^k\mathbf{x})=A\mathbf{0}=\mathbf{0},得知 \mathbf{x}\in{N}(A^{k+1}),故 N(A^k)\subseteq{N}(A^{k+1})。另一方面,若 \mathbf{y}\in{C}(A^{k+1}),必定存在 \mathbf{x}\in\mathbb{R}^n 使得 \mathbf{y}=A^{k+1}\mathbf{x}=A^{k}(A\mathbf{x}),也就是說,\mathbf{y}=A^k\mathbf{z}\mathbf{z}=A\mathbf{x}\in\mathbb{R}^n,推知 \mathbf{y}\in{C}(A^k),故 C(A^{k+1})\subseteq{C}(A^{k})

 
性質2指出性質1所描述的子空間鏈狀包容關係在某個位置相等。

性質2. 存在 0\le r\le n0\le s\le n 使得

\begin{aligned}  N(A^r)&=N(A^{r+1}),\\  C(A^s)&=C(A^{s+1}).\end{aligned}

使用反證法。假設

0<\dim N(A)<\mathrm{dim}N(A^2)<\cdots

n<\dim N(A^{n+1}),但 \mathbb{R}^n 空間不可能包含維數大於 n 的子空間,故證明存在 0\le r\le n 使得 \dim N(A^r)=\dim N(A^{r+1})。但 N(A^r)\subseteq N(A^{r+1}),即知 N(A^r)=N(A^{r+1})。使用相同方式可推得存在 0\le s\le n 使得 C(A^s)=C(A^{s+1})

 
根據性質2,以下令 k 為滿足 C(A^k)=C(A^{k+1}) 的最小正整數。性質3說明一旦在某個位置的兩相鄰子空間相等,此相等關係就會繼續下去,而且行空間和零空間的相等關係發生在同一位置。

性質3. 對於 j\ge 1

\begin{aligned}  N(A^k)&=N(A^{k+j}),\\  C(A^k)&=C(A^{k+j}).\end{aligned}

對於 i,j\ge 0C(A^{i+j})=A^j(C(A^i)),其中 A^j(C(A^i))=\{A^j\mathbf{y}|\mathbf{y}\in C(A^i)\}。重複使用此等式兩次,可得

C(A^{k+j})=A^jC(A^k)=A^jC(A^{k+1})=C(A^{k+j+1})

j=0,1,2,\ldots,可歸納 C(A^k)=C(A^{k+1})=C(A^{k+2})=\cdots。利用秩—零度定理,

\begin{aligned}  \dim N(A^{k+j})&=n-\dim C(A^{k+j})=n-\dim C(A^k)=\dim N(A^k)\end{aligned}

再由性質1的包容關係 N(A^k)\subseteq N(A^{k+j}) 推得 N(A^k)=N(A^{k+j})

 
性質3的一個立即推論為 C(A^k)N(A^k) 不交集。

性質4. C(A^k)\cap N(A^k)=\mathcal{O}

\mathbf{x}\in{C}(A^k)\cap{N}(A^k),則存在 \mathbf{y}\in\mathbb{R}^n 使得 \mathbf{x}=A^k\mathbf{y},且 A^k\mathbf{x}=\mathbf{0}。因此 A^{2k}\mathbf{y}=A^k(A^k\mathbf{y})=A^k\mathbf{x}=\mathbf{0},亦即 \mathbf{y}\in{N}(A^{2k})=N(A^k),得知 \mathbf{x}=\mathbf{0}

 
最後我們只要論證 C(A^k)N(A^k) 足以擴張出 \mathbb{R}^n

性質5. C(A^k)+N(A^k)=\mathbb{R}^n

C(A^k) 的基底為 \{\mathbf{x}_1,\ldots,\mathbf{x}_r\}N(A^k) 的基底為 \{\mathbf{y}_1,\ldots,\mathbf{y}_s\}。秩—零度定理說 r+s=\dim C(A^k)+\dim N(A^k)=n。性質4說明 C(A^k)N(A^k) 不交集,可知 \{\mathbf{x}_1,\ldots,\mathbf{x}_r,\mathbf{y}_1,\ldots,\mathbf{y}_s\}\mathbb{R}^n 的一組基底,換句話說,C(A^k)+N(A^k)=\mathbb{R}^n

 
合併性質4與5便證明了值域─零空間分解 C(A^k)\oplus N(A^k)=\mathbb{R}^n。下面我們用一個例子來展示值域─零空間分解:

A=\left[\!\!\begin{array}{rrr}    2&2&1\\    -3&-3&-2\\    2&2&2    \end{array}\!\!\right]

使用基本列運算將 A 化簡為簡約列梯形式,

R=\begin{bmatrix}    1&1&0\\    0&0&1\\    0&0&0    \end{bmatrix}

由此得到

C(A)=\mathrm{span}\left\{\left[\!\!\begin{array}{r}    2\\    -3\\    2    \end{array}\!\!\right],\left[\!\!\begin{array}{r}    1\\    -2\\    2    \end{array}\!\!\right]\right\},~~  N(A)=\mathrm{span}\left\{\left[\!\!\begin{array}{r}    -1\\    1\\    0    \end{array}\!\!\right]\right\}

觀察可知 C(A)\cap N(A)=N(A)\neq\mathcal{O}。繼續計算

A^2=\left[\!\!\begin{array}{rrr}    0&0&0\\    -1&-1&-1\\    2&2&2    \end{array}\!\!\right]

同樣化成簡約列梯形式後可解出 C(A^2)=\mathrm{span}\{\mathbf{x}_1\}N(A^2)=\mathrm{span}\{\mathbf{y}_1,\mathbf{y}_2\},其中

\mathbf{x}_1=\left[\!\!\begin{array}{r}    0\\    -1\\    2    \end{array}\!\!\right],~\mathbf{y}_1=\left[\!\!\begin{array}{r}    -1\\    1\\    0    \end{array}\!\!\right],~\mathbf{y}_2=\left[\!\!\begin{array}{r}    -1\\    0\\    1    \end{array}\!\!\right]

不難驗證 \{\mathbf{x}_1,\mathbf{y}_1,\mathbf{y}_2\}\mathbb{R}^3 的一組基底,故 C(A^2)\oplus N(A^2)=\mathbb{R}^3\mathrm{index}(A)=2

 
值域─零空間分解將 \mathbb{R}^n 空間切割成補子空間 C(A^k)N(A^k),這種切割方式有什麼用處?值域─零空間分解的價值在於它產生了兩個不變子空間,而參考不變子空間基底的線性變換表示矩陣具有分塊主對角形式 (見“從不變子空間切入特徵值問題”)。繼續追問下去可推演出一種新的方陣分解式,稱為核心—冪零分解 (見“核心─冪零分解”),主要的用途在於推導 Jordan 典型形式。

 
參考來源:
[1] Carl D. Meyer, Matrix analysis and applied linear algebra, 2000, pp 394-395.

繼續閱讀:
Advertisements
本篇發表於 線性代數專欄, 向量空間 並標籤為 , , , , , , , , 。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s