核心—冪零分解

本文的閱讀等級:中級

核心—冪零分解 (core-nilpotent decomposition) 是不可逆矩陣的一種相似變換,主要應用於推導 Jordan 典型形式。核心—冪零分解不像奇異值分解具有廣泛的用途,然而,它的推演過程讓原本隱蔽的矩陣子空間結構浮現出來,因此可以說是一個頗具深度的矩陣空間分析示範教材[1]

 
核心—冪零分解建立在值域─零空間分解 (column space-nullspace decomposition) 和不變子空間 (invariant subspace),這兩項觀念和技巧並不常見於基礎線性代數教本,下面我們先簡要回顧。令 A 為一 n\times n 階複矩陣。若 A 為不可逆矩陣,值域─零空間分解聲稱存在一正整數 k 使得向量空間 \mathbb{C}^n 可表示為冪矩陣 A^k 的行空間和零空間的直和 (direct sum),

C(A^k)\oplus N(A^k)=\mathbb{C}^n

滿足上式的最小正整數 k 稱為 A 的指標 (index),記作 k=\mathrm{index}(A)。令 \mathcal{X}\mathbb{C}^n 的一個子空間,且 A(\mathcal{X})=\{A\mathbf{x}\vert\mathbf{x}\in\mathcal{X}\} 表示 \mathcal{X}A 映射得到的像 (image)。若 A(\mathcal{X})\subseteq\mathcal{X},我們說 \mathcal{X} 是線性變換 A 的一個不變子空間。值域─零空間分解的一個特性是行空間 C(A^k) 和零空間 N(A^k) 都是 A 的不變子空間,亦即 A(C(A^k))\subseteq{C}(A^k)A(N(A^k))\subseteq{N}(A^k)。證明使用下列性質 (見“值域─零空間分解”):

\mathbb{C}^n\supseteq C(A)\supseteq C(A^2)\supseteq\cdots\supseteq C(A^k)=C(A^{k+1})=\cdots=C(A^n)

\mathcal{O}\subseteq N(A)\subseteq N(A^2)\subseteq\cdots\subseteq N(A^k)=N(A^{k+1})=\cdots=N(A^n)

也就是說,行空間 C(A^j) 隨著次冪 j 增加而縮小,直到 C(A^k) 才停止改變;零空間則相反,N(A^j) 隨著次冪 j 增加而增大,同樣至 N(A^k) 才停止改變。根據上述性質,

A\left(C(A^k)\right)=C(A^{k+1})=C(A^k)

得知 A^k 的行空間為一不變子空間。設 \mathbf{x}\in{A}\left(N(A^k)\right),必存在 \mathbf{z}\in{N}(A^k)=N(A^{k+1}) 使得 \mathbf{x}=A\mathbf{z}。左式兩邊同乘 A^k,可得 A^k\mathbf{x}=A^{k+1}\mathbf{z}=\mathbf{0},即 \mathbf{x}\in{N}(A^k),因此證明 A\left(N(A^k)\right)\subseteq{N}(A^k)

 
不變子空間最有價值之處在於若不變子空間彼此不交集,則它們的基底向量組合成 \mathbb{C}^n 的一個基底,參考此基底的線性變換表示矩陣具有主對角分塊形式 (見“從不變子空間切入特徵值問題”),其中每個主對角分塊對應一不變子空間。核心—冪零分解其實就是參考由行空間 C(A^k) 的基底與零空間 N(A^k) 與基底所合成的一組基底後得到的相似變換關係。設 \{\mathbf{x}_1,\ldots,\mathbf{x}_r\}C(A^k) 的基底,\{\mathbf{y}_1,\ldots,\mathbf{y}_{s}\}N(A^k) 的基底,從 C(A^k)\oplus N(A^k)=\mathbb{C}^n 可推論 n=r+s,向量集 \{\mathbf{x}_1,\ldots,\mathbf{x}_r,\mathbf{y}_1,\ldots,\mathbf{y}_s\}\mathbb{C}^n 的一祖基底。既然行空間 C(A^k) 和零空間 N(A^k) 都是 A 的不變子空間,對於任意 \mathbf{x}\in C(A^k)\mathbf{y}\in N(A^k),就有

\begin{aligned}  A\mathbf{x}&=f_1\mathbf{x}_1+\cdots+f_r\mathbf{x}_r\\    A\mathbf{y}&=g_1\mathbf{y}_1+\cdots+g_s\mathbf{y}_s.\end{aligned}

\mathbf{x} 用基底向量 \mathbf{x}_i (i=1,\ldots,r) 取代,\mathbf{y}\mathbf{y}_j (j=1,\ldots,s) 取代,便有下列表示式:

\begin{aligned}  A\mathbf{x}_i&=f_{1i}\mathbf{x}_1+\cdots+f_{ri}\mathbf{x}_i\\    A\mathbf{y}_j&=g_{1j}\mathbf{y}_1+\cdots+g_{sj}\mathbf{y}_j.\end{aligned}

將上面的 n 個式子合併為矩陣,如下:

\begin{aligned}  A\begin{bmatrix}    \mathbf{x}_1&\cdots&\mathbf{x}_r&\mathbf{y}_1&\cdots&\mathbf{y}_s    \end{bmatrix}&=\begin{bmatrix}    A\mathbf{x}_1&\cdots&A\mathbf{x}_r&A\mathbf{y}_1&\cdots&A\mathbf{y}_s    \end{bmatrix}\\    &=\begin{bmatrix}    \mathbf{x}_1&\cdots&\mathbf{x}_r&\mathbf{y}_1&\cdots&\mathbf{y}_s    \end{bmatrix}\begin{bmatrix}    f_{11}&\cdots&f_{1r}&0&\cdots&0\\    \vdots&~&\vdots&\vdots&~&\vdots\\    f_{r1}&\cdots&f_{rr}&0&\cdots&0\\    0&\cdots&0&g_{11}&\cdots&g_{1s}\\    \vdots&~&\vdots&\vdots&~&\vdots\\    0&\cdots&0&g_{s1}&\cdots&g_{ss}    \end{bmatrix}.\end{aligned}

設基底矩陣 P=\begin{bmatrix}    \mathbf{x}_1&\cdots&\mathbf{x}_r&\mathbf{y}_1&\cdots&\mathbf{y}_s    \end{bmatrix},顯然 P 為一 n\times n 階可逆矩陣,所以

P^{-1}AP=\begin{bmatrix}    F&0\\    0&G    \end{bmatrix}

其中

F=\begin{bmatrix}    f_{11}&\cdots&f_{1r}\\    \vdots&~&\vdots\\    f_{r1}&\cdots&f_{rr}    \end{bmatrix},~ G=\begin{bmatrix}    g_{11}&\cdots&g_{1s}\\    \vdots&~&\vdots\\    g_{s1}&\cdots&g_{ss}    \end{bmatrix}

這顯示方陣 A 相似於一分塊對角矩陣,核心—冪零分解只不過進一步闡明主對角分塊 FG 的性質。

 
A 為一 n\times n 階不可逆矩陣,k=\mathrm{index}(A),且 r=\mathrm{rank}A^k,則必存在一可逆矩陣 P 使得

P^{-1}AP=\begin{bmatrix}    F&0\\    0&G    \end{bmatrix}

其中 Fr\times r 階可逆分塊,G(n-r)\times(n-r) 階冪零分塊,且 \mathrm{index}(G)=k (見“特殊矩陣(1):冪零矩陣”)。上述結果稱為核心—冪零分解,F 是核心,G 是冪零,證明包含兩個部分,\mathrm{rank}F=r\mathrm{index}(G)=k。下面我們採用分塊矩陣運算,設基底矩陣 X=\begin{bmatrix}    \mathbf{x}_1&\cdots&\mathbf{x}_r    \end{bmatrix}Y=\begin{bmatrix}    \mathbf{y}_1&\cdots&\mathbf{y}_{n-r}    \end{bmatrix}。令 P=\begin{bmatrix}    X&Y    \end{bmatrix}P^{-1}=\begin{bmatrix}    U\\    V    \end{bmatrix},其中分塊 Ur\times n 階,V(n-r)\times n 階。利用已知條件 A^kY=0,計算

\begin{aligned}\begin{bmatrix}    F^k&0\\    0&G^k    \end{bmatrix}&=\begin{bmatrix}    F&0\\    0&G    \end{bmatrix}^k=(P^{-1}AP)^k=P^{-1}A^kP\\    &=\begin{bmatrix}    U\\    V    \end{bmatrix}A^k\begin{bmatrix}    X&Y    \end{bmatrix}=\begin{bmatrix}    U\\    V    \end{bmatrix}\begin{bmatrix}    A^kX&A^kY    \end{bmatrix}\\  &=\begin{bmatrix}    UA^kX&0\\    VA^kX&0    \end{bmatrix}.\end{aligned}

因此 G^k=0G 確為冪零矩陣,P^{-1}A^kP=\begin{bmatrix}    F^k&0\\    0&0    \end{bmatrix}。我們知道 F^k=UA^kXr\times r 階,而且

\mathrm{rank}F^k=\mathrm{rank}\begin{bmatrix}    F^k&0\\    0&0    \end{bmatrix}=\mathrm{rank}(P^{-1}A^kP)=\mathrm{rank}A^k=r

故確定 F^k 是可逆的。另由 (\mathrm{det}F)^k=\mathrm{det}F^k\neq 0 得知 F 也是可逆矩陣。接著用反證法證明 \mathrm{index}(G)=k。假設 \mathrm{index}(G)\neq k,必定有 G^{k-1}=0,而且

\begin{aligned}  \mathrm{rank}A^{k-1}&=\mathrm{rank}\begin{bmatrix}    F^{k-1}&0\\    0&G^{k-1}    \end{bmatrix}=\mathrm{rank}\begin{bmatrix}    F^{k-1}&0\\    0&0    \end{bmatrix}\\    &=\mathrm{rank}F^{k-1}=r=\mathrm{rank}A^{k}.\end{aligned}

所以 \mathrm{dim}C(A^{k-1})=\mathrm{dim}C(A^k),再由 C(A^{k-1})\subseteq C(A^k) 得知 C(A^{k-1})=C(A^k),但這和命題條件 \mathrm{index}(A)=k 矛盾。

 
下例取自“值域─零空間分解”。考慮不可逆矩陣

A=\left[\!\!\begin{array}{rrr}    2&2&1\\    -3&-3&-2\\    2&2&2    \end{array}\!\!\right]

計算可得

A^2=\left[\!\!\begin{array}{rrr}    0&0&0\\    -1&-1&-1\\    2&2&2    \end{array}\!\!\right]

解出 A^2 的行空間基底為 \mathbf{x}_1=\left[\!\!\begin{array}{r}    0\\-1\\2    \end{array}\!\!\right],零空間基底為 \mathbf{y}_1=\left[\!\!\begin{array}{r}    -1\\    1\\    0\end{array}\!\!\right]\mathbf{y}_2=\left[\!\!\begin{array}{r}    -1\\    0\\    1\end{array}\!\!\right]。接著令

P=\begin{bmatrix}    \mathbf{x}_1&\mathbf{y}_1&\mathbf{y}_2    \end{bmatrix}=\left[\!\!\begin{array}{rrr}    0&-1&-1\\    -1&1&0\\    2&0&1    \end{array}\!\!\right]

因為 \mathrm{det}P=1\neq 0\{\mathbf{x}_1,\mathbf{y}_1,\mathbf{y}_2\} 是線性獨立的,故 C(A^2)\cap N(A^2)=\mathcal{O}C(A^2)\oplus N(A^2)=\mathbb{R}^3,而且 \mathrm{rank}A^2=1\mathrm{index}(A)=2。矩陣 A 的核心—冪零分解為

P^{-1}AP=\begin{bmatrix}    1&\vline&0&0\\\hline    0&\vline&0&1\\    0&\vline&0&0    \end{bmatrix}

其中核心分塊為 F=\begin{bmatrix}    1    \end{bmatrix},冪零分塊為 G=\begin{bmatrix}    0&1\\    0&0    \end{bmatrix},並且有 G^2=0\mathrm{index}(G)=2

 
參考來源:
[1] C. Meyer, Matrix Analysis and Applied Linear Algebra, 2000, pp 394-398.

廣告
本篇發表於 線性代數專欄, 向量空間 並標籤為 , , , , 。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s