利用基本相似變換證明 Jordan 形式定理

本文的閱讀等級:高級

Jordan 典型形式定理是線性代數理論中最艱深的定理之一,它說:任意方陣 A 都相似於基本 Jordan 分塊直和所構成的 Jordan 矩陣 J(見“Jordan 形式大解讀 (上)”)。設 A 有特徵值 \lambda_i,我們曾經在“Jordan 形式大解讀 (下)”發展了一個以計算矩陣秩 \mathrm{rank}(A-\lambda_i I)^p 為基礎的 Jordan 矩陣演算法,並確定 A 的 Jordan 形式唯一存在(若不考慮 Jordan 分塊的排序變化)。本文介紹一個採用一連串基本相似變換的證明法,它的優點是能夠讓我們清楚看見從矩陣 A 至其 Jordan 形式 J 的相似型態演變過程。這個證法雖然已有悠久的歷史,但幾乎不曾出現於教科書中;此法講究靈活運用基本相似變換,整個證明過程類似在解「俄羅斯方塊」,堪稱是線性代數中罕見的一個「益智遊戲」。

 
給定一 n\times n 階矩陣 A,存在一可逆矩陣 M 使得 J=M^{-1}AM,Jordan 矩陣 J 即為相似矩陣家族的代表。既然如此,理當可對矩陣 A 執行一連串的相似變換,最終得到 Jordan 矩陣 J。我們採行的證明過程包含三個主要步驟:(1) 先將 A 轉化為上三角矩陣 T;(2) 再消滅 T 的非主對角分塊,得到一個分塊對角矩陣 B;(3) 最後利用歸納法將 B 的主對角分塊逐一化簡為超級 Jordan 分塊。

 
第一個步驟並不困難,Schur 定理提供了合用的解決方案(參閱“矩陣三角化的 Schur 定理”):任一 n\times n 階矩陣 A 都可以分解為 A=UTU^{-1},其中 T 是上三角矩陣,U 是么正矩陣(unitary matrix),滿足 U^{-1}=U^{\ast}。若 A 為實矩陣而且僅包含實特徵值,則 U 各元皆為實數,U 是正交矩陣,U^{-1}=U^{T}。設 A 有相異特徵值 \lambda_1,\ldots,\lambda_m,對 A 執行三角化的過程中,我們可以自由決定各特徵值在矩陣 T 的主對角線上的排列位置。為便於分析,以下假設相同的特徵值都群聚於同一主對角分塊內,也就是說,n\times n 階上三角矩陣 T 具有下列形式:

T=\begin{bmatrix}  T(\lambda_1)&\ast&\cdots&\ast\\  0&T(\lambda_2)&\cdots&\ast\\  \vdots&\vdots&\ddots&\vdots\\  0&0&\cdots&T(\lambda_m)  \end{bmatrix}

其中 T(\lambda_i) 表示上三角矩陣,主對角元即為特徵值 \lambda_i

 
討論步驟二之前,我們先介紹三個基本相似變換矩陣:排列(permutation)矩陣 P,伸縮(scaling)矩陣 S,和取代(replacement)矩陣 R,它們其實就是執行消去法所使用的基本矩陣(參閱“特殊矩陣 (10):基本矩陣”)。基本排列矩陣 P 的功能在將 A=[a_{ij}] 的第 i 列(行)和第 j 列(行)對調,P 可由對調單位矩陣 Iij 列(或行)而得。下面是四階矩陣的例子,排列相似變換產生新排序 (1,3,2,4)

\begin{aligned} P^{-1}AP&=\begin{bmatrix}  1&0&0&0\\  0&0&1&0\\  0&1&0&0\\  0&0&0&1  \end{bmatrix}\begin{bmatrix}  a_{11}&a_{12}&a_{13}&a_{14}\\  a_{21}&a_{22}&a_{23}&a_{24}\\  a_{31}&a_{32}&a_{33}&a_{34}\\  a_{41}&a_{42}&a_{43}&a_{44}  \end{bmatrix}\begin{bmatrix}  1&0&0&0\\  0&0&1&0\\  0&1&0&0\\  0&0&0&1  \end{bmatrix}\\  &=\begin{bmatrix}  a_{11}&a_{13}&a_{12}&a_{14}\\  a_{31}&a_{33}&a_{32}&a_{34}\\  a_{21}&a_{23}&a_{22}&a_{24}\\  a_{41}&a_{43}&a_{42}&a_{44}  \end{bmatrix}\end{aligned}

注意,排列矩陣是正交矩陣,P^{-1}=P^{T}

 
顧名思義,基本伸縮矩陣 S 的作用就是改變矩陣元的數值,但不會產生零元。矩陣 S 的每個元都和單位矩陣相同,除了 (k,k) 元設為 w\neq 0。以四階矩陣為例,設 k=3,伸縮相似變換有下面結果:

\begin{aligned} B&=S^{-1}AS\\  &=\begin{bmatrix}  1&0&0&0\\  0&1&0&0\\  0&0&1/{w}&0\\  0&0&0&1  \end{bmatrix}\begin{bmatrix}  a_{11}&a_{12}&a_{13}&a_{14}\\  a_{21}&a_{22}&a_{23}&a_{24}\\  a_{31}&a_{32}&a_{33}&a_{34}\\  a_{41}&a_{42}&a_{43}&a_{44}  \end{bmatrix}\begin{bmatrix}  1&0&0&0\\  0&1&0&0\\  0&0&w&0\\  0&0&0&1  \end{bmatrix}\\  &=\begin{bmatrix}  a_{11}&a_{12}&wa_{13}&a_{14}\\  a_{21}&a_{22}&wa_{23}&a_{24}\\  a_{31}/w&a_{32}/w&a_{33}&a_{34}/w\\  a_{41}&a_{42}&wa_{43}&a_{44}  \end{bmatrix}\end{aligned}

An\times n 階上三角矩陣,對於 i>ja_{ij}=0,則 B=[b_{ij}] 的各元和 A=[a_{ij}] 相同,除了 b_{ik}=wa_{ik}b_{kj}=a_{kj}/w1\le i\le k-1k+1\le j\le n

 
基本取代矩陣 R 是唯一一個具有消滅功能的相似變換矩陣,R 的每一個元都和單位矩陣相同,除了 (i,j) 元為 w\neq 0i\neq j。下例中,(i,j)=(2,3)

\begin{aligned} C&=R^{-1}AR\\  &=\begin{bmatrix}  1&0&0&0\\  0&1&-w&0\\  0&0&1&0\\  0&0&0&1  \end{bmatrix}\begin{bmatrix}  a_{11}&a_{12}&a_{13}&a_{14}\\  a_{21}&a_{22}&a_{23}&a_{24}\\  a_{31}&a_{32}&a_{33}&a_{34}\\  a_{41}&a_{42}&a_{43}&a_{44}  \end{bmatrix}\begin{bmatrix}  1&0&0&0\\  0&1&w&0\\  0&0&1&0\\  0&0&0&1  \end{bmatrix}\\  &=\begin{bmatrix}  a_{11}&a_{12}& a_{13}+wa_{12} &a_{14}\\  a_{21}-wa_{31}&a_{22}-wa_{32}& a_{23}+wa_{22}-wa_{33}-w^2a_{32}&a_{24}-wa_{34}\\  a_{31}&a_{32}&a_{33}+wa_{32}&a_{34}\\  a_{41}&a_{42}&a_{43}+wa_{42}&a_{44}  \end{bmatrix}\end{aligned}

An\times n 階上三角矩陣,則 C=[c_{ij}] 的各元和 A=[a_{ij}] 相同,除了右上三角內的第 i 列和第 j 行之外,亦即,c_{ij}=a_{ij}+wa_{ii}-wa_{jj}c_{pj}=a_{pj}+wa_{pi}p\neq i1\le p\le j-1c_{iq}=a_{iq}-wa_{jq}q\neq ji+1\le q\le n

 
基本相似變換矩陣準備妥當後,現在可以開始化簡。步驟二的目標在將上三角矩陣 T 的非主對角分塊全部予以消滅。見下例,此三角矩陣 T 包含兩個主對角分塊:

T=\begin{bmatrix}  T(\lambda_1)&X\\  0&T(\lambda_2)  \end{bmatrix}=\begin{bmatrix}  \lambda_1&t_{12}&t_{13}&t_{14}\\  0&\lambda_1&t_{23}&t_{24}\\  0&0&\lambda_2&t_{34}\\  0&0&0&\lambda_2  \end{bmatrix}

其中 X=\begin{bmatrix}  t_{13}&t_{14}\\  t_{23}&t_{24}  \end{bmatrix}。倘若我們想要消滅 t_{24},設基本取代矩陣 R(2,4) 元為 w,代入計算 R^{-1}TR,可得

R^{-1}TR=\begin{bmatrix}  \lambda_1&t_{12}&t_{13}&t_{14}+wt_{12}\\  0&\lambda_1&t_{23}&t_{24}+w\lambda_1-w\lambda_2\\  0&0&\lambda_2&t_{34}\\  0&0&0&\lambda_2  \end{bmatrix}

由於 \lambda_1\neq\lambda_2,如欲消滅 (2,4) 元,可令 w=-\frac{t_{24}}{\lambda_1-\lambda_2}。按照這個方式,先清除 X 分塊的最底列,然後逐步往上推進,直到 X 的全部元都被消滅殆盡為止,可使 T=\begin{bmatrix}  T(\lambda_1)&X\\  0&T(\lambda_2)  \end{bmatrix} 相似於 \begin{bmatrix}  T(\lambda_1)&0\\  0&T(\lambda_2)  \end{bmatrix}。將此程序推廣至一般矩陣,先殲滅最底下的非主對角分塊,然後往上擴大取代相似變換的戰場至所有非主對角分塊,可得下列相似分塊對角矩陣:

D=\begin{bmatrix}  T(\lambda_1)&0&\cdots&0\\  0&T(\lambda_2)&\cdots&0\\  \vdots&\vdots&\ddots&\vdots\\  0&0&\cdots&T(\lambda_m)  \end{bmatrix}

 
我們的終極任務是設法令主對角分塊 T(\lambda_i) 相似於超級 Jordan 分塊

J(\lambda_i)=\begin{bmatrix}  J_1(\lambda_i)&0&\cdots&0\\  0&J_2(\lambda_i)&\cdots&0\\  \vdots&\vdots&\ddots&\vdots\\  0&0&\cdots&J_{n_i}(\lambda_i)  \end{bmatrix}

各基本 Jordan 分塊 J_{\ast}(\lambda_i) 具有以下形式:

J_{\ast}(\lambda_i)=\begin{bmatrix}  \lambda_i&1&~&~\\  ~&\ddots&\ddots&~\\  ~&~&\ddots&1\\  ~&~&~&\lambda_i  \end{bmatrix}

因為 D 為主對角分塊 T(\lambda_i) 的直和:

D=T(\lambda_1)\oplus T(\lambda_2)\oplus\cdots\oplus T(\lambda_m)

我們可以分別對上三角矩陣 T(\lambda_i) 執行相似變換,故以下分析僅針對個別 T(\lambda_i)

 
第三個步驟有別於先前兩個步驟,我們還需要基本伸縮相似變換。考慮下面一般形式的上三角矩陣:

T=\begin{bmatrix}  3&2&4\\  0&4&6\\  0&0&5  \end{bmatrix}

為使矩陣的數值簡約,我們希望緊鄰主對角元之上的非零元為 1,例如,欲將 T(1,2)2 替換為 1,可設基本伸縮矩陣

S_1=\begin{bmatrix}  1&0&0\\  0&\frac{1}{2}&0\\  0&0&1  \end{bmatrix}

計算確認

T_1=S_1^{-1}TS_1=\begin{bmatrix}  3&1&4\\  0&4&12\\  0&0&5  \end{bmatrix}

欲將 T_1(2,3)12 改為 1,則令

S_2=\begin{bmatrix}  1&0&0\\  0&1&0\\  0&0&\frac{1}{12}  \end{bmatrix}

以同樣方式可算得

T_2=S_2^{-1}T_1S_2=\begin{bmatrix}  3&1&\frac{1}{3}\\  0&4&1\\  0&0&5  \end{bmatrix}

S=S_1S_2,經過伸縮相似變換 S^{-1}TS 即可將 T(i,i+1) 非零元全部變更為 1

 
最後,我們運用歸納法證明 m\times m 階上三角矩陣 T(\lambda) 相似於超級 Jordan 分塊 J(\lambda)。當 m=1 時,T(\lambda)=[\lambda] 為一階基本 Jordan 分塊。當 m=2 時,T(\lambda)=\begin{bmatrix}  \lambda&a\\  0&\lambda  \end{bmatrix}。若 a=0T(\lambda) 包含兩個一階基本 Jordan 分塊;若 a\neq 0,操作伸縮相似變換可使 T(\lambda) 相似於二階基本 Jordan 分塊 \begin{bmatrix}  \lambda&1\\  0&\lambda  \end{bmatrix}。再來考慮 m>2,假設 T(\lambda)(m-1)\times(m-1) 階領先(左上)主子陣 \tilde{T}(\lambda) 相似於 Jordan 矩陣 \tilde{J}(\lambda)\tilde{J}(\lambda)=M^{-1}\tilde{T}(\lambda)M。令 S=\begin{bmatrix}  M&0\\  0&1  \end{bmatrix},就有

T^{\prime}(\lambda)=S^{-1}T(\lambda)S= \begin{bmatrix}  \tilde{J}(\lambda)&\ast\\  0&\lambda  \end{bmatrix}

 
舉例來說,

T^{\prime}(\lambda)=\begin{bmatrix}  \lambda&1&0&0&0&t_{16}\\  0&\lambda&0&0&0&t_{26}\\  0&0&\lambda&1&0&t_{36}\\  0&0&0&\lambda&1&t_{46}\\  0&0&0&0&\lambda&t_{56}\\  0&0&0&0&0&\lambda  \end{bmatrix}

下一步該如何消去最右行的元呢?T^{\prime} 的主對角元都是 \lambda,表面上,步驟二使用的取代相似變換在此似乎難以發揮作用。幸好,由於 T^{\prime}(\lambda) 具有特殊簡約型態,我們依然能夠運用取代相似變換達成使命,不過這需要一些精巧的設計。以下分開兩種情況討論:t_{16}, t_{36}, t_{46} 佔據的列包含元 1,而 t_{26}, t_{56} 所佔的列則不含元 1。針對第一種情況,如果要消滅 t_{36},我們可以藉助列 3 上佔據 (3,4) 元的 1。採用類似步驟二使用的取代相似矩陣的設計方法,不難得到符合要求的 6\times 6 階變換矩陣 R(4,6) 元為 -t_{36},計算後確認 R^{-1}T^{\prime}(\lambda)RT^{\prime}(\lambda) 的差異是 R^{-1}T^{\prime}(\lambda)R(3,6) 元變成 0,其他各元則完全不受影響。運用同樣方式,選擇適當的取代相似變換矩陣,我們可以一舉清除其他屬於第一類的 t_{ij},於是得到下列相似矩陣

T^{\prime\prime}(\lambda)=\begin{bmatrix}  \lambda&1&0&0&0&0\\  0&\lambda&0&0&0&t_{26}\\  0&0&\lambda&1&0&0\\  0&0&0&\lambda&1&0\\  0&0&0&0&\lambda&t_{56}\\  0&0&0&0&0&\lambda  \end{bmatrix}

我們觀察出 t_{26} 對應一個二階基本 Jordan 分塊,而 t_{56} 則對應一個三階基本 Jordan 分塊,這兩個數將會影響最後的 Jordan 矩陣結構。下面再區分四種情形說明:

(1) 若 t_{26}=t_{56}=0,則 T^{\prime\prime}(\lambda) 已經是 Jordan 矩陣,由一個 1 階,2 階和 3 階基本 Jordan 分塊直和構成。

(2) 若 t_{26}=0t_{56}\neq 0,運用伸縮相似變換可將 t_{56} 替換為 1,便得到 Jordan 矩陣,此即一個 2 階和一個 4 階基本 Jordan 分塊的直和。

(3) 若 t_{26}\neq 0t_{56}=0,先使用下面的排列相似變換

P=\begin{bmatrix}  1&0&0&0&0&0\\  0&1&0&0&0&0\\  0&0&0&1&0&0\\  0&0&0&0&1&0\\  0&0&0&0&0&1\\  0&0&1&0&0&0  \end{bmatrix}

產生行排序 (1,2,6,3,4,5),可得

P^{-1}T^{\prime\prime}(\lambda)P=\begin{bmatrix}  \lambda&1&0&0&0&0\\  0&\lambda&t_{26}&0&0&0\\  0&0&\lambda&0&0&0\\  0&0&0&\lambda&1&0\\  0&0&0&0&\lambda&1\\  0&0&0&0&0&\lambda  \end{bmatrix}

再利用伸縮相似變換將 t_{26}1 替換,就得到 Jordan 矩陣,它為兩個三階基本 Jordan 分塊直和。

(4) 最後一種情形較為複雜,t_{26}\neq 0t_{56}\neq 0。先使用伸縮相似變換將 t_{56} 改為 1,接著再執行兩次取代相似變換。第一次變換的目的是將 t_{26} 移動至元 1 佔據的列。譬如,欲將 t_{26} 移至第 1 列,可利用取代相似變換矩陣 R_1,其 (2,5) 元為 t_{26},計算得到

R_1^{-1}T^{\prime\prime}(\lambda)R_1=\begin{bmatrix}  \lambda&1&0&0&t_{26}&0\\  0&\lambda&0&0&0&0\\  0&0&\lambda&1&0&0\\  0&0&0&\lambda&1&0\\  0&0&0&0&\lambda&1\\  0&0&0&0&0&\lambda  \end{bmatrix}

接著欲剔除 t_{26},再使用取代相似變換矩陣 R_2,其 (1,4) 元為 t_{26}R_2^{-1}R_1^{-1}T^{\prime\prime}(\lambda)R_1R_2 即為包含一個 2 階和一個 4 階基本 Jordan 分塊的 Jordan 矩陣。

 
最後補充說明基本 Jordan 分塊的順序可以依照個人喜好重新排列,例如,透過下面的排列矩陣設定行排序 (3,4,5,6,1,2)

P=\begin{bmatrix}  0&0&0&0&1&0\\  0&0&0&0&0&1\\  1&0&0&0&0&0\\  0&1&0&0&0&0\\  0&0&1&0&0&0\\  0&0&0&1&0&0  \end{bmatrix}

可使 Jordan 矩陣

J=\begin{bmatrix}  \lambda&1\\  0&\lambda  \end{bmatrix}\oplus\begin{bmatrix}  \lambda&1&0&0\\  0&\lambda&1&0\\  0&0&\lambda&1\\  0&0&0&\lambda  \end{bmatrix}

排列相似於

P^{-1}JP=\begin{bmatrix}  \lambda&1&0&0\\  0&\lambda&1&0\\  0&0&\lambda&1\\  0&0&0&\lambda  \end{bmatrix}\oplus\begin{bmatrix}  \lambda&1\\  0&\lambda  \end{bmatrix}

 
參考文獻:
Richard A. Baualdi, The Jordan Canonical Form: an Old Proof, The American Mathematical Monthly, Vol. 94, No. 3, 1987, pp. 257-267.

This entry was posted in 線性代數專欄, 典型形式 and tagged , , , , , . Bookmark the permalink.

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s