Jordan-Chevalley 分解

本文的閱讀等級:高級

對於一 n\times n 階複矩陣 A,Jordan-Chevalley 分解[1]是指存在唯一的可對角化矩陣 S 與冪零 (nilpotent) 矩陣 N 使得 A=S+NSN=NS (稱為可交換)。對於複矩陣,Jordan-Chevalley 分解很容易以 Jordan 典型形式表達 (見“Jordan 形式大解讀 (上)”)。我們利用 Jordan 形式證明 Jordan-Chevalley 分解的存在性與唯一性。

 
n\times n 階矩陣 A 的 Jordan 典型形式為 A=MJM^{-1},其中 Jordan 矩陣 Jn_i\times n_i 階 Jordan 分塊 J_i 構成的分塊對角矩陣,或用直和 (direct sum) 表示為

\displaystyle  J=\begin{bmatrix}  J_1&&\\  &\ddots&\\  &&J_k  \end{bmatrix}=\bigoplus_{i=1}^k J_i

分塊階數滿足 n_1+\cdots+n_k=n。Jordan 分塊 J_i 的形式如下 (見“Jordan 分塊”):

J_i=\begin{bmatrix}    \lambda_i&1& &\\    &\ddots&\ddots&\\    &&\ddots&1\\    &&&\lambda_i    \end{bmatrix}=\begin{bmatrix}    \lambda_i&& &\\    &\ddots&&\\    &&\ddots&\\    &&&\lambda_i    \end{bmatrix}+\begin{bmatrix}    0&1& &\\    &\ddots&\ddots&\\    &&\ddots&1\\    &&&0    \end{bmatrix}=D_i+T_i

其中 \lambda_iA 的一個特徵值 (對於 i\neq j\lambda_i\lambda_j 未必相異),D_i=\lambda_iI_{n_i},且 T_i=J_i-D_i。令 D=\bigoplus_{i=1}^k D_iA 的特徵值構成的對角矩陣,T=\bigoplus_{i=1}^k T_i 為上三角矩陣且所有的主對角元為零。因此,

\displaystyle  J=\bigoplus_{i=1}^kJ_i=\bigoplus_{i=1}^k(D_i+T_i)=\bigoplus_{i=1}^kD_i+\bigoplus_{i=1}^kT_i=D+T

因為 T 的特徵值皆為零,T 是冪零矩陣 (見“特殊矩陣 (1):冪零矩陣”)。寫出

A=M(D+T)M^{-1}=MDM^{-1}+MTM^{-1}

其中 S=MDM^{-1} 是對角化形式 (S 相似於 D,故 SA 有相同的特徵值),且 N=MTM^{-1} 是冪零矩陣 (N 相似於 T,故 N 的所有特徵值為零)。使用 D_iT_i=(\lambda_iI_{n_i})T_i=T_i(\lambda_iI_{n_i})=T_iD_i

\begin{aligned}  DT&=\bigoplus_{i=1}^k D_i\bigoplus_{i=1}^k T_i\\  &=\bigoplus_{i=1}^k D_iT_i\\  &=\bigoplus_{i=1}^k T_iD_i\\  &=\bigoplus_{i=1}^k T_i\bigoplus_{i=1}^k D_i\\  &=TD,  \end{aligned}

故得

\begin{aligned}  SN&=(MDM^{-1})(MTM^{-1})\\  &=MDTM^{-1}\\  &=MTDM^{-1}\\  &=(MTM^{-1})(MDM^{-1})\\  &=NS.\end{aligned}

 
接著證明 Jordan-Chevalley 分解的唯一性。假設可對角化矩陣 S' 與冪等矩陣 N' 使得 A=S'+N'S'N'=N'S'。將 n\times n 階可逆矩陣 M 表示為 M=\begin{bmatrix}  M_1&\cdots&M_k  \end{bmatrix},其中 M_i=\begin{bmatrix}  \mathbf{x}_{i1}&\cdots&\mathbf{x}_{in_i}  \end{bmatrix}n\times n_i 階分塊,\mathbf{x}_{ij}\in\mathbb{C}^n1\le i\le k1\le j\le n_i。Jordan 形式 AM=MJ 的等號左邊是

A\begin{bmatrix}  M_1&\cdots&M_k  \end{bmatrix}=\begin{bmatrix}  AM_1&\cdots&AM_k  \end{bmatrix}

等號右邊是

MJ=\begin{bmatrix}  M_1&\cdots&M_k  \end{bmatrix}\begin{bmatrix}  J_1&&\\  &\ddots&\\  &&J_k  \end{bmatrix}=\begin{bmatrix}  M_1J_1&\cdots&M_kJ_k\end{bmatrix}

比較等號兩邊,可得 AM_i=M_iJ_i

A\begin{bmatrix}  \mathbf{x}_{i1}&\cdots&\mathbf{x}_{in_i}  \end{bmatrix}=\begin{bmatrix}  \mathbf{x}_{i1}&\cdots&\mathbf{x}_{in_i}  \end{bmatrix}\begin{bmatrix}  \lambda_i&1&&\\  &\ddots&\ddots&\\  &&\ddots&1\\  &&&\lambda_i  \end{bmatrix},~~1\le i\le k

展開矩陣乘積得到下列 n_i 個方程式,依序可解出 \mathbf{x}_{i1},\ldots,\mathbf{x}_{in_i}

\begin{aligned}    A\mathbf{x}_{i1}=\lambda\mathbf{x}_{i1}~~&\Rightarrow~~(A-\lambda_i I)\mathbf{x}_{i1}=\mathbf{0}\\    A\mathbf{x}_{i2}=\mathbf{x}_{i1}+\lambda_i\mathbf{x}_{i2}~~&\Rightarrow~~(A-\lambda_i I)\mathbf{x}_{i2}=\mathbf{x}_{i1}\\       &\vdots\\      A\mathbf{x}_{in_i}=\mathbf{x}_{i,n_i-1}+\lambda_i\mathbf{x}_{in_i}~~&\Rightarrow~~(A-\lambda_i I)\mathbf{x}_{in_i}=\mathbf{x}_{i,n_i-1}\end{aligned}

對應特徵值 \lambda_i\mathbf{x}_{i1}A 的特徵向量,\mathbf{x}_{i2},\mathbf{x}_{i3},\ldots,\mathbf{x}_{in_i} 稱為 A 的廣義特徵向量,分別滿足 (A-\lambda_i I)^j\mathbf{x}_{ij}=\mathbf{0}1\le j\le n_i (見“Jordan 形式大解讀之尋找廣義特徵向量”)。採用相同方式,從 SM=MD 可導出 SM_i=M_iD_i=\lambda_iM_i1\le i\le k,也就是說,對應特徵值 \lambda_i\mathbf{x}_{i1},\mathbf{x}_{i2},\ldots,\mathbf{x}_{in_i}S 的特徵向量。

 
使用假設條件,

\begin{aligned}  AS'&=(S'+N')S'=S'S'+N'S'\\  &=S'S'+S'N'=S'(S'+N')=S'A.\end{aligned}

設矩陣多項式 f(A)=a_mA^m+\cdots+a_1A+a_0I,直接計算不難驗證 f(A)S'=S'f(A)。因此,

(A-\lambda_iI)^{n_i}(S'\mathbf{x}_{ij})=S'(A-\lambda_iI)^{n_i}\mathbf{x}_{ij}=\mathbf{0},~~1\le j\le n_i

表明 S'\mathbf{x}_{ij}\in\hbox{span}\{\mathbf{x}_{i1},\ldots,\mathbf{x}_{in_i}\}1\le j\le n_i。換句話說,廣義特徵空間 \hbox{span}\{\mathbf{x}_{i1},\ldots,\mathbf{x}_{in_i}\}S' 的一個不變子空間 (見“不變子空間──解構線性算子的利器”)。據此,S(S'M_i)=\lambda_i(S'M_i)=(S'M_i)D_i1\le i\le k,或 S(S'M)=(S'M)D。再者,SM=MD,左乘 S',即有 S'SM=S'MD。合併上面兩式,SS'M=S'SM,右乘 M^{-1},可得 SS'=S'S,且 NN'=(A-S)(A-S')=(A-S')(A-S)=N'N

 
考慮 S-S'=(A-N)-(A-N')=N'-N。因為 SS' 可對角化並可交換,即知 SS' 同時可對角化 (見“同時可對角化矩陣”),故

S-S'=MDM^{-1}-MD'M^{-1}=M(D-D')M^{-1}

其中 D-D' 為對角矩陣。使用二項式定理,

\displaystyle   (N'-N)^{2n}=\sum_{j=0}^{2n}\binom{2n}{j}(N')^jN^{2n-j}=0

上式每一項都包含 N^p=0(N')^p=0p\ge n。因此,N'-N 是冪零矩陣。以上結果說明 S-S'=N'-N 是可對角化冪零矩陣,推論 D-D'=0,因此證明 S-S'=N'-N=0

 
註解
[1] 維基百科:Jordan–Chevalley decomposition

This entry was posted in 線性代數專欄, 典型形式 and tagged , , , . Bookmark the permalink.

3 則回應給 Jordan-Chevalley 分解

  1. 通告: 新文章 Jordan-Chevalley 分解 - OnlyUcan

  2. Meiyue Shao 說:

    应该说在复数域上 Jordan-Chevalley 分解通常不如 Jordan 标准型简单易用,不过 Jordan-Chevalley 分解的重要性在于它在一般的域上仍然存在。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s