Jordan 分塊

本文的閱讀等級:中級

在線性代數中,所謂「相似家族」是指其中成員矩陣彼此具有相似關係。具體地說,若 AB 同屬一個「相似家族」,即 A 相似於 B,則存在一可逆矩陣 M 使得 M^{-1}AM=B。相似是一種等價關係,相似變換下的不變性質包括:特徵多項式、最小多項式、特徵值、行列式、跡數、矩陣秩,以及 Jordan 典型形式 (見“相似變換下的不變性”)。Jordan 形式因創造人法國數學家約當 (Camille Jordan) 而得名。Jordan 分塊為一上三角矩陣,其中主對角元是相同常數,設為 \lambda,主對角上標元 (superdiagonal) 都等於 1,其上的所有元為零,如下所示:

\displaystyle  \begin{bmatrix}  \lambda&1&&&\\  &\lambda&1&&\\  &&\ddots&\ddots&\\  &&&\lambda&1\\  &&&&\lambda  \end{bmatrix}

Jordan 矩陣是由 Jordan 分塊構成的分塊對角矩陣,或者說 Jordan 矩陣是 Jordan 分塊的直和 (direct sum),如下例:

\displaystyle  \begin{bmatrix}  3&1\\  0&3  \end{bmatrix}\oplus\begin{bmatrix}  2&1&0\\  0&2&1\\  0&0&2  \end{bmatrix}\oplus\begin{bmatrix}  2  \end{bmatrix}=\begin{bmatrix}  3&1&\vline& & & & & \\  &3&\vline& & & & & \\\cline{1-6}  & &\vline & 2& 1& & \vline & \\  & &\vline & & 2&1& \vline & \\  & &\vline & & & 2& \vline & \\\cline{4-8}  & & & & & & \vline & 2  \end{bmatrix}

Jordan 形式定理表明任一 n\times n 階矩陣 A 必可表示為 Jordan 典型形式 (或稱 Jordan 標準型) A=MJM^{-1},其中 J 是一 Jordan 矩陣 (見“Jordan 形式大解讀 (上)”)。如果排除 Jordan 分塊在 Jordan 矩陣內的排列變化,任一方陣 A 相似於唯一的 Jordan 矩陣 J。基於這個事實,我們說每一「相似家族」都有唯一一個 Jordan 矩陣作為代表。本文探討 Jordan 矩陣的構造單元 Jordan 分塊的一系列問題,以增進瞭解 Jordan 典型形式的解析方法和技巧。

 
特徵多項式與最小多項式

考慮 n\times n 階 Jordan 分塊

\displaystyle  J(\lambda)=\begin{bmatrix}  \lambda&1& &\\  &\ddots&\ddots&\\  &&\ddots&1\\  &&&\lambda  \end{bmatrix}

以下設特徵多項式和最小多項式 (次數最小的消滅多項式,見“最小多項式 (上)”) 皆為首一多項式,即領先係數等於 1。在不造成混淆的情形下,我用簡寫符號 J 替代 J(\lambda)。因為 J 有重複 n 次的特徵值 \lambda,特徵多項式是 p_J(t)=(t-\lambda)^n。將 Jordan 分塊分解為 J=\lambda I+N,其中

\displaystyle  N=J-\lambda I=\begin{bmatrix}  0&1&&\\  &\ddots&\ddots&\\  &&\ddots&1\\  &&&0  \end{bmatrix}

是冪零 (nilpotent) 矩陣 (見“特殊矩陣 (1):冪零矩陣”),具有下列性質:若 k<n,則 N^k\neq 0;若 k\ge n,則 N^k=0。以 n=4 為例,

\displaystyle  N=\begin{bmatrix}  0&1&0&0\\  0&0&1&0\\  0&0&0&1\\  0&0&0&0  \end{bmatrix},N^2=\begin{bmatrix}  0&0&1&0\\  0&0&0&1\\  0&0&0&0\\  0&0&0&0  \end{bmatrix},N^3=\begin{bmatrix}  0&0&0&1\\  0&0&0&0\\  0&0&0&0\\  0&0&0&0  \end{bmatrix},N^4=\begin{bmatrix}  0&0&0&0\\  0&0&0&0\\  0&0&0&0\\  0&0&0&0  \end{bmatrix}

因為 (J-\lambda I)^k=N^k\neq 00\le k\le n-1,且 (J-\lambda I)^n=N^n=0,故知 Jordan 分塊 J 的最小多項式為 m_J(t)=(t-\lambda)^n。這個結果點出了最小多項式的一個重要性質:若 Jordan 矩陣的最小多項式包含因式 (t-\lambda)^n,則特徵值為 \lambda 的最大 Jordan 分塊階數 (稱為指標,index) 等於 n。上例顯示所有的 N^k 呈現簡約列梯形式 (reduced row echelon form),推得 \hbox{rank}N^k=n-k0\le k\le n。值得注意的是,N^k 的行空間存在包容關係:若 i < j,則 C(N^j)\subset C(N^i),即 C(N^j)C(N^i) 的一個真子集 (proper subset),也就有 \hbox{rank}(aN^i+bN^j)=\hbox{rank}(N^i)=n-i,其中 ab 是非零常數。這個結果可以推廣至多個 N^k 的線性組合:

\displaystyle   \hbox{rank}(a_1N^{i_1}+\cdots+a_kN^{i_k})=\hbox{rank}(N^q)=n-q

其中 q=\min\{i_1,\ldots,i_k\},所有的 a_j 是非零常數。

 
定理一:若一 n\times n 階矩陣 A 的特徵多項式和最小多項式皆為 (t-\lambda)^n,則 A 相似於 Jordan 分塊 J(\lambda)

A 的 Jordan 典型形式為 A=SJS^{-1},其中 J 是一 Jordan 矩陣。兩相似矩陣有相同的特徵多項式和最小多項式,故 p_J(t)=p_A(t)=(t-\lambda)^nm_J(t)=m_A(t)=(t-\lambda)^n。從特徵多項式 p_J(t)=(t-\lambda)^n 可知 n\times n 階 Jordan 矩陣 J 是 Jordan 分塊 J_{\ast}(\lambda) 的直和:

\displaystyle  J=J_1(\lambda)\oplus\cdots\oplus J_k(\lambda)

其中 J_i(\lambda)n_i\times n_i 階 Jordan 分塊,n_1+\cdots+n_k=n。另外,從 m_J(t)=(t-\lambda)^n 可斷定 J 由單一 n\times n 階 Jordan 分塊 J(\lambda) 構成,否則最小多項式為 m_J(t)=(t-\lambda)^qq=\max\{n_1,\ldots,n_k\}<n

 
廣義特徵向量

我們知道 n\times n 階 Jordan 分塊 J 的特徵值 \lambda 的代數重數為 n。因為 \dim N(J-\lambda I)=1,幾何重數 (對應特徵值 \lambda 的最大線性獨立集的向量數) 為 1。對應 \lambda 的唯一特徵向量是標準單位向量 \mathbf{e}_1=(1,0,\ldots,0)^T,因為

\displaystyle  J\mathbf{e}_1=\begin{bmatrix}  \lambda&1& &\\  &\ddots&\ddots&\\  &&\ddots&1\\  &&&\lambda  \end{bmatrix}\begin{bmatrix}  1\\  0\\  \vdots\\  0  \end{bmatrix}=\begin{bmatrix}  \lambda\\  0\\  \vdots\\  0  \end{bmatrix}=\lambda\mathbf{e}_1

計算 J\mathbf{e}_j2\le j\le n,可得

\displaystyle\begin{aligned}  J\mathbf{e}_2&=\mathbf{e}_1+\lambda\mathbf{e}_2\\  J\mathbf{e}_3&=\mathbf{e}_2+\lambda\mathbf{e}_3\\  &\vdots\\  J\mathbf{e}_n&=\mathbf{e}_{n-1}+\lambda\mathbf{e}_n,  \end{aligned}

或改寫為

\displaystyle\begin{aligned}  (J-\lambda I)\mathbf{e}_2&=\mathbf{e}_1~~~~\Rightarrow~~(J-\lambda I)^2\mathbf{e}_2=(J-\lambda I)\mathbf{e}_1=\mathbf{0}\\  (J-\lambda I)\mathbf{e}_3&=\mathbf{e}_2~~~~\Rightarrow~~(J-\lambda I)^3\mathbf{e}_3=(J-\lambda I)^2\mathbf{e}_2=\mathbf{0}\\  &\vdots\\  (J-\lambda I)\mathbf{e}_n&=\mathbf{e}_{n-1}~\Rightarrow~~(J-\lambda I)^n\mathbf{e}_n=(J-\lambda I)^{n-1}\mathbf{e}_{n-1}=\mathbf{0}.  \end{aligned}

我們定義 \mathbf{x}\neq\mathbf{0} 為對應特徵值 \lambda 的廣義特徵向量,若

\displaystyle  (J-\lambda I)^m\mathbf{x}=\mathbf{0}

其中 m 為滿足上式的最小正整數,也就是說,\mathbf{x}\in N(J-\lambda I)^{m},但 \mathbf{x}\notin N(J-\lambda I)^{m-1}。當 m=1 時,廣義特徵向量即為特徵向量。特徵向量 \mathbf{e}_1 合併廣義特徵向量集 \{\mathbf{e}_2,\ldots,\mathbf{e}_n\} 構成 \mathbb{C}^n 的標準基底。

 
轉置

Jordan 分塊 J 相似於 J^T。以 n=4 為例,

\displaystyle  \begin{bmatrix}  0&0&0&1\\  0&0&1&0\\  0&1&0&0\\  1&0&0&0\end{bmatrix}  \begin{bmatrix}  \lambda&1&0&0\\  0&\lambda&1&0\\  0&0&\lambda&1\\  0&0&0&\lambda\end{bmatrix}  \begin{bmatrix}  0&0&0&1\\  0&0&1&0\\  0&1&0&0\\  1&0&0&0\end{bmatrix}=\begin{bmatrix}  \lambda&0&0&0\\  1&\lambda&0&0\\  0&1&\lambda&0\\  0&0&1&\lambda  \end{bmatrix}

利用此性質可以證明任一方陣 A 相似於 A^T (見“矩陣與其轉置的相似性”)。

 
矩陣函數

給定一函數 f(x),考慮在點 \lambda 的泰勒展開式

\displaystyle  f(x)=f(\lambda)+f^{\prime}(\lambda)(x-\lambda)+\frac{f^{\prime\prime}(\lambda)}{2!}(x-\lambda)^2+\cdots

以 Jordan 分塊 J 取代 x,單位矩陣 I 取代常數 1,即得 Jordan 分塊函數,如下:

\displaystyle\begin{aligned}  f(J)&=f(\lambda)I+ f^{\prime}(\lambda)(J-\lambda I)+\frac{f^{\prime\prime}(\lambda)}{2!}(J-\lambda I)^2+\cdots\\  &=f(\lambda)I+ f^{\prime}(\lambda)N+\frac{f^{\prime\prime}(\lambda)}{2!}N^2+\cdots+\frac{f^{(n-1)}(\lambda)}{(n-1)!}N^{n-1}\\  &=\begin{bmatrix}  f(\lambda)&f^{\prime}(\lambda)&\frac{f^{\prime\prime}(\lambda)}{2!}&\cdots&\frac{f^{(n-1)}(\lambda)}{(n-1)!}\\  ~&f(\lambda)&f^{\prime}(\lambda)&\ddots&\vdots\\    ~&~&\ddots&\ddots&\frac{f''(\lambda)}{2!}\\[0.3em]    ~&~&~&f(\lambda)&f^{\prime}(\lambda)\\    ~&~&~&~&f(\lambda)    \end{bmatrix},\end{aligned}

其中 f^{(k)}(\lambda) 表示 f(\lambda)k 階導函數。例如,代入 f(\lambda)=e^\lambda,可得 Jordan 分塊的矩陣指數

\displaystyle  e^J=\begin{bmatrix}  e^\lambda&e^\lambda&\frac{e^{\lambda}}{2!}&\cdots&\frac{e^\lambda}{(n-1)!}\\  ~&e^\lambda&e^\lambda&\ddots&\vdots\\    ~&~&\ddots&\ddots&\frac{e^\lambda}{2!}\\[0.3em]    ~&~&~&e^\lambda&e^\lambda\\    ~&~&~&~&e^\lambda    \end{bmatrix}=e^{\lambda}\begin{bmatrix}  1&1&\frac{1}{2!}&\cdots&\frac{1}{(n-1)!}\\    ~&1&1&\ddots&\vdots\\    ~&~&\ddots&\ddots&\frac{1}{2!}\\[0.3em]    ~&~&~&1&1\\    ~&~&~&~&1    \end{bmatrix}

Jordan 分塊函數的表達式可用來計算一般矩陣的矩陣函數 (見“矩陣函數 (下)”)。

 
冪矩陣

使用 Jordan 分塊的矩陣函數公式,代入 f(\lambda)=\lambda^m,可得 Jordan 分塊的冪矩陣

\displaystyle  J^m=\begin{bmatrix}  \lambda^m&m\lambda^{m-1}&\frac{m(m-1)\lambda^{m-2}}{2!}&\cdots&\binom{m}{n-1}\lambda^{m-n+1}\\  ~&\lambda^m&m\lambda^{m-1}&\ddots&\vdots\\    ~&~&\ddots&\ddots&\frac{m(m-1)\lambda^{m-2}}{2!}\\[0.3em]    ~&~&~&\lambda^m&m\lambda^{m-1}\\    ~&~&~&~&\lambda^m    \end{bmatrix}

其中 \binom{m}{k}=0,若 k>m

 
定理二:令 J(\lambda)n\times n 階 Jordan 分塊。若 \lambda\neq 0,則 J(\lambda)^m 相似於 J(\lambda^m)m\ge 1

如果 \lambda=0n\ge 2J(0)J(0)^m 不存在相似關係,例如,

\displaystyle  J(0)=\begin{bmatrix}  0&1\\  0&0  \end{bmatrix},~~J(0)^2=\begin{bmatrix}  0&0\\  0&0  \end{bmatrix}

以下設 \lambda\neq 0。令 A=J(\lambda)^m。矩陣 A 可用二項式係數表示為

\displaystyle  A=\sum_{j=0}^{n-1}\binom{m}{j}\lambda^{m-j}N^{j}=\lambda^{m}I+\sum_{j=1}^{n-1}\binom{m}{j}\lambda^{m-j}N^{j}

明顯地,An 個特徵值 \lambda^m,故特徵多項式是 p_{A}(t)=(t-\lambda^m)^n。欲找出 A 的最小多項式,對於 0\le k\le n,計算

\displaystyle   \hbox{rank}\left(A-\lambda^m I\right)^k=\hbox{rank}\left(\sum_{j=1}^{n-1}\binom{m}{j}\lambda^{m-j}N^{j}\right)^k=\hbox{rank}(N^k)=n-k

換句話說,(A-\lambda^m I)^k\neq 00\le k\le n-1,且 (A-\lambda^m I)^n=0,即知 A 的最小多項式是 m_{A}(t)=(t-\lambda^m)^n。根據定理一,A 相似於 Jordan 分塊 J(\lambda^m),因此得證。

 
逆矩陣

\lambda\neq 0,Jordan 分塊 J(\lambda) 是可逆矩陣。套用 Jordan 分塊函數公式,代入 f(\lambda)=1/\lambda,可得

\displaystyle  J(\lambda)^{-1}=\begin{bmatrix}  \lambda^{-1}&-\lambda^{-2}&\lambda^{-3}&\cdots&(-1)^{n-1}\lambda^{-n}\\  ~&\lambda^{-1}&-\lambda^{-2}&\ddots&\vdots\\    ~&~&\ddots&\ddots&\lambda^{-3}\\    ~&~&~&\lambda^{-1}&-\lambda^{-2}\\    ~&~&~&~&\lambda^{-1}    \end{bmatrix}

 
定理三:令 J(\lambda)n\times n 階 Jordan 分塊。若 \lambda\neq 0,則 J(\lambda)^{-1} 相似於 J(\lambda^{-1})

我們可以採用定理二的證法,下面提供另一個證明。若 \lambda\neq 0,不難驗證 J(\lambda)^{-1} 相似於 J(\lambda^{-1}) 等價於 J(\lambda) 相似於 J(\lambda^{-1})^{-1}。令 A=J(\lambda^{-1})。下面證明 A^{-1} 相似於 J(\lambda)。因為 p_A(t)=m_A(t)=(t-\lambda^{-1})^n,由最小多項式定義可知 (A-\lambda^{-1}I)^k\neq 00\le k\le n-1,且 (A-\lambda^{-1}I)^n=0。所以,

\displaystyle\begin{aligned}  (\lambda A^{-1})^k(A-\lambda^{-1}I)^k&=(\lambda I-A^{-1})^k=(-1)^k(A^{-1}-\lambda I)^k\neq 0,~~0\le k\le n-1\\  (\lambda A^{-1})^n(A-\lambda^{-1}I)^n&=(\lambda I-A^{-1})^n=(-1)^n(A^{-1}-\lambda I)^n=0.  \end{aligned}

上面兩式表明 m_{A^{-1}}(t)=(t-\lambda)^n。由於最小多項式整除特徵多項式,n\times n 階矩陣 A^{-1} 的特徵多項式必為 p_{A^{-1}}(t)=(t-\lambda)^n。使用定理一,推知 A^{-1} 相似於 J(\lambda)

 
舉一個例子說明定理二和定理三的應用。使用這個性質:若 A_i 相似於 B_i1\le i\le k,則 A_1\oplus\cdots\oplus A_k 相似於 B_1\oplus\cdots\oplus B_k。如果我們已經知道 A 的 Jordan 矩陣

\displaystyle  \begin{bmatrix}  3&1&\vline& & & & & \\  &3&\vline& & & & & \\\cline{1-6}  & &\vline & 2& 1& & \vline & \\  & &\vline & & 2&1& \vline & \\  & &\vline & & & 2& \vline & \\\cline{4-8}  & & & & & & \vline & 2  \end{bmatrix}

定理二表明 A^m 的 Jordan 矩陣為

\displaystyle  \begin{bmatrix}  3^m&1&\vline& & & & & \\  &3^m&\vline& & & & & \\\cline{1-6}  & &\vline & 2^m& 1& & \vline & \\  & &\vline & & 2^m&1& \vline & \\  & &\vline & & & 2^m& \vline & \\\cline{4-8}  & & & & & & \vline & 2^m  \end{bmatrix}

定理三則確定 A^{-1} 的 Jordan 矩陣為

\displaystyle  \begin{bmatrix}  1/3&1&\vline& & & & & \\  &1/3&\vline& & & & & \\\cline{1-6}  & &\vline & 1/2& 1& & \vline & \\  & &\vline & & 1/2&1& \vline & \\  & &\vline & & & 1/2& \vline & \\\cline{4-8}  & & & & & & \vline & 1/2  \end{bmatrix}

 
最後再補充一個性質。

定理四:若 J(\lambda)n\times n 階 Jordan 分塊,則 -J(\lambda) 相似於 J(-\lambda)

n\times n 階簽名矩陣 S=\hbox{diag}(1,-1,1,\ldots,(-1)^{n+1})。明顯地,S^{-1}=S。直接計算可得 SJ(-\lambda)S^{-1}=-J(\lambda),即證明所求。以 n=4 為例,

\displaystyle\begin{aligned}  &\begin{bmatrix}  1&&&\\   & -1&&\\   & & 1&\\   &&&-1  \end{bmatrix}\left[\!\!\begin{array}{rrrr}  -\lambda &1&&\\  &-\lambda&1&\\  &&-\lambda&1\\  &&&-\lambda  \end{array}\!\!\right]\begin{bmatrix}  1&&&\\   & -1&&\\   & & 1&\\   &&&-1  \end{bmatrix}\\  &=\left[\!\!\begin{array}{rrrr}  -\lambda &1&&\\  &\lambda&-1&\\  &&-\lambda&1\\  &&&\lambda  \end{array}\!\!\right]\begin{bmatrix}  1&&&\\   & -1&&\\   & & 1&\\   &&&-1  \end{bmatrix}=\left[\!\!\begin{array}{rrrr}  -\lambda &-1&&\\  &-\lambda&-1&\\  &&-\lambda&-1\\  &&&-\lambda  \end{array}\!\!\right].  \end{aligned}

相關閱讀:
廣告
本篇發表於 線性代數專欄, 典型形式 並標籤為 , , , , , , , 。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s