冪矩陣的特徵值與特徵向量

本文的閱讀等級:中級

An\times n 階矩陣,\lambda_1,\ldots,\lambda_n 為特徵值 (包含相重特徵值),\mathbf{x}_1,\ldots,\mathbf{x}_n 為對應的特徵向量。如果已知 A 的所有特徵值和對應的特徵向量,我們能否找出冪矩陣 A^kk\ge 1,的所有特徵值和對應的特徵向量?使用 A\mathbf{x}_i=\lambda_i\mathbf{x}_i,計算可得

\displaystyle\begin{aligned}  A^k\mathbf{x}_i&=A^{k-1}(A\mathbf{x}_i)=A^{k-1}(\lambda_i\mathbf{x}_i)  =\lambda_iA^{k-2}(A\mathbf{x}_i)\\  &=\lambda_i^2A^{k-2}\mathbf{x}_i=\cdots=\lambda_i^k\mathbf{x}_i,  \end{aligned}

故知 A^k 有特徵值 \lambda_1^k,\ldots,\lambda_n^k,對應的特徵向量是 \mathbf{x}_1,\ldots,\mathbf{x}_n。這個結果是否表示我們已經找齊了 A^k 的特徵值與對應的特徵向量?看下面的例子:

\displaystyle  A=\begin{bmatrix}  0&1&1\\  0&0&2\\  0&0&2  \end{bmatrix}

的特徵值為 \lambda_1=\lambda_2=0\lambda_3=2,對應的特徵向量分別為 \mathbf{x}_1=\mathbf{x}_2=\begin{bmatrix}  1\\  0\\  0  \end{bmatrix}\mathbf{x}_3=\begin{bmatrix}  1\\  1\\  1  \end{bmatrix}。然而,

\displaystyle  A^2=\begin{bmatrix}  0&0&4\\  0&0&4\\  0&0&4  \end{bmatrix}

的特徵值為 \lambda'_1=\lambda'_2=0\lambda'_3=4,對應的特徵向量分別為 \mathbf{x}'_1=\begin{bmatrix}  1\\  0\\  0  \end{bmatrix}\mathbf{x}'_2=\begin{bmatrix}  0\\  1\\  0  \end{bmatrix}\mathbf{x}'_3=\begin{bmatrix}  1\\  1\\  1  \end{bmatrix}。冪矩陣 A^2 的特徵值確實是 \lambda_1^2,\lambda_2^2,\lambda_3^2,但對應的特徵向量除了包含 A 的特徵向量外,還多一個線性獨立的特徵向量 \begin{bmatrix}  0\\  1\\  0  \end{bmatrix}。換一個說法,A 不可對角化 (因為不存在 3 個線性獨立的特徵向量),A^2 卻可對角化。為甚麼會有這樣奇怪的現象?下面我們就來探討冪矩陣的最大線性獨立的特徵向量數增多的原因。

 
我們先推導 A^k 的特徵值。使用矩陣三角化的 Schur 定理 (見“矩陣三角化的 Schur 定理”):對於任一方陣 A,存在一個么正 (unitary) 矩陣 U 滿足 U^\ast=U^{-1} 使得 A=UTU^{\ast},其中 T=[t_{ij}] 是上三角矩陣。因為 A 相似於 T,上三角矩陣 T 的主對角元即為 A 的特徵值。在不失一般性的原則下,設 t_{ii}=\lambda_ii=1,\ldots,n。直接計算可得 A^k=UT^kU^{\ast},其中 T^k 是上三角矩陣,且 (T^k)_{ii}=\lambda_i^ki=1,\ldots,n。根據相似關係,A^k 的特徵值即為 T^k 的主對角元 \lambda_1^k,\ldots,\lambda_n^k。這是讀者所熟悉的冪矩陣的特徵值性質。

 
請注意下列情況:f(x)=x^k 並非一對一 (或稱單射) 函數,也就是說 \lambda_i\neq \lambda_j 可能產生 \lambda_i^k=\lambda_j^k。舉例來講,若 A=\left[\!\!\begin{array}{cr}  1&0\\  0&-1  \end{array}\!\!\right],則 A^{2k}=\begin{bmatrix}  1&0\\  0&1  \end{bmatrix}A^{2k-1}=Ak\ge 1。冪矩陣 A^{2k} 對應相重特徵值 1 (代數重數為 2) 的特徵空間由 A 對應特徵值 1-1 的特徵空間合併而成 (直和,direct sum),記為 N(A^{2k}-I)=N(A-I)\oplus N(A+I),其中 N(\cdot) 表示矩陣的零空間,即有 \dim N(A^{2k}-I)=\dim N(A-I)+\dim N(A+I) (見“補子空間與直和”),意思是 A^{2k} 的特徵值 1 的幾何重數 (特徵空間維數) 等於 A 的特徵值 1 的幾何重數與特徵值 -1 的幾何重數之和。

 
接著討論 A^k 對應特徵值 \lambda^k 的特徵空間與幾何重數,分開兩種情況:\lambda=0\lambda\neq 0。若 m\times m 階矩陣 B 的所有特徵值為零,稱為冪零 (nilpotent) 矩陣,則存在一正數 k\le m 使得 B^k=0 (見“特殊矩陣 (1):冪零矩陣”)。冪零矩陣 B 的零特徵值的代數重數為 m,根據秩─零度定理,幾何重數為 \dim N(B)=m-\text{rank}B。除非 B=0,否則 \dim N(B)<m,可知非零冪零矩陣 B 不可對角化。對於 k\ge 1N(B^k)\subseteq N(B^{k+1}) (見“矩陣與特徵值的指標”),即有 \dim N(B^k)\le\dim N(B^{k+1})。隨著 k 增大,最終將使 B^k=0,這時候 N(B^k)=\mathbb{C}^m。換句話說,B^k 的唯一特徵值 0 的幾何重數隨 k 增大至代數重數 (即矩陣階數 m)。推廣至一般情況,設 A 的特徵值 0 的代數重數為 m。考慮 A 的 Jordan 形式

\displaystyle  A=M\begin{bmatrix}  \ddots&&\\  &J(0)&\\  &&\ddots  \end{bmatrix}M^{-1}

其中 J(0) 是對應所有零特徵值的 Jordan 分塊直和,且 J(0)m\times m 階冪零矩陣 (見“Jordan 形式大解讀(上)”)。例如,5\times 5

\displaystyle  J(0)=\begin{bmatrix}  0&1\\  0&0  \end{bmatrix}\oplus  \begin{bmatrix}  0&1\\  0&0  \end{bmatrix}\oplus  \begin{bmatrix}  0  \end{bmatrix}=  \begin{bmatrix}  0&1&&&\\  0&0&&&\\  &&0&1&\\  &&0&0&\\  &&&&0  \end{bmatrix}

是 3 個 Jordan 分塊的直和,表示 A 的特徵值 0 的代數重數 (J(0) 的階數) 為 5 ,幾何重數 (Jordan 分塊數) 為 3。計算可得

\displaystyle  A^k=M\begin{bmatrix}  \ddots&&\\  &J(0)^k&\\  &&\ddots  \end{bmatrix}M^{-1}

因為 N(A^k)\subseteq N(A^{k+1}),隨著 k 增大,A^k 對應特徵值 0 的幾何重數 \dim N(A^k) 也跟著增大,最後產生 J(0)^k=0,此時 A^k 對應特徵值 0 的幾何重數等於代數重數 m。上例中,AA^2 的 Jordan 矩陣分別為

\displaystyle  J_A=\begin{bmatrix}  0&1&\\  0&0&\\  &&2  \end{bmatrix},~~J_{A^2}=\begin{bmatrix}  0&&\\  &0&\\  &&4  \end{bmatrix}

可知 AA^2 的零特徵值的代數重數同為 2,幾何重數分別是 12,特徵空間如下:

\displaystyle  N(A)=\text{span}\left\{\begin{bmatrix}  1\\  0\\  0  \end{bmatrix}\right\},~~N(A^2)=\text{span}\left\{\begin{bmatrix}  1\\  0\\  0  \end{bmatrix},\begin{bmatrix}  0\\  1\\  0  \end{bmatrix}\right\}

這解釋了何以 A 不可對角化,但 A^2 可對角化。對於 k>2A^k 是否都可對角化呢?我們還要解析當 \lambda\neq 0A^k 對應 \lambda^k 的特徵空間與 A 對應 \lambda 的特徵空間之間的關係。

 
\lambda\neq 0 的代數重數為 m,利用 A 的 Jordan 形式,寫出

\displaystyle\begin{aligned}  A^k-\lambda^kI&=M\begin{bmatrix}  \ddots&&\\  &J(\lambda)^k&\\  &&\ddots  \end{bmatrix}M^{-1}-M\lambda^kIM^{-1}\\  &=M\begin{bmatrix}  \ddots&&\\  &J(\lambda)^k-\lambda^kI_m&\\  &&\ddots  \end{bmatrix}M^{-1}  \end{aligned}

其中 m\times mJ(\lambda)^k 由下列 r\times r 階 Jordan 分塊的冪的直和所構成 (見“矩陣函數(下)”):

\displaystyle\begin{aligned}  \begin{bmatrix}  \lambda&1&0&\cdots&0\\  &\lambda&1&\ddots&\vdots\\  &&\ddots&\ddots&0\\  &&&\lambda&1\\  &&&&\lambda  \end{bmatrix}^k&=\begin{bmatrix}  \lambda^k&k\lambda^{k-1}&\frac{k(k-1)}{2}\lambda^{k-2}&\cdots&\frac{k(k-1)\cdots(k-r+2)}{(r-1)!}\lambda^{k-r+1}\\  &\lambda^k&k\lambda^{k-1}&\ddots&\vdots\\  &&\ddots&\ddots&\frac{k(k-1)}{2}\lambda^{k-2}\\[0.3em]  &&&\lambda^k&k\lambda^{k-1}\\  &&&&\lambda^k  \end{bmatrix}\\  &=\begin{bmatrix}  \lambda^k&\binom{k}{1}\lambda^{k-1}&\binom{k}{2}\lambda^{k-2}&\cdots&\binom{k}{r-1}\lambda^{k-r+1}\\  &\lambda^k&\binom{k}{1}\lambda^{k-1}&\ddots&\vdots\\  &&\ddots&\ddots&\binom{k}{2}\lambda^{k-2}\\[0.5em]  &&&\lambda^k&\binom{k}{1}\lambda^{k-1}\\  &&&&\lambda^k  \end{bmatrix}.\end{aligned}

所以,J(\lambda)^k-\lambda^kI_m 由下列 r\times r 階分塊的直和組成:

\displaystyle  L_r=\begin{bmatrix}  0&\binom{k}{1}\lambda^{k-1}&\binom{k}{2}\lambda^{k-2}&\cdots&\binom{k}{r-1}\lambda^{k-r+1}\\  &0&\binom{k}{1}\lambda^{k-1}&\ddots&\vdots\\  &&\ddots&\ddots&\binom{k}{2}\lambda^{k-2}\\[0.5em]  &&&0&\binom{k}{1}\lambda^{k-1}\\  &&&&0  \end{bmatrix}

因為 \lambda\neq 0k\ge 1\dim N(L_r)=1,表示 \dim N\left(J(\lambda)^k-\lambda^kI_m\right) 等於 J(\lambda) 所含的 Jordan 分塊數,故不隨 k 增大而改變。再者,相似變換矩陣 Mk 無關,推論 A^k 對應 \lambda^k\neq 0 的特徵空間為 N(A^k-\lambda^kI)=N(A-\lambda I)k\ge 1。請注意,如果兩相異非零特徵值 \lambda\mu 使得 \lambda^k=\mu^k,我們可以通過直和合併特徵空間。

 
最後我們將冪矩陣的特徵值與特徵向量整理於下:令 n\times n 階矩陣 A 有特徵對 (\lambda_i,\mathbf{x}_i)i=1,\ldots,n,且 k\ge 1

  • A^k 的特徵值為 \lambda_1^k,\ldots,\lambda_n^k
  • \lambda=0A^k 的零特徵值所對應的特徵空間 N(A^k) 滿足 N(A^k)\subseteq N(A^{k+1})。隨著 k 增大,A^k 的零特徵值的幾何重數 \dim N(A^k) 跟著增大。當 N(A^k) 停止改變時,\lambda=0 的幾何重數等於代數重數。
  • 若相異特徵值 \lambda,\mu\neq 0,使得 \lambda^k=\mu^kA^k 對應 \lambda^k (即 \mu^k) 的特徵空間為 N(A^k-\lambda^kI)=N(A-\lambda I)\oplus N(A-\mu I),幾何重數的總數不變。此性質推廣至多個相異特徵值亦成立。
Advertisement
This entry was posted in 線性代數專欄, 典型形式 and tagged , , , , . Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s