特殊矩陣 (1):冪零矩陣

本文的閱讀等級:中級

A 為一 n\times n 階矩陣。若存在一正整數 q 使得

A^{q}=0

A 稱為冪零矩陣 (nilpotent matrix),意思是冪矩陣為零矩陣,符合此條件的最小的正整數 q 稱為指標 (index)。例如,

A=\begin{bmatrix}    0&1&0&0\\    0&0&1&0\\    0&0&0&1\\    0&0&0&0    \end{bmatrix},~ B=\begin{bmatrix}    5&-3&2\\    15&-9&6\\    10&-6&4\end{bmatrix}

是冪零矩陣,計算得到 A^3\neq 0A^4=0B^2=0,可知 AB 的指標分別為 42。下面介紹冪零矩陣關於特徵值與跡數的兩個充要條件。

 
定理1. 冪零矩陣的特徵值為 0,反之亦然,若任一方陣的特徵值皆為 0,則為冪零矩陣。

直白地說,若 A 的一個冪矩陣為零矩陣,則 A 的特徵值全都是零;若 A 有至少一個非零特徵值,則 A 的所有冪矩陣都不為零矩陣。證明於下:假設 A 為一 n\times n 階冪零矩陣,指標為 q,且 \lambdaA 的一個特徵值對應特徵向量 \mathbf{x}。計算

A^q\mathbf{x}=A^{q-1}A\mathbf{x}=\lambda A^{q-1}\mathbf{x}=\cdots=\lambda^q\mathbf{x}

因為 A^q=0,推得 \lambda^{q}=0\mathbf{x}=\mathbf{0},但特徵向量 \mathbf{x} 為非零向量,證明 \lambda=0,代數重數為 n。下面給出兩個反向命題的證明。假設一 n\times n 階矩陣 A 的特徵值都是 0,則 A 的特徵多項式為 p_A(t)=t^n。根據 Cayley-Hamilton 定理 (見“Cayley-Hamilton 定理”),A^n=0,故存在最小正整數 q\le n 使得 A^q=0。這個證明過程指出 n\times n 階冪零矩陣的指標 q 必不大於 n。另一個證明使用 Schur 定理,存在一相似於 A 的上三角矩陣 TT=U^{-1}AU (見“矩陣三角化的 Schur 定理”),其中 U 是一個么正矩陣 (unitary matrix) 使得 U^\ast=U^{-1}T 的主對角元為 0。例如,4\times 4 階上三角矩陣 T 有下列形式:

T=\begin{bmatrix}    0&\ast&\ast&\ast\\    0&0&\ast&\ast\\    0&0&0&\ast\\    0&0&0&0\end{bmatrix}

其中 \ast 代表任意數。計算冪矩陣,

T^2=\begin{bmatrix}    0&0&\ast&\ast\\    0&0&0&\ast\\    0&0&0&0\\    0&0&0&0\end{bmatrix},~~T^3=\begin{bmatrix}    0&0&0&\ast\\    0&0&0&0\\    0&0&0&0\\    0&0&0&0\end{bmatrix},~~T^4=\begin{bmatrix}    0&0&0&0\\    0&0&0&0\\    0&0&0&0\\    0&0&0&0\end{bmatrix}

對於一般 n\times n 階上三角矩陣 T,存在最小正整數 q\le n 使得 T^q=0,故 T 為一冪零矩陣。使用相似關係式,A=UTU^{-1},冪矩陣可表示為 A^q=UT^qU^{-1},即得 A^q=0

 
定理1的一個立即推論是冪零矩陣不可逆。如果不引用特徵值,使用行列式也可以證明:設冪零矩陣 A 的指標為 q。使用行列式可乘公式,

\det(A^{q})=\det(\underbrace{A\cdots A}_q)=\underbrace{(\det A)\cdots(\det A)}_q=(\det A)^{q}

\det(A^{q})=\det 0=0,因此 \mathrm{det}A=0,就有 \hbox{rank}A<n。考慮一個特殊情況。若一 n\times n 階實矩陣 A 使得 A^2=0,則所有的 \mathbf{x}\in\mathbb{R}^n 滿足 A(A\mathbf{x})=\mathbf{0},也就是說 A 的行空間 (column space) C(A)=\{A\mathbf{x}|\mathbf{x}\in\mathbb{R}^n\} 是零空間 (nullspace) N(A)=\{\mathbf{x}\in\mathbb{R}^n|A\mathbf{x}=\mathbf{0}\} 內的子空間,C(A)\subseteq N(A),故 \hbox{rank}A=\dim C(A)\le \dim N(A)。使用秩─零度定理,\dim N(A)=n-\hbox{rank}A,合併上面兩式,得到 \hbox{rank}A\le\frac{n}{2}。下為一例:

A=\begin{bmatrix}  0&0&1\\  0&0&0\\  0&0&0  \end{bmatrix}

的行空間是 C(A)=\hbox{span}\{(1,0,0)^T\},零空間是 N(A)=\hbox{span}\{(1,0,0)^T,(0,1,0)^T\}

 
我們再看指標為 q 的冪零矩陣的一個性質:I-A 是可逆矩陣。寫出矩陣多項式的因式分解,

I-A^q=(I-A)(I+A+A^2+\cdots+A^{q-1})

A^q=0,故 I-A 的逆矩陣為

(I-A)^{-1}=I+A+A^2+\cdots+A^{q-1}

此外,行列式等於特徵值的積,\det(I-A)=\det((I-A)^{-1})=1

 
除了特徵值為零,冪零矩陣還有一個以跡數表達的等價條件。

定理2. 對於一 n\times n 階矩陣 AA^n=0 的一個充要條件為 \hbox{trace}(A^k)=0k=1,\ldots,n

\lambda_1,\ldots,\lambda_nA 的特徵值。若 A^n=0,則 \lambda_1=\cdots=\lambda_n=0,可知 A^k 的特徵值 \lambda_i^k 全都是零,推得 \hbox{trace}(A^k)=\sum_{i=1}^n\lambda_i^k=0k\ge 1。接著證明反向命題,假設 \hbox{trace}(A^k)=\sum_{i=1}^n\lambda_i^k=01\le k\le n,或寫為矩陣形式:

\begin{bmatrix}  1&1&\cdots&1\\  \lambda_1&\lambda_2&\cdots&\lambda_n\\  \vdots&\vdots&\ddots&\vdots\\  \lambda_1^{n-1}&\lambda_2^{n-1}&\cdots&\lambda_n^{n-1}  \end{bmatrix}  \begin{bmatrix}  \lambda_1\\  \lambda_2\\  \vdots\\  \lambda_n  \end{bmatrix}=\begin{bmatrix}  0\\  0\\  \vdots\\  0  \end{bmatrix}

其中係數矩陣稱為 Vandermonde 矩陣 (見“特殊矩陣 (8):Vandermonde 矩陣”)。若所有的 \lambda_i 相異,則 Vandermonde 矩陣可逆,故僅存在平凡解 \lambda_1=\cdots=\lambda_n=0,產生矛盾,表明 A 有相重的特徵值。在不失一般性的情況下,假設 \lambda_1=\lambda_2 且其餘特徵值彼此相異,於是下列 n-1 階方程:

\begin{bmatrix}  1&1&\cdots&1\\  \lambda_2&\lambda_3&\cdots&\lambda_n\\  \vdots&\vdots&\ddots&\vdots\\  \lambda_2^{n-2}&\lambda_3^{n-2}&\cdots&\lambda_n^{n-2}  \end{bmatrix}  \begin{bmatrix}  2\lambda_2\\  \lambda_3\\  \vdots\\  \lambda_n  \end{bmatrix}=\begin{bmatrix}  0\\  0\\  \vdots\\  0  \end{bmatrix}

按同樣方式推得 \lambda_2,\lambda_3,\ldots,\lambda_n 必包含相重特徵值,繼續下去可歸納出所有特徵值相等,也就證明 \lambda_1=\cdots=\lambda_n=0

 
一般來說,兩個冪零矩陣的積與和未必是冪零矩陣,但可交換冪零矩陣的積與和也是冪零矩陣。

定理3. 若 AB 是同階冪零矩陣且 AB=BA,則 ABA+B 是冪零矩陣。

因為 AB 是冪零矩陣,存在正整數 pq 使得 A^p = B^q = 0。令 m = \max\{p,q\}。因此,A^m = B^m = 0。使用條件式 AB = BA

(AB)^m = (ABAB)(AB)^{m-2}=A^2B^2(AB)^{m-2}=\cdots=A^mB^m = 0

考慮

\displaystyle  (A + B)^{2m}=\sum_{k=0}^{2m}\binom{2m}{k}A^kB^{2m-k}

對於 0\le k\le 2m\max\{k,2m-k\}\ge m 致使 A^k=0B^{2m-k}=0,故 (A + B)^{2m}= 0

 
非零冪零矩陣是不可對角化的,因為 \hbox{rank}A>0\dim N(A)=n-\hbox{rank}A<n,對應特徵值 0 的特徵空間 N(A) 不存在 n 個線性獨立的特徵向量 (見“可對角化的特殊矩陣”)。冪零矩陣最主要的應用在於解析 Jordan 典型形式,詳見“Jordan 形式大解讀 (上)”與“核心──冪零分解”。

Advertisements
本篇發表於 特殊矩陣, 線性代數專欄 並標籤為 , , , , 。將永久鏈結加入書籤。

2 則回應給 特殊矩陣 (1):冪零矩陣

  1. child 說道:

    請教大師:
    行空間 C(A) 是零空間 N(A) 內的子空間
    為什麼不可以倒過來說:零空間 N(A)是 行空間 C(A)的子空間呢?

    困惑的小童

  2. ccjou 說道:

    第一次聽到有人叫我大師,不過我還沒那麼老,算不上是大師。

    你可以試著找出反例,如
    A=\begin{bmatrix} 0&0&1\\ 0&0&0\\ 0&0&0 \end{bmatrix}
    \mathrm{rank}A=\mathrm{dim}C(A)=1,但 \mathrm{dim}N(A)=2,所以不可能有 N(A)\subseteq C(A)

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s