可對角化的特殊矩陣

本文的閱讀等級:中級

A 為一個 n\times n 階複矩陣,n\ge 2。若存在一個同階可逆矩陣 S 使得 D=S^{-1}AS 為對角矩陣,其主對角元為 A 的特徵值,則 A 稱為可對角化 (diagonalizable),A=SDS^{-1} 稱為譜分解 (spectral decomposition,見“可對角化矩陣的譜分解”)。令 \sigma(A)=\{\lambda_1,\ldots,\lambda_k\}A 的相異特徵值組成的集合。下面列舉三個可對角化矩陣 A 的等價條件:

  1. 每一特徵值 \lambda_i\in\sigma(A) 的代數重數等於幾何重數 (見“可對角化矩陣與缺陷矩陣的判定”),即 \dim N((A-\lambda_i I)^n)=\dim N(A-\lambda_i I) (見“特徵值的代數重數與幾何重數”),這裡 N(X) 表示矩陣 X 的零空間 (nullspace);
  2. 每一特徵值 \lambda_i\in\sigma(A) 的指標 (index) 等於 1,也就是說 A 的 Jordan 矩陣的每一個 Jordan 分塊的階數為 1,即純量 (見“Jordan 形式大解讀 (上)”);
  3. 最小多項式為 m_A(t)=(t-\lambda_1)\cdots(t-\lambda_k),也就是說 (A-\lambda_1I)\cdots(A-\lambda_kI)=0 (見“最小多項式 (下)”)。

 
如果 An 個兩兩互異的特徵值 \lambda_1,\ldots,\lambda_n,則特徵多項式為

p_A(t)=\det(A-tI)=(-1)^n(t-\lambda_1)\cdots(t-\lambda_n)

對應相異特徵值的特徵向量構成線性獨立集 (見“相異特徵值對應線性獨立的特徵向量之簡易證明”),可知 An 個線性獨立特徵向量 \mathbf{x}_1,\ldots,\mathbf{x}_n 對應特徵值 \lambda_1,\ldots,\lambda_n。令 S=\begin{bmatrix}  \mathbf{x}_1&\cdots&\mathbf{x}_n  \end{bmatrix},即有 AS=S\,\hbox{diag}(\lambda_1,\ldots,\lambda_n),則 A=S\,\hbox{diag}(\lambda_1,\ldots,\lambda_n)S^{-1}

 
使用上述性質法也很容易證明兩兩互異的特徵值是可對角化矩陣的一個充分條件。每一特徵值 \lambda_i 的代數重數為 1,特徵空間 N(A-\lambda_iI)\neq\{\mathbf{0}\},且幾何重數不大於代數重數 (因為 N(A-\lambda_i I)\subseteq N((A-\lambda_i I)^n),於是有 \dim N(A-\lambda_iI)=\dim N((A-\lambda_iI)^n)=1,故 A 可對角化。若考慮 Jordan 形式,對應每一特徵值 \lambda_i 的 Jordan 分塊為 1\times 1 階 (因為代數重數為 1),立刻得證。最後,特徵多項式 p_A(t) 僅含次數等於 1 的因式,即為次數最小的消滅多項式,m_A(t)=p_A(t),因此得證。

 
不論特徵值是否相異,某些特殊矩陣總可對角化。下面我們證明冪等 (idempotent) 矩陣與對合 (involutory) 矩陣可對角化,以及非零冪零 (nilpotent) 矩陣不可對角化。

 
冪等矩陣

P 為一個冪等矩陣 (或稱投影矩陣),即 P^2=P (見“特殊矩陣 (5):冪等矩陣”)。特徵值 \lambda 滿足 \lambda^2=\lambda,因此 P 的特徵值為 01

證明1:根據定義,(I-P)^2=I-2P+P^2=I-P,即知 I-P 是冪等矩陣。再者,P^n=P^{n-1}=\cdots=P,類似地,(I-P)^n=(I-P)^{n-1}=\cdots=I-P。對於 \lambda=0\dim N(P^n)=\dim N(P);對於 \lambda=1\dim N((P-I)^n)=\dim N(P-I)

證明2:考慮 Jordan 形式 P=SJS^{-1},其中 Jordan 矩陣為

J=\begin{bmatrix}  J_1&&\\  &\ddots&\\  &&J_m  \end{bmatrix}=J_1\oplus\cdots\oplus J_m

每一 J_in_i\times n_i 階 Jordan 分塊,形式如下:

J_i=\begin{bmatrix}    \lambda&1&~&~\\  ~&\ddots&\ddots&~\\  ~&~&\ddots&1\\  ~&~&~&\lambda  \end{bmatrix}

寫出 P^2=SJ^2S^{-1}=S(J_1^2\oplus\cdots\oplus J_m^2)S^{-1},故 P^2=P 等價於 J_i^2=J_i1\le i\le m。觀察 Jordan 分塊的冪矩陣形式可推斷每一 J_i1\times 1 階 (見“Jordan 分塊”)。

證明3:分開三種情況討論。若 \sigma(P)=\{0,1\}P^2=P 或寫為 P(P-I)=0,則最小多項式為 m_P(t)=t(t-1)。若 \sigma(P)=\{0\},對於任一 \mathbf{x}\in\mathbb{C}^n,設 P\mathbf{x}=\mathbf{y},即有 P\mathbf{x}=P^2\mathbf{x}=P\mathbf{y},推得 P\mathbf{y}=\mathbf{y}。但 1 不是 P 的特徵值,因此 \mathbf{y}=\mathbf{0}。換句話說,N(P)=\mathbb{C}^n,意味 P=0,故 m_P(t)=t。若 \sigma(P)=\{1\},則 \sigma(I-P)=\{0\}。同樣道理,N(I-P)=\mathbb{C}^n,即得 P=I,故 m_P(t)=t-1

 
對合矩陣

A 為一個對合矩陣,即 A^2=I (見“特殊矩陣 (22):對合矩陣”)。特徵值 \lambda 滿足 \lambda^2=1,因此 A 的特徵值為 1-1

證明1:根據定義,

\begin{aligned}  (A-I)^2&=A^2-2A+I=-2(A-I)\\  (A-I)^3&=-2(A-I)^2=(-2)^2(A-I)\\  &\vdots\\  (A-I)^n&=(-2)^{n-1}(A-I).  \end{aligned}

類似地,(A+I)^n=2^{n-1}(A+I)。矩陣乘以一個非零常數不會改變零空間。對於 \lambda=1\dim N((A-I)^n)=\dim N(A-I);對於 \lambda=-1\dim N((A+I)^n)=\dim N(A+I)

證明2:考慮 Jordan 形式 A=S(J_1\oplus\cdots\oplus J_m)S^{-1}。寫出 A^2=S(J_1^2\oplus\cdots\oplus J_m^2)S^{-1},故 A^2=I 等價於 J_i^2=I_{n_i}1\le i\le m。從 Jordan 分塊的冪矩陣形式可確定 J_i 為對角矩陣,主對角元為 1-1

證明3:分開三種情況討論。若 \sigma(A)=\{1,-1\}A^2=I 寫為 (A-I)(A+I)=0,可得最小多項式 m_A(t)=(t-1)(t+1)。若 \sigma(A)=\{1\},對於任一 \mathbf{x}\in\mathbb{C}^n,考慮 (A-I)\mathbf{x}=\mathbf{y},即 A\mathbf{x}=\mathbf{x}+\mathbf{y}。左乘 AA^2\mathbf{x}=\mathbf{x}=A\mathbf{x}+A\mathbf{y}=\mathbf{x}+\mathbf{y}+A\mathbf{y},即有 A\mathbf{y}=-\mathbf{y}。但 -1 不是 A 的特徵值,因此 \mathbf{y}=\mathbf{0}。換句話說,N(A-I)=\mathbb{C}^n,意味 A-I=0,也就得到 m_A(t)=t-1。若 \sigma(A)=\{-1\},同樣方式可推論 N(A+I)=\mathbb{C}^n,即 A+I=0,故 m_A(t)=t+1

 
冪零矩陣

A 為一個冪零矩陣,即存在一個正整數 p 使得 A^p=0 (見“特殊矩陣 (1):冪零矩陣”) 或 A^n=0。特徵值 \lambda 滿足 \lambda^p=0,因此 A 的特徵值為 0。一般來說,冪零矩陣不可對角化,例如,\begin{bmatrix}  0&1\\  0&0  \end{bmatrix}。冪零矩陣 A 可對角化的充要條件有 (1) \dim N(A^n)=\dim N(A),(2) A=SJS^{-1}J=0,(3) 最小多項式為 m_A(t)=t。這三個條件推得相同結論 A=0

 
特別地,即便特徵值未必相異,循環 (circulant) 矩陣有完整的線性獨立特徵向量,因此可對角化 (見“特殊矩陣 (7):循環矩陣”)。除了一般性對角化,許多特殊矩陣甚至可么正對角化 (unitarily diagonalizable)。具體地說,A=UDU^\ast,其中 D 是對角矩陣,U 是么正 (unitary) 矩陣,U^\ast=U^{-1}。哪些特殊矩陣可么正對角化?答案是正規矩陣 (normal matrix),定義式為 A^\ast A=AA^\ast。事實上,可么正對角化是正規矩陣的一個等價條件 (見“特殊矩陣 (2):正規矩陣”)。可么正對角化矩陣 (即正規矩陣) 有很多的等價條件,詳見“正規矩陣的等價條件”。

廣告
本篇發表於 特徵分析, 線性代數專欄 並標籤為 , , , , , 。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s