可對角化矩陣的譜分解──續篇(上)

本文的閱讀等級:中級

A 為一個 n\times n 階可對角化矩陣,\lambda_1,\ldots,\lambda_m (m\le n) 為相異特徵值,也稱作矩陣譜 (spectrum)。若 A 是可對角化矩陣,譜定理 (spectrum theorem) 宣稱下列譜分解式唯一存在:

\displaystyle A=\lambda_1P_1+\cdots+\lambda_mP_m

其中 P_i 稱為對應特徵值 \lambda_i 的譜投影算子 (矩陣),表達式為 (見“可對角化矩陣的譜分解”)

\displaystyle   P_i=\prod_{j\neq i}\left(\frac{A-\lambda_jI}{\lambda_i-\lambda_j}\right)

並具有以下性質:

  • P_i 是沿著 A-\lambda_iI 的行空間 (column space) C(A-\lambda_iI) 至零空間 (nullspace) N(A-\lambda_iI) 的投影矩陣,即冪等矩陣 (idempotent matrix),滿足 P_i^2=P_i (見“特殊矩陣 (5):冪等矩陣”);
  • i\neq jP_iP_j=0
  • P_1+\cdots+P_m=I

本文證明譜定理的反向命題:若 A=\lambda_1P_1+\cdots+\lambda_mP_m,其中 \lambda_1,\ldots,\lambda_m 為相異數,P_1,\ldots,P_m 為非零矩陣並滿足 P_iP_j=0i\neq j,及 P_1+\cdots+P_m=I,則 A 是可對角化矩陣。為方便閱讀,我將證明過程切割成數個與譜投影矩陣 P_i 相關的性質。

 
(1) P_1,\ldots,P_m 是冪等矩陣。

對於 i=1,\ldots,m,使用給定條件 P_iP_j=0i\neq j,和 P_1+\cdots+P_m=I,可得

\displaystyle P_i=P_iI=P_i(P_1+\cdots+P_m)=P_iP_1+\cdots+P_iP_m=P_i^2

 
(2) \{P_1,\ldots,P_m\} 為一個線性獨立集。

考慮線性組合式

\displaystyle c_1P_1+\cdots+c_mP_m=0

上式通乘 P_i,使用 (1) 可得 0=P_i(c_1P_1+\cdots+c_mP_m)=c_iP_i^2=c_iP_i。但 P_i\neq 0,即知 c_i=01\le i\le m,故 \{P_1,\ldots,P_m\} 是線性獨立集。這個性質並未用於證明 A 是可對角化矩陣,但它告訴我們 A 的譜分解具有唯一性。

 
(3) 若 i\neq jC(P_i)\cap C(P_j)=\{\mathbf{0}\}

假設 \mathbf{x}\in C(P_i)\cap C(P_j),也就存在 \mathbf{y},\mathbf{z}\in\mathbb{C}^n 使得 \mathbf{x}=P_i\mathbf{y}\mathbf{x}=P_j\mathbf{z}。若 i\neq j,則

\displaystyle \mathbf{x}=P_i\mathbf{y}=P_i^2\mathbf{y}=P_i\mathbf{x}=P_iP_j\mathbf{z}=\mathbf{0}

順便補充一個冪等矩陣的界定性質:若每一 \mathbf{x}\in C(P) 皆使 P\mathbf{x}=\mathbf{x},則 P 是冪等矩陣。證明於下:令 \mathbf{x}=P\mathbf{y},其中 \mathbf{y}\in\mathbb{C}^n。若 \mathbf{x}=P\mathbf{x},則 P\mathbf{y}=\mathbf{x}=P\mathbf{x}=P^2\mathbf{y}。因為 \mathbf{y} 是任意向量,故可斷定 P=P^2

 
(4) \dim C(P_1)+\cdots+\dim C(P_m)=n

對於 i\neq jC(P_i)\cap C(P_j)=\{\mathbf{0}\} 等價於 C(P_i)+C(P_j)=C(P_i)\oplus C(P_j) (證明見“補子空間與直和”),即有 \dim (C(P_i)+C(P_j))=\dim C(P_i)+\dim C(P_j)。因為 C(P_i+P_j)\subseteq C(P_i)+C(P_j)

\displaystyle C(I_n)=C(P_1+\cdots+P_m)\subseteq C(P_1)+\cdots+C(P_m)=C(P_1)\oplus\cdots\oplus C(P_m)\subseteq \mathbb{C}^n

C(I_n)=\mathbb{C}^n,推得 C(P_1)\oplus\cdots\oplus C(P_m)=\mathbb{C}^n,因此證明 \dim C(P_1)+\cdots+\dim C(P_m)=n

 
(5) \lambda_1,\ldots,\lambda_mA 的相異特徵值,P_i 的非零行向量為對應 \lambda_i 的特徵向量。

對於 i=1,\ldots,m

\displaystyle AP_i=(\lambda_1P_1+\cdots+\lambda_mP_m)P_i=\lambda_1P_1P_i+\cdots+\lambda_mP_mP_i=\lambda_iP_i^2=\lambda_iP_i

可知 \lambda_iA 的一個特徵值,P_i 的非零行向量即為對應的特徵向量。因為 P_i 不為零矩陣,故必存在至少一個非零行向量。另一方面,

\displaystyle P_iA=P_i(\lambda_1P_1+\cdots+\lambda_mP_m)=\lambda_1P_iP_1+\cdots+\lambda_mP_iP_m=\lambda_iP_i^2=\lambda_iP_i

P_i^\ast=\overline{P}^T 的非零行向量為對應特徵值 \lambda_i 的左特徵向量 (見“右特徵向量與左特徵向量”)。合併上面兩式,AP_i=P_iA1\le i\le m

 
(6) P_i 是沿著子空間 C(A-\lambda_iI) 至特徵空間 N(A-\lambda_iI) 的投影矩陣,亦即 C(P_i)=N(A-\lambda_iI)N(P_i)=C(A-\lambda_iI)

我們先證明 C(P_i)=N(A-\lambda_iI)。由 (5),(A-\lambda_iI)P_i=0 說明 C(P_i)\subseteq N(A-\lambda_iI)。設非零向量 \mathbf{x}\in N(A-\lambda_iI),即 (A-\lambda_iI)\mathbf{x}=\mathbf{0}。寫出 \mathbf{x}=I\mathbf{x}=P_1\mathbf{x}+\cdots+P_m\mathbf{x},代入前式,

\displaystyle\begin{aligned} \mathbf{0}&=(A-\lambda_iI)(P_1\mathbf{x}+\cdots+P_m\mathbf{x})\\ &=(AP_1-\lambda_iP_1)\mathbf{x}+\cdots+(AP_m-\lambda_iP_m)\mathbf{x}\\ &=(\lambda_1P_1-\lambda_iP_1)\mathbf{x}+\cdots+(\lambda_mP_m-\lambda_iP_m)\mathbf{x}\\ &=\sum_{j\neq i}(\lambda_j-\lambda_i)P_j\mathbf{x}. \end{aligned}

對於 j\neq i\lambda_j-\lambda_i\neq 0,可知 \{P_1\mathbf{x},\ldots,P_{i-1}\mathbf{x},P_{i+1}\mathbf{x},\ldots,P_m\mathbf{x}\} 為線性相關集。根據 (4),\mathbb{C}^n=C(P_1)\oplus\cdots\oplus C(P_m) 表明 \{P_1\mathbf{x},\ldots,P_m\mathbf{x}\} 必定是線性獨立集,除非其中包含零向量。因此,P_j\mathbf{x}=\mathbf{0}j\neq i,換句話說,\mathbf{x}=P_i\mathbf{x},推知 \mathbf{x}\in C(P_i),即證明 N(A-\lambda_iI)\subseteq C(P_i),故 C(P_i)=N(A-\lambda_iI)。再來證明 N(P_i)=C(A-\lambda_iI)。由 (5),P_i(A-\lambda_iI)=0 說明 C(A-\lambda_iI)\subseteq N(P_i)。使用兩次秩─零度定理,

\displaystyle\begin{aligned} \dim N(P_i)&=n-\dim C(P_i)\\ &= n-\dim N(A-\lambda_iI)\\ &=\dim C(A-\lambda_iI), \end{aligned}

N(P_i)=C(A-\lambda_iI)

 
(7) A 是可對角化矩陣。

根據 (6),\dim C(P_i)=\dim N(A-\lambda_iI) 即為特徵值 \lambda_i 的幾何重數,而 (4) \dim C(P_1)+\cdots+\dim C(P_m)=n 表明特徵值 \lambda_1,\ldots,\lambda_m 的幾何重數和等於 n,此即代數重數和。每一個特徵值的幾何重數不大於代數重數 (見“幾何重數不大於代數重數的證明”),因此特徵值 \lambda_i 的幾何重數必等於代數重數,也就證明 A 是可對角化矩陣 (見“可對角化矩陣與缺陷矩陣的判定”)。

繼續閱讀:

 
下面是網友Meiyue Shao所提供的證明:

This entry was posted in 特徵分析, 線性代數專欄 and tagged , , . Bookmark the permalink.

1 則回應給 可對角化矩陣的譜分解──續篇(上)

  1. ccjou 說:

    謝謝網友Meiyue Shao來函分享他對本文命題的證明(張貼於文末):

    I would like to share with you an alternative proof of the statement on the post. The proof is quite similar to yours. But likely mine is relatively simple to follow. As you might want to reuse the contents, I attach the latex source which is written in traditional Chinese.

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s