幾何重數不大於代數重數的證明

本文的閱讀等級:中級

給定一個 n\times n 階矩陣 A,特徵值 \lambda 是特徵多項式 p_A(t)=\det(A-tI) 的根,重根數稱為代數重數 (algebraic multiplicity)。對應特徵值 \lambda,所能找到最大的線性獨立向量數,也就是特徵空間的維數 \mathrm{dim}{N}(A-\lambda I),稱為 \lambda 的幾何重數 (geometric multiplicity)。見下例,

\displaystyle A=\left[\!\!\begin{array}{ccr} 2&1&1\\ 0&3&-1\\ 0&0&2 \end{array}\!\!\right]

上三角矩陣的主對角元為其特徵值,可知 A 的特徵值為 2,2,3;特徵值 2 的代數重數是 2,特徵值 3 的代數重數是 1。對應特徵值 2A 有一個特徵向量 (1,0,0)^T,幾何重數為 1;對應特徵值 3A 有一個特徵向量 (1,1,0)^T,幾何重數為 1。本文利用矩陣三角化證明:對應每一個特徵值,幾何重數必不大於代數重數。(其他證法請參閱“特徵值的代數重數與幾何重數”,“可對角化矩陣與缺陷矩陣的判定”,“拒絕行列式的特徵分析”。)

 
\lambda_1,\ldots,\lambda_kn\times n 階矩陣 A 的相異特徵值,k\le n。令 \beta_i 為特徵值 \lambda_i 的代數重數。因此,A 的特徵多項式如下:

\displaystyle p_A(t)=\det(A-tI)=(\lambda_1-t)^{\beta_1}(\lambda_2-t)^{\beta_2}\cdots(\lambda_k-t)^{\beta_k}

其中 \sum_{i=1}^k\beta_i=n。我們要證明的命題是 \dim N(A-\lambda_i I)\le \beta_ii=1,\ldots,k

 
證明於下:寫出 A-\lambda_iI 的特徵多項式

\displaystyle\begin{aligned} p_{A-\lambda_iI}(t)&=\det((A-\lambda_iI)-tI)=\det(A-(\lambda_i+t)I)\\ &=(\lambda_1-(\lambda_i+t))^{\beta_1}(\lambda_2-(\lambda_i+t))^{\beta_2}\cdots(\lambda_k-(\lambda_i+t))^{\beta_k}\\ &=((\lambda_1-\lambda_i)-t)^{\beta_1}((\lambda_2-\lambda_i)-t)^{\beta_2}\cdots((\lambda_k-\lambda_i)-t)^{\beta_k}, \end{aligned}

其中第 i 項為 (-t)^{\beta_i}。因此,A-\lambda_iI 有特徵值 0,代數重數為 \beta_i,以及 k-1 個相異非零特徵值 \lambda_j-\lambda_i,代數重數為 \beta_j1\le j\le kj\neq i。根據 Schur 定理 (見“矩陣三角化的 Schur 定理”),A-\lambda_iI 可三角化為

A-\lambda_iI=UTU^\ast

其中 U 是一個么正矩陣 (unitary matrix) 滿足 U^\ast=U^{-1}T 是上三角矩陣。因為 A-\lambda_i I 相似於 T,可知 \text{rank}(A-\lambda_iI)=\text{rank}T 而且這兩個矩陣有相同的特徵值 (見“相似變換下的不變性質”)。所以,T 的主對角元為 A-\lambda_iI 的特徵值,也就是說 T 的主對角元包含 \beta_i 個零元,以及 n-\beta_i 個非零元,表明 \text{rank}T\ge n-\beta_i (因為上三角矩陣 T 的最大線性獨立行向量集包含非零主對角元所屬的行向量,矩陣秩算法請參閱“利用行列式計算矩陣秩”)。使用秩─零度定理 (見“運用輸入輸出模型活化秩─零度定理”),可得

\displaystyle\begin{aligned} \dim N(A-\lambda_i I)&=n-\text{rank}(A-\lambda_i I)\\ &=n-\text{rank}T\\ &\le n-(n-\beta_i)=\beta_i.\end{aligned}

 
這個證明過程顯示了矩陣秩與非零特徵值數目的關係:矩陣秩大於或等於非零特徵值數 (含相重特徵值)[1]。例如,下面三個方陣的特徵值同為 0,0,0

\displaystyle A_1=\begin{bmatrix} 0&0&0\\ 0&0&0\\ 0&0&0 \end{bmatrix},~~A_2=\begin{bmatrix} 0&0&0\\ 0&0&1\\ 0&0&0 \end{bmatrix},~~A_3=\begin{bmatrix} 0&1&0\\ 0&0&1\\ 0&0&0 \end{bmatrix}

目視可知 \text{rank}A_1=0\text{rank}A_2=1\text{rank}A_3=2。若 A 可對角化為 A=SDS^{-1},其中 D=\text{diag}(\lambda_1,\ldots,\lambda_n),立知 \text{rank}A=\text{rank}D,而 \text{rank}D 等於 D 的非零主對角元數,也就是 A 的非零特徵值數。更進一步,實對稱矩陣可正交對角化 (見“實對稱矩陣可正交對角化的證明”),故實對稱矩陣的秩即為非零特徵值數。

 
註解
[1] 對於一個 n\times n 階矩陣 A\hbox{rank}A 等於非零奇異值數 (見“矩陣的數值秩”),故非零奇異值數大於或等於非零特徵值數。上例中,A_1 的奇異值為 0, 0, 0A_2 的奇異值為 1, 0, 0A_3 的奇異值為 1, 1, 0

廣告
本篇發表於 特徵分析, 線性代數專欄 並標籤為 , , , 。將永久鏈結加入書籤。

4 Responses to 幾何重數不大於代數重數的證明

  1. chen yilun 說道:

    周老师,您好,我想请教下那个实对称矩阵要如何证明其代数重数=几何重数?

  2. baoweiyu001126com 說道:

    Reblogged this on 鮑威宇的個人博客 and commented:
    周老師的線性代數知識,關於特征值的代數重數和幾何重數

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s