同時可對角化矩陣

本文的閱讀等級:高級

ABn\times n 階矩陣。一般情況下,矩陣乘法交換律未必成立,但如果 AB=BA,我們稱 AB 是可交換矩陣 (commuting matrices)。若 AB 都是對角矩陣,則它們是可交換矩陣。這個簡單的事實暗示我們可對角化矩陣和可交換矩陣之間可能存在某種關聯,本文就來探討兩個可對角化矩陣必須滿足什麼性質才會是可交換矩陣。

 
AB 可分別對角化為 S^{-1}AS=CT^{-1}BT=D,其中 CD 是對角矩陣。因為 CD=DC,即有

S^{-1}AST^{-1}BT=T^{-1}BTS^{-1}AS

S=T,也就存在一個可逆矩陣 S 使得 S^{-1}ASS^{-1}BS 都為對角矩陣,我們稱 AB 是同時可對角化 (simultaneously diagonalizable)。在此條件下,上式可簡化成

S^{-1}ABS=S^{-1}BAS

等號兩邊同時左乘 S,右乘 S^{-1},便得到 AB=BA。這個結果表明若 AB 是同時可對角化,則 AB 是可交換矩陣。

 
反過來講,如果 AB 是可交換矩陣且皆可對角化,那麼 AB 是同時可對角化矩陣嗎?是的,證明於下。先設想 A 可對角化為 S^{-1}AS=\Lambda,其中 \Lambda 是主對角特徵值矩陣。設 A 有相異特徵值 \lambda_1,\ldots,\lambda_m,在不失一般性的原則下,令相重特徵值緊鄰排列,則 \Lambda 可表示成分塊矩陣直和:

\Lambda=\begin{bmatrix}    \lambda_1I_{\beta_1}&~&~\\    ~&\ddots&~\\    ~&~&\lambda_mI_{\beta_m}    \end{bmatrix}=\lambda_1I_{\beta_1}\oplus\cdots\oplus\lambda_mI_{\beta_m}

其中 I_{\beta_j}\beta_j 階單位矩陣,\beta_j 是特徵值 \lambda_j 的相重數。因為 AB=BA,將 A=S\Lambda S^{-1} 代入上式,就有

S\Lambda S^{-1}B=BS\Lambda S^{-1}

左乘 S^{-1},右乘 S,並令 P=[p_{ij}]=S^{-1}BS,上式可化簡為

\Lambda P=P\Lambda

比較等號兩邊矩陣的 (i,j) 元,即得

(\Lambda)_{ii}p_{ij}=p_{ij}(\Lambda)_{jj}

因為 ((\Lambda)_{ii}-(\Lambda)_{jj})p_{ij}=0,當 (\Lambda)_{ii}\neq(\Lambda)_{jj},必有 p_{ij}=0,故知 P 具有下列主對角分塊形式:

P=\begin{bmatrix}    P_1&~&~\\    ~&\ddots&~\\    ~&~&P_m    \end{bmatrix}=P_1\oplus\cdots\oplus P_m

其中 \beta_j\times\beta_j 階分塊 P_j 對應特徵值 \lambda_j。因為 P=S^{-1}BSP 相似於 B,兩者擁有相同的 Jordan 形式 (見“相似變換下的不變性質”)。已知 B 可對角化,故 P 亦可對角化。繼續追問下去,從 P 是可對角化矩陣能否推論出所有的主對角分塊 P_j 也是可對角化?答案是肯定的,我們暫時先接受這個事實,稍後再詳細證明。接下來令

T=\begin{bmatrix}    T_1&~&~\\    ~&\ddots&~\\    ~&~&T_m    \end{bmatrix}

其中每一 T_j 可逆並使 T_j^{-1}P_jT_j 為對角矩陣,故

\begin{aligned}  T^{-1}PT&=\begin{bmatrix}    T_1^{-1}&~&~\\    ~&\ddots&~\\    ~&~&T_m^{-1}    \end{bmatrix}\begin{bmatrix}    P_1&~&~\\    ~&\ddots&~\\    ~&~&P_m    \end{bmatrix}\begin{bmatrix}    T_1&~&~\\    ~&\ddots&~\\    ~&~&T_m    \end{bmatrix}\\    &=\begin{bmatrix}    T_1^{-1}P_1T_1&~&~\\    ~&\ddots&~\\    ~&~&T_m^{-1}P_mT_m    \end{bmatrix}\end{aligned}

為對角矩陣,也就是說,相似變換 T^{-1}S^{-1}BST 對角化 B 矩陣。另一方面,因為 T_j^{-1}\lambda_jI_{\beta_j}T_j=\lambda_jI_{\beta_j},也就確定 T^{-1}S^{-1}AST=T^{-1}\Lambda T=\Lambda 亦為對角矩陣,因此證明了 AB 同時可被變換矩陣 ST 對角化。

 
上面提到若 P=P_1\oplus\cdots\oplus P_m 可對角化,則每一主對角分塊 P_j 皆可對角化。為方便說明,以下考慮 m=2,利用歸納法即可證得 m>2 的情況。假設 P=\begin{bmatrix}    P_1&0\\    0&P_2    \end{bmatrix} 可對角化,P_1k\times k 階分塊,P_2(n-k)\times(n-k) 階分塊。令 U 為一 n\times n 階可逆矩陣使得 U^{-1}PU=D=\mathrm{diag}(d_1,\ldots,d_n),以行向量表示為 U=\begin{bmatrix}    \mathbf{u}_1&\cdots&\mathbf{u}_n    \end{bmatrix},並且令

\mathbf{u}_j=\begin{bmatrix}    \mathbf{x}_j\\    \mathbf{y}_j    \end{bmatrix},~~j=1,\ldots,n

其中 \mathbf{x}_jk 維向量,\mathbf{y}_j(n-k) 維向量。將相似變換改寫成 PU=UD,對於 j=1,\ldots,n,就有

\begin{aligned}  P_1\mathbf{x}_j&=d_j\mathbf{x}_j\\    P_2\mathbf{y}_j&=d_j\mathbf{y}_j.\end{aligned}

如果能證明 \{\mathbf{x}_1,\ldots,\mathbf{x}_n\} 包含 k 個線性獨立向量,就表示 P_1 有完整的獨立特徵向量,則 P_1 可對角化;同樣地,如果能證明 \{\mathbf{y}_1,\ldots,\mathbf{y}_n\} 包含 (n-k) 個線性獨立向量,即證明 P_2 可對角化。將向量集 \{\mathbf{x}_1,\ldots,\mathbf{x}_n\} 合併成一 k\times n 階矩陣 X=\begin{bmatrix}    \mathbf{x}_1&\cdots&\mathbf{x}_n    \end{bmatrix},同樣將 \{\mathbf{y}_1,\ldots,\mathbf{y}_n\} 合併成一 (n-k)\times n 階矩陣 Y=\begin{bmatrix}    \mathbf{y}_1&\cdots&\mathbf{y}_n    \end{bmatrix}。使用逆否命題法,若 \{\mathbf{x}_1,\ldots,\mathbf{x}_n\} 的線性獨立向量個數少於 k,則 \mathrm{rank}X<k;若 \{\mathbf{y}_1,\ldots,\mathbf{y}_n\} 的線性獨立向量個數少於 (n-k),則 \mathrm{rank}Y<n-k。只要發生上述任一情況,計算 U 的列秩即知 \mathrm{rank}U=\mathrm{rank}\begin{bmatrix}    X\\    Y    \end{bmatrix}<n,也就是說 U 不可逆。因此證明 \{\mathbf{x}_1,\ldots,\mathbf{x}_n\} 必定有 k 個獨立向量,而 \{\mathbf{y}_1,\ldots,\mathbf{y}_n\}(n-k) 個獨立向量。

 
最後我們將同時可對角化推廣至包含兩個矩陣以上的大家族。令 \mathfrak{F}=\{A_1,\ldots,A_k\} 代表 n\times n 階可交換矩陣所成的集合,此家族中任何兩個矩陣都滿足乘法交換律 A_iA_j=A_jA_i。以下性質成立:若每一 A_i\in\mathfrak{F} 都可對角化,則存在一可逆矩陣同時對角化 \mathfrak{F} 中所有的矩陣。(反向陳述也為真,證明過程如前所述,這個工作留給讀者自行完成。) 為了避免符號混亂,下面考慮 k=3 的情況。假設 ABC 為同階可對角化矩陣,且兩兩可交換。類似前面 k=2 的證明步驟,先設 A 可對角化為

S^{-1}AS=\Lambda=\lambda_1I_{\beta_1}\oplus\cdots\oplus\lambda_mI_{\beta_m}

BC 執行同樣形式的相似變換,可得

\begin{aligned}  S^{-1}BS&=P=P_1\oplus\cdots\oplus P_m\\  S^{-1}CS&=Q=Q_1\oplus\cdots\oplus Q_m,\end{aligned}

其中 P_jQ_j\beta_j\times\beta_j 階分塊。因為 BC=CB,即知 PQ=QP,也就有 P_jQ_j=Q_jP_j。另外,由於 PQ 是可對角化矩陣,故對於每一 jP_jQ_j 亦可對角化。利用可交換矩陣蘊含同時可對角化性質,對於 j=1,\ldots,m,必定存在一可逆矩陣 T_j 同時使得 T_j^{-1}P_jT_jT_j^{-1}Q_jT_j 為對角矩陣,而 T_j^{-1}\lambda_jI_{\beta_j}T_j=\lambda_jI_{\beta_j} 不改變主對角形式。再來令 T=T_1\oplus\cdots\oplus T_m,根據以上結果即知

\begin{aligned}  T^{-1}S^{-1}AST&=T^{-1}\Lambda T\\  T^{-1}S^{-1}BST&=T^{-1}PT\\  T^{-1}S^{-1}CST&=T^{-1}QT\end{aligned}

全都是對角矩陣,換句話說,ABC 同時被相似變換矩陣 ST 對角化。運用同樣方式可歸納證出 k>3 亦成立。

 
除了同時可對角化,可交換矩陣還具備甚麼性質?可交換矩陣至少有一共同的特徵向量,請見“每週問題 September 20, 2010”。另外,可交換矩陣尚有同時可三角化性質,這是下一回要討論的主題。

相關閱讀
This entry was posted in 特徵分析, 線性代數專欄 and tagged , , , , . Bookmark the permalink.

8 Responses to 同時可對角化矩陣

  1. Mason says:

    期末救星 感恩

  2. XiaoH says:

    感谢周老师的说明。期末的线性模型考试会有多元正态分布与chi-squared分布之间关系的问题。

  3. 鄭少鈞 中央大學 says:

    老師您好 明天就是台聯的考試 想詢問台聯107 有一題題目
    T defined on the vector space V=C(nxn)
    一個linear transformation T(B)=AB-BA for some complexed valued matrix A
    Assuming all of the eigenvalues of A are distinct (and A could be singular)
    為什麼nullity(T)=n?
    若A或B有特徵值零不就保證nullity(T)不是n?

  4. alonzhao says:

    您好 我想问一下为什么您的博客能够访问 我的WordPress的博客只有打开VPN才能访问呢。

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s