答Louie──關於同時可對角化的證明

網友Louie留言:

老師你好,在第34堂課的最後,我有個問題:If A and B are diagonalizable, they have the same eigenvectors if and only if AB = BA. 由左推到右,老師上課講的很清楚。但是由右推到左,在下才疏學淺,看了講義還是一知半解,想請問老師有沒有其它的算法能救救我?

 
答曰:

我先說明如何從左推到右。若 n\times n 階矩陣 AB 可對角化,且 AB 有相同的線性獨立特徵向量集 \{\mathbf{x}_1,\ldots,\mathbf{x}_n\},則存在可逆矩陣 S=\begin{bmatrix} \mathbf{x}_1&\cdots&\mathbf{x}_n \end{bmatrix} 使得 S^{-1}AS=\Lambda=\mathrm{diag}(\lambda_1,\ldots,\lambda_n)S^{-1}BS=M=\mathrm{diag}(\mu_1,\ldots,\mu_n),我們稱 AB 同時可對角化 (simultaneously diagonalizable)。明顯地,\Lambda M=M\Lambda,即

S^{-1}ABS=S^{-1}BAS

等號兩邊同時左乘 S,右乘 S^{-1},立得 AB=BA。因此,若 AB 同時可對角化,則 AB 是可交換矩陣 (commuting matrices)。

 
反方向的命題是:若 AB 可對角化且 AB=BA,則存在一可逆矩陣 S=\begin{bmatrix} \mathbf{x}_1&\cdots&\mathbf{x}_n \end{bmatrix} 使得 S^{-1}ASS^{-1}BS 同時是對角矩陣,也就是說 AB 有相同的線性獨立特徵向量集 \{\mathbf{x}_1,\ldots,\mathbf{x}_n\}。請注意,這並不是說可交換矩陣一定可對角化,它只說如果兩個可對角化矩陣是可交換的,那麼它們同時可對角化。由於此命題的證明相對艱深,通常不納入現行的線性代數教學內容,詳細證明請見“同時可對角化矩陣”。下面我介紹另一個基於最小多項式 (minimal polynomial) 的論證方式,供讀者參照比較。

 
分開兩種情形討論。設 An 個相異的特徵值 \lambda_1,\ldots,\lambda_n,分別對應特徵向量 \mathbf{x}_1,\ldots,\mathbf{x}_n,則 A\mathbf{x}_i=\lambda_i\mathbf{x}_ii=1,\ldots,n。對應相異特徵值的特徵向量構成線性獨立集 (見“可對角化矩陣與缺陷矩陣的判定”),可知特徵空間 N(A-\lambda_iI)=\mathrm{span}\{\mathbf{x}_i\}i=1,\ldots,n,彼此不交集,\{\mathbf{x}_1,\ldots,\mathbf{x}_n\}\mathbb{C}^n 的一基底。因為 AB=BA

A(B\mathbf{x}_i)=B(A\mathbf{x}_i)=B(\lambda_i\mathbf{x}_i)=\lambda_i(B\mathbf{x}_i)

對於 i=1,\ldots,n,上式表明 B\mathbf{x}_iA 的特徵向量,對應特徵值 \lambda_i,故 B\mathbf{x}_i\in N(A-\lambda_iI),也就存在 \mu_i 使得 B\mathbf{x}_i=\mu_i\mathbf{x}_i,因此證明 AB 有相同的特徵向量集 \{\mathbf{x}_1,\ldots,\mathbf{x}_n\}。令 S=\begin{bmatrix} \mathbf{x}_1&\cdots&\mathbf{x}_n \end{bmatrix}AB 同時可對角化為 S^{-1}AS=\mathrm{diag}(\lambda_1,\ldots,\lambda_n)S^{-1}BS=\mathrm{diag}(\mu_1,\ldots,\mu_n)

 
再看第二種情形,A 有重複的特徵值。設 Am (m<n) 個相異的特徵值 \lambda_1,\ldots,\lambda_m,對應的特徵空間分別是 N(A-\lambda_1I),\ldots,N(A-\lambda_mI)。令 \beta_i 表示 \lambda_i 的相重數,則 \beta_1+\cdots+\beta_m=n。因為 A 可對角化,也就存在可逆矩陣 S 使得

S^{-1}AS=\Lambda=\begin{bmatrix} \lambda_1I_{\beta_1}&&\\ &\ddots&\\ &&\lambda_mI_{\beta_m} \end{bmatrix}

其中 I_{\beta_i}\beta_i 階單位矩陣。將 A=S\Lambda S^{-1} 代入 AB=BA,即有 S\Lambda S^{-1}B=BS\Lambda S^{-1}。等號兩邊左乘 S^{-1},右乘 S,可得 \Lambda S^{-1}BS=S^{-1}BS\Lambda。令 C=[c_{ij}]=S^{-1}BS,則得 \Lambda C=C\Lambda。比較等號兩邊的 (i,j) 元,(\Lambda)_{ii}c_{ij}=c_{ij}(\Lambda)_{jj}。因為 ((\Lambda)_{ii}-(\Lambda)_{jj})c_{ij}=0,當 (\Lambda)_{ii}\neq(\Lambda)_{jj},定有 c_{ij}=0,故得

S^{-1}BS=C=\begin{bmatrix} C_1&&\\ &\ddots&\\ &&C_m \end{bmatrix}

其中 C_i\beta_i\times\beta_i 階分塊,但未必有主對角形式。這裡是分界點,為了抵達目的地還要加裝一些新配備。

 
我們需要這個性質:可對角化矩陣的最小多項式僅含次冪等於1的因式 (見“最小多項式 (下)”)。令 \mu_1,\ldots,\mu_qB 的相異特徵值。因為 B 可對角化,立知 B 的最小多項式是

m_B(t)=(t-\mu_1)\cdots(t-\mu_q)

另外,兩相似矩陣有相同的最小多項式 (見“最小多項式 (上)”)。因為 C 相似於 B,故 m_C(t)=m_B(t),即知 C 可對角化。最後證明若 C 可對角化,則所有主對角分塊 C_i 皆可對角化。

 
下面的證明存在缺陷:為方便說明,考慮 m=2 的情況。令 T=\begin{bmatrix} W&X\\ Y&Z \end{bmatrix} 為一可逆矩陣,使得 CT=TD,其中 D=\begin{bmatrix} D_1&0\\ 0&D_2 \end{bmatrix} 是對角矩陣,即

\begin{bmatrix} C_1&0\\ 0&C_2 \end{bmatrix}\begin{bmatrix} W&X\\ Y&Z \end{bmatrix}=\begin{bmatrix} W&X\\ Y&Z \end{bmatrix}\begin{bmatrix} D_1&0\\ 0&D_2 \end{bmatrix}

乘開可得

\begin{bmatrix} C_1W&C_1X\\ C_2Y&C_2Z \end{bmatrix}=\begin{bmatrix} WD_1&XD_2\\ YD_1&ZD_2 \end{bmatrix}

X=0Y=0,分塊 WZ 必須滿足

C_1W=WD_1,~~~C_2Z=ZD_2

因為 T 可逆,主對角分塊 WZ 也必定可逆,因此證明 C_1C_2 可對角化:W^{-1}C_1W=D_1Z^{-1}C_2Z=D_2。上面說 WZ 必定可逆,這是沒有根據的論述,因為我們無法確知存在主對角可逆矩陣 T=\begin{bmatrix} W&0\\ 0&Z \end{bmatrix} 使得 CT=TD

 
原來的證明修改如下:考慮 m=2C=\begin{bmatrix} C_1&0\\ 0&C_2 \end{bmatrix},其中 C_1k\times k 階分塊,C_2(n-k)\times(n-k) 階分塊。令可逆矩陣 T 滿足 CT=TDD 是對角矩陣。為方便計算,設 T^{-1} 的 PLDU 分解 (見“PA=LU 分解”),如下:

T^{-1}=P\begin{bmatrix} I_k&0\\ L&I_{n-k} \end{bmatrix}\begin{bmatrix} X&0\\ 0&Y \end{bmatrix}\begin{bmatrix} I_k&U\\ 0&I_{n-k} \end{bmatrix}

其中 P 是排列矩陣,P^{-1}=P^T。因為 T 可逆,Xk\times k 階可逆分塊,Y(n-k)\times (n-k) 階可逆分塊。將 T^{-1} 的分解表達式代入 T^{-1}C=DT^{-1}

P\begin{bmatrix} I_k&0\\ L&I_{n-k} \end{bmatrix}\begin{bmatrix} X&0\\ 0&Y \end{bmatrix}\begin{bmatrix} I_k&U\\ 0&I_{n-k} \end{bmatrix}\begin{bmatrix} C_1&0\\ 0&C_2 \end{bmatrix}=DP\begin{bmatrix} I_k&0\\ L&I_{n-k} \end{bmatrix}\begin{bmatrix} X&0\\ 0&Y \end{bmatrix}\begin{bmatrix} I_k&U\\ 0&I_{n-k} \end{bmatrix}

左乘 \begin{bmatrix} I_k&0\\ -L&I_{n-k} \end{bmatrix}P^T,右乘 \begin{bmatrix} I_k&-U\\ 0&I_{n-k} \end{bmatrix}

\begin{bmatrix} X&0\\ 0&Y \end{bmatrix}\begin{bmatrix} I_k&U\\ 0&I_{n-k} \end{bmatrix}\begin{bmatrix} C_1&0\\ 0&C_2 \end{bmatrix}\begin{bmatrix} I_k&-U\\ 0&I_{n-k} \end{bmatrix}=\begin{bmatrix} I_k&0\\ -L&I_{n-k} \end{bmatrix}P^TDP\begin{bmatrix} I_k&0\\ L&I_{n-k} \end{bmatrix}\begin{bmatrix} X&0\\ 0&Y \end{bmatrix}

其中 P^TDP=\begin{bmatrix} D_1&0\\ 0&D_2 \end{bmatrix} 仍是對角矩陣。乘開上式,可得

\begin{bmatrix} XC_1&X(-C_1U+UC_2)\\ 0&YC_2 \end{bmatrix}=\begin{bmatrix} D_1X&0\\ (-LD_1+D_2L)X&D_2Y \end{bmatrix}

因為 XY 可逆,比較等號兩邊可知 XC_1X^{-1}=D_1YC_2Y^{-1}=D_2,因此證明 C_1C_2 可對角化。

 
使用同樣方式可推廣至 m>2 的情況。令

T=\begin{bmatrix} T_1&&\\ &\ddots&\\ &&T_m \end{bmatrix}

其中 T_i 使得 T_i^{-1}C_iT_i=D_i 為對角矩陣,可知 T^{-1}CT=D 亦是對角矩陣。最後確認 T^{-1}S^{-1}BST=T^{-1}CT=DT^{-1}S^{-1}AST=T^{-1}\Lambda T=\Lambda 也都是對角矩陣,故 ST 的行向量就是同時將 AB 對角化的線性獨立特徵向量集。

This entry was posted in 特徵分析, 答讀者問 and tagged , , , , . Bookmark the permalink.

2 則回應給 答Louie──關於同時可對角化的證明

  1. Louie 說:

    謝謝老師不辭辛勞的為我傳到授業解惑

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 變更 )

Twitter picture

You are commenting using your Twitter account. Log Out / 變更 )

Facebook照片

You are commenting using your Facebook account. Log Out / 變更 )

Google+ photo

You are commenting using your Google+ account. Log Out / 變更 )

連結到 %s