利用舒爾引理證明可交換矩陣同時可三角化

本文的閱讀等級:中級

\mathfrak{F}=\{A_1,\ldots,A_m\} 為一 n\times n 階兩兩可交換 (commuting) 矩陣集,也就是說任兩矩陣 A_iA_j 滿足 A_iA_j=A_jA_i。以下考慮 n\ge 2。可交換矩陣集 \mathfrak{F} 的所有矩陣同時可三角化,具體而言,存在一么正 (unitary) 矩陣 UU^\ast=U^{-1},使得 U^{\ast}A_iUi=1,\ldots,m,為上三角矩陣 (見“同時可三角化矩陣”)。本文介紹一個利用舒爾引理 (Schur’s lemma) 的證明方法。

 
\mathfrak{U} 為一包含 n\times n 階複矩陣的 (非空) 集合。我們稱 \mathfrak{U} 為可約化[1](reducible),若存在固定整數 p1\le p\le n-1,以及可逆矩陣 S 使得每一 A\in\mathfrak{U} 相似於結構相同的分塊上三角矩陣,

S^{-1}AS=\begin{bmatrix} T_{11}&T_{12}\\ 0&T_{22} \end{bmatrix}

其中 T_{11}p\times p 階,T_{12}p\times (n-p) 階,且 T_{22}(n-p)\times (n-p) 階,否則稱為不可約化 (irreducible)。關於分塊上三角矩陣的相似變換,請參閱“不使用行列式的特徵值和特徵向量算法 (上)”。

 
舒爾引理:令 \mathfrak{U} 為一不可約化 n\times n 階複矩陣集合。若 M 為一固定矩陣使得每一 A\in\mathfrak{U} 滿足

AM=MB

M=0M 為一可逆矩陣。再者,若 B=A,即 M\mathfrak{U} 的每一個元素 (矩陣) 可交換,則 M 是一純量矩陣,即 M=\lambda I\lambda\in\mathbb{C}

 
我們先證明第一個命題。寫出 M 的等價標準型 (見“等價標準型”)

M=P\begin{bmatrix} I_r&0\\ 0&0 \end{bmatrix}Q

其中 r=\hbox{rank}MPQ 是可逆矩陣。對於每一 A\in\mathfrak{U},將上式代入 AM=MB

AP\begin{bmatrix} I_r&0\\ 0&0 \end{bmatrix}Q=P\begin{bmatrix} I_r&0\\ 0&0 \end{bmatrix}QB

等號兩邊同時左乘 P^{-1},並右乘 Q^{-1},可得

P^{-1}AP\begin{bmatrix} I_r&0\\ 0&0 \end{bmatrix}=\begin{bmatrix} I_r&0\\ 0&0 \end{bmatrix}QBQ^{-1}

P^{-1}AP=\begin{bmatrix} X_{11}&X_{12}\\ X_{21}&X_{22} \end{bmatrix}QBQ^{-1}=\begin{bmatrix} Y_{11}&Y_{12}\\ Y_{21}&Y_{22} \end{bmatrix},其中 X_{11}Y_{11}r\times r 階,X_{12}Y_{12}r\times (n-r) 階,X_{21}Y_{21}(n-r)\times r 階,且 X_{22}Y_{22}(n-r)\times (n-r) 階。代入 P^{-1}APQBQ^{-1} 的分塊表達式,上式可化簡為

\begin{bmatrix} X_{11}&0\\ X_{21}&0 \end{bmatrix}=\begin{bmatrix} Y_{11}&Y_{12}\\ 0&0 \end{bmatrix}

X_{21}=0。然而,\mathfrak{U} 不可約化,意味 r=0r=n,換句話說,M=0M 為一可逆矩陣。接著證明第二個命題。假設對於每一 A\in\mathfrak{U}AM=MA。令 \lambdaM 的一個特徵值。因為 A(M-\lambda I)=(M-\lambda I)AM-\lambda I 不可逆,由第一個命題推知 M-\lambda I=0,證得 M=\lambda I

 
下面我們使用舒爾引理證明可交換矩陣同時可三角化。令 \mathfrak{F}=\{A_1,\ldots,A_m\} 為一 n\times n 階可交換矩陣集。若 \mathfrak{F} 不可約化,根據舒爾引理,A_i\mathfrak{F}\setminus A_i 的所有元素可交換,推知 A_i 是純量矩陣,i=1,\ldots,m。若 \mathfrak{F} 可約化,在不失一般性的原則下,假設可逆矩陣 S 使得每一 A_i\in\mathfrak{F} 相似於結構相同的分塊上三角矩陣,

S^{-1}A_iS=T_i=\begin{bmatrix} (T_i)_{11}&\cdots&(T_i)_{k1}\\ &\ddots&\vdots\\ &&(T_i)_{kk} \end{bmatrix},~~i=1,\ldots,m

其中主對角分塊 (T_i)_{11},\ldots,(T_i)_{kk} 不可約化,k\ge 2。令 \mathfrak{F}_j=\{(T_1)_{jj},\ldots,(T_m)_{jj}\}j=1,\ldots,k。因為

T_iT_j=(S^{-1}A_iS)(S^{-1}A_jS)=(S^{-1}A_jS)(S^{-1}A_iS)=T_jT_i

\{T_1,\ldots,T_m\} 是可交換矩陣集,意味 \mathfrak{F}_j 是可交換矩陣集。但 \mathfrak{F}_j 不可約化,舒爾引理聲稱 \mathfrak{F}_j 的所有元素都是純量矩陣,因此證明 T_ii=1,\ldots,m,為上三角矩陣。另外,設可逆矩陣 S 的 QR 分解為 S=UR,其中 U^\ast=U^{-1}R 是上三角可逆矩陣 (見“線代膠囊──QR 分解”),則

S^{-1}A_iS=R^{-1}U^{-1}A_iUR=R^{-1}U^\ast AUR=T_i

或寫為

U^\ast A_iU=RT_iR^{-1}

上式中,上三角矩陣乘積 RT_iR^{-1} 亦為上三角矩陣,故證明所求。

 
附帶說明,\mathfrak{U} 可約化等價於 \mathfrak{U} 么正可約化 (unitarily reducible)。若 \mathfrak{U} 可約化,對於每一 A\in\mathfrak{U}

S^{-1}AS=R^{-1}U^{-1}AUR=\begin{bmatrix} T_{11}&T_{12}\\ 0&T_{22} \end{bmatrix}

則有

U^\ast AU=R\begin{bmatrix} T_{11}&T_{12}\\ 0&T_{22} \end{bmatrix}R^{-1}=\begin{bmatrix} T'_{11}&T'_{12}\\ 0&T'_{22} \end{bmatrix}

其中第二個等號係因分塊上三角矩陣與上三角矩陣相乘不改變分塊結構。明顯地,反向推論也成立。同樣道理,三角化等價於么正三角化 (見“矩陣三角化的 Schur 定理”)。

 
附註:
[1] 本文指稱的可約化矩陣不同於可約矩陣,參見“特殊矩陣 (20):可約矩陣”。

廣告
本篇發表於 特徵分析, 線性代數專欄 並標籤為 , , , 。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s