同時可三角化矩陣

本文的閱讀等級:高級

\mathfrak{F}=\{A_1,\ldots,A_m\} 為一 n\times n 階可交換 (commuting) 矩陣家族,其中任何兩矩陣 A_iA_j 滿足 A_iA_j=A_jA_i。若所有 A_i\in\mathfrak{F} 皆可對角化,則存在一可逆矩陣 S 使得 S^{-1}A_iSi=1,\ldots,m,是對角矩陣,此性質稱為同時可對角化 (見“同時可對角化矩陣”)。除此之外,可交換矩陣家族 \mathfrak{F} 另有同時可三角化性質。所謂矩陣三角化或稱 Schur 分解 (見“矩陣三角化的 Schur 定理”) 是指任意 n\times n 階矩陣 A 必可分解成 U^{\ast}AU=T,其中 T 是上三角矩陣,U 是么正 (unitary) 矩陣,U^{\ast}=U^{-1}。同時可三角化則是存在一么正矩陣 U 一併使得所有 U^{\ast}A_iU (i=1,\ldots,m) 為上三角矩陣。表面上,同時可三角化和同時可對角化看似是可交換矩陣的姊妹產品,實際上,兩者的論證過程差異頗大,同時可三角化的證明尤其需要運用較艱深的特徵分析技術。

 
欲證明可交換矩陣家族同時可三角化,我們需要這個預備知識:可交換矩陣家族 \mathfrak{F} 的每個成員擁有至少一個共同的特徵向量 (未必對應相同的特徵值)。下面先證明 \mathfrak{F} 中任意兩矩陣 AB 有一共同特徵向量,之後再推展至整個 \mathfrak{F} 家族。我們使用的主要證明工具是功能強大的解構線性算子武器──不變子空間。設 \mathcal{X}\mathbb{C}^n 的一子空間,如果 \mathcal{X} 中所有向量 \mathbf{x} 滿足 A\mathbf{x}\in\mathcal{X},則 \mathcal{X} 稱作矩陣或線性算子 A 的不變子空間。若 \lambdaA 的一特徵值,明顯地,A 的特徵空間 N(A-\lambda I)=\{\mathbf{x}\vert A\mathbf{x}=\lambda\mathbf{x}\}A 的一不變子空間,但 N(A-\lambda I) 也是 B 的不變子空間嗎?答案是肯定的,原因在於 AB 是可交換矩陣。對於 \mathbf{x}\in N(A-\lambda I)

\begin{aligned}  A(B\mathbf{x})&=(AB)\mathbf{x}=(BA)\mathbf{x}=B(A\mathbf{x})=B(\lambda\mathbf{x})=\lambda(B\mathbf{x})\end{aligned}

即知 B\mathbf{x}\in N(A-\lambda I)

 
透過不變子空間我們成功地聯繫了兩個可交換矩陣,接著引用下面的不變子空間基本性質 (見“拒絕行列式的特徵分析”定理一):

 
不變子空間基本定理

An\times n 階矩陣,若 \mathcal{X}\subseteq\mathbb{C}^nA 的一個不變子空間且 \mathcal{X}\neq\{\mathbf{0}\},則 \mathcal{X} 中必有一特徵向量 \mathbf{x} 使得 A\mathbf{x}=\lambda\mathbf{x},其中 \lambdaA 的一特徵值。

 
根據此定理,既然 N(A-\lambda I)B 的不變子空間,其中必有一特徵向量 \mathbf{x} 使得 B\mathbf{x}=\mu\mathbf{x},故可交換矩陣 AB 有一共同的特徵向量。

 
延伸前面的討論,A 對應 \lambda 的特徵空間 N(A-\lambda I) 不僅是其自身也是其他 B\in\mathfrak{F} 的不變子空間,我們試著從這個角度切入可交換矩陣家族 \mathfrak{F} 有一共同特徵向量的問題。若 \mathrm{dim}N(A-\lambda I)=1,特徵空間 N(A-\lambda I) 所含向量即為 A 而且也是任何 B\in\mathfrak{F} 的特徵向量,但若 \mathrm{dim}N(A-\lambda I)>1,從 \mathfrak{F} 中兩兩矩陣有一相同的特徵向量仍不足以推論出所有的家族成員都擁有一共同的特徵向量。所以證明關鍵有二:我們關心同時為整個家族 \mathfrak{F} 的不變子空間,還有該子空間的維數愈小愈好。若子空間 \mathcal{W}\subseteq\mathbb{C}^n 是所有 A\in\mathfrak{F} 的不變子空間,我們稱 \mathcal{W}\mathfrak{F}—不變子空間。明顯地,\mathfrak{F}—不變子空間必定存在,例如,\mathbb{C}^n 就是一個 \mathfrak{F}—不變子空間。想像從 \mathbb{C}^n 開始,我們持續找尋 n-1n-2\mathfrak{F}—不變子空間,直到最後獲得一個最小維數但不為 \{\mathbf{0}\}\mathfrak{F}—不變子空間。下面的定理說明這個最小維數的 \mathfrak{F}—不變子空間的性質,也就完成可交換矩陣家族有一共同特徵向量的論證。

 
最小 \mathfrak{F}—不變子空間定理

\mathcal{W}\neq\{\mathbf{0}\} 是一個最小維數的 \mathfrak{F}—不變子空間 (\mathcal{W} 未必唯一),則對任何 A\in\mathfrak{F}\mathcal{W} 中所有非零向量都是 A 的特徵向量。

 
證明於下。利用不變子空間基本定理,因為 \mathcal{W}\neq\{\mathbf{0}\}A 的一個不變子空間,\mathcal{W} 中必有一特徵向量 \mathbf{y} 使得 A\mathbf{y}=\lambda\mathbf{y}。令 \mathcal{W}_0=\{\mathbf{y}\in\mathcal{W}\vert A\mathbf{y}=\lambda\mathbf{y}\},也就是說,\mathcal{W}_0=\mathcal{W}\cap N(A-\lambda I),所以 \mathcal{W}_0 是一個子空間 (兩子空間交集為子空間)。使用反證法。假設 \mathcal{W} 中有一非零向量不是 A 的特徵向量,則 \mathcal{W}_0\neq\mathcal{W},故可推論 \mathrm{dim}\mathcal{W}_0\le\mathrm{dim}\mathcal{W}。若 \mathbf{y}\in\mathcal{W}_0,因為 AB\in\mathfrak{F} 是可交換矩陣,即得 A(B\mathbf{y})=\lambda(B\mathbf{y}),所以 B\mathbf{y}\in\mathcal{W}_0,換句話說,\mathcal{W}_0 是一個 \mathfrak{F}—不變子空間。然而 \mathcal{W}_0\mathcal{W} 的維數來得小,這樣便得到一個矛盾,故得證。

 
準備妥當,我們現在開始證明可交換矩陣同時可三角化,亦即存在一么正矩陣 U,對任一 A_i\in\mathfrak{F}U^{\ast}A_iU 為上三角矩陣。以下採用類似“矩陣三角化的 Schur 定理”的計算程序,唯一不同的地方是我們以 \mathfrak{F} 的共同特徵向量來生成 U。設 \mathbf{x}_1 是所有 A_i\in\mathfrak{F} 的共同特徵向量,\Vert\mathbf{x}_1\Vert=1,以符號表示為

A_i\mathbf{x}_1=\lambda_i\mathbf{x}_1,~~i=1,\ldots,m

\mathbf{x}_1 擴充為一么正矩陣 U_1,如下:

\begin{aligned}  U_1&=\begin{bmatrix}    \mathbf{x}_1&\mathbf{y}_1&\cdots&\mathbf{y}_{n-1}    \end{bmatrix}=\begin{bmatrix}    \mathbf{x}_1&Y    \end{bmatrix}\end{aligned}

其中 Y=\begin{bmatrix}    \mathbf{y}_1&\cdots&\mathbf{y}_{n-1}    \end{bmatrix}。計算可得

\begin{aligned}  U_1^{\ast}A_iU_1&=\begin{bmatrix}    \mathbf{x}_1^{\ast}\\    Y^{\ast}    \end{bmatrix}A_i\begin{bmatrix}    \mathbf{x}_1&Y    \end{bmatrix}=\begin{bmatrix}    \mathbf{x}_1^{\ast}\\    Y^{\ast}    \end{bmatrix}\begin{bmatrix}    A_i\mathbf{x}_1&A_iY    \end{bmatrix}\\    &=\begin{bmatrix}    \mathbf{x}_1^{\ast}\\    Y^{\ast}    \end{bmatrix}\begin{bmatrix}    \lambda_i\mathbf{x}_1&AY    \end{bmatrix}=\begin{bmatrix}    \lambda_i&\mathbf{x}_1^{\ast}A_iY\\    0&Y^{\ast}A_iY    \end{bmatrix}\\  &=\begin{bmatrix}    \lambda_i&\mathbf{b}_i^T\\    0&B_i    \end{bmatrix}\end{aligned}

上面我們使用了 \mathbf{y}_j^{\ast}\mathbf{x}_1=0j=1,\ldots,n-1,並令 \mathbf{b}_i^T=\mathbf{x}_1^{\ast}A_iYB_i=Y^{\ast}A_iY。因為 A_iA_j 是可交換矩陣,很容易證明 U_1^{\ast}A_iU_1U_1^{\ast}A_jU_1 是可交換矩陣,因此 B_iB_j 也是可交換矩陣,故知 \{B_1,\ldots,B_m\} 構成一個 (n-1)\times(n-1) 階可交換矩陣家族。運用相同方式產生一 (n-1)\times(n-1) 階么正矩陣 \tilde{U}_2,其中 \tilde{U}_2 的第一行設為 \{B_1,\ldots,B_m\} 家族的共同特徵向量 \mathbf{x}_2\Vert\mathbf{x}_2\Vert=1,此向量滿足

B_i\mathbf{x}_2=\mu_i\mathbf{x}_2,~~i=1,\ldots,m

為簡化符號,將上三角矩陣 \tilde{U}_2^{\ast}B_i\tilde{U}_2 中不影響後續程序的分塊以 \ast 表示,如下:

\tilde{U}_2^{\ast}B_i\tilde{U}_2=\begin{bmatrix}    \mu_i&\ast\\    0&C_i    \end{bmatrix}

其中 \{C_1,\ldots,C_m\} 是新產生的 (n-2)\times(n-2) 階可交換矩陣家族。為結合 n\times nU_1(n-1)\times(n-1\tilde{U}_2,令

U_2=\begin{bmatrix}    1&0\\    0&\tilde{U}_2    \end{bmatrix}

前面兩步驟的計算程序可表示成

\begin{aligned}  U_2^{\ast}U_1^{\ast}A_iU_1U_2&=\begin{bmatrix}    1&0\\    0&\tilde{U}_2^{\ast}    \end{bmatrix}\begin{bmatrix}    \lambda_i&\ast\\    0&B_i    \end{bmatrix}\begin{bmatrix}    1&0\\    0&\tilde{U}_2    \end{bmatrix}=\begin{bmatrix}    \lambda_i&\ast&\ast\\    0&\mu_i&\ast\\    0&0&C_i    \end{bmatrix}\end{aligned}

重複上述步驟即可歸納得到么正矩陣 U=U_{n-1}\cdots U_2U_1 一併使 U^{\ast}A_iUA_i\in\mathfrak{F},是上三角矩陣。

相關閱讀:
This entry was posted in 特徵分析, 線性代數專欄 and tagged , , , . Bookmark the permalink.

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s