矩陣三角化的 Schur 定理

本文的閱讀等級:中級

A 是一個 n\times n 階矩陣,\lambda_1,\ldots,\lambda_nA 的特徵值 (包含重複特徵值),\mathbf{x}_i 為對應特徵值 \lambda_i 的特徵向量。我們稱 A 是可對角化矩陣 (diagonalizable matrix),若 A 可分解為

A=S\Lambda S^{-1}

或表示成 S^{-1}AS=\Lambda,其中 n\times n 階可逆矩陣 S 的行向量 (column vector) 由特徵向量 \mathbf{x}_i 組成,即 S=\begin{bmatrix}    \mathbf{x}_1&\cdots&\mathbf{x}_n    \end{bmatrix},且 \Lambda=\mathrm{diag}(\lambda_1,\ldots,\lambda_n) 是特徵值構成的對角矩陣。不過,任意方陣 A 未必都可對角化。退而求其次,是否存在可逆矩陣 M 使得 M^{-1}AM 具有他樣簡單形式?這包含了兩個問題:應否限制 M 為某種特殊矩陣以便利搜尋?還有所謂的簡單形式究竟為何?以下我們考慮矩陣三角化的問題:設 M=U 為么正矩陣 (unitary matrix,或譯為酉矩陣),U 是可逆矩陣且 U^{\ast}=U^{-1} (見“特殊矩陣 (3):么正矩陣 (酉矩陣)”)。令 U^{\ast}AU=T,其中 T 是上三角矩陣。我們將證明任意方陣都可么正三角化 (unitarily triangularizable),意指任意方陣都么正相似於一個上三角矩陣,此三角矩陣的主對角元即為 A (同樣也是 T) 的特徵值。這個結果由德國數學家舒爾 (Issai Schur) 率先提出,故名為 Schur 定理。若 A 是實矩陣且所有的特徵值皆為實數,則 U 變成實正交矩陣 (orthogonal matrix) Q,滿足 Q^T=Q^{-1}

 
嚴格的證明方式可採行歸納法,但為了方便說明與理解,我們僅考慮 3\times 3 階矩陣 A。注意,A 的特徵值可能完全重複,令 A 的一個特徵值為 \lambda_1,至少存在一個對應的特徵向量 \mathbf{x}_1\Vert\mathbf{x}_1\Vert=1。將 3 維向量 \mathbf{x}_1 置於矩陣 U_1 的第一行,

U_1=\begin{bmatrix}     & \vline & \ast & \ast\\    \mathbf{x}_1 & \vline&\ast & \ast\\     & \vline & \ast&\ast    \end{bmatrix}

U_1 的其餘二行則由 Gram-Schmidt 正交化過程決定 (見“Gram-Schmidt 正交化與 QR 分解”),如此可保證 U_1 是么正矩陣。從特徵方程式 A\mathbf{x}_1=\lambda_1\mathbf{x}_1 可知

AU_1=A\begin{bmatrix}  & \vline & \ast & \ast\\  \mathbf{x}_1 & \vline&\ast & \ast\\  & \vline & \ast&\ast  \end{bmatrix}=\begin{bmatrix}  & \vline & \ast & \ast\\  \lambda_1\mathbf{x}_1 & \vline&\ast & \ast\\  & \vline & \ast&\ast  \end{bmatrix}=U_1\begin{bmatrix}  \lambda_1&\vline&\bullet&\bullet\\ \hline  0&\vline&\ast&\ast\\  0&\vline&\ast&\ast  \end{bmatrix}

或寫為

U_1^{\ast}AU_1=\begin{bmatrix}    \lambda_1&\vline&\bullet&\bullet\\ \hline    0&\vline&\ast&\ast\\    0&\vline&\ast&\ast  \end{bmatrix}=B

下一個步驟僅需考慮 B 矩陣右下標示為 \ast2\times 2 階分塊。令此 2\times 2 階分塊的一個特徵值為 \lambda_2,正規化後的 2 維特徵向量以 \mathbf{x}_2 表示。如前一步驟作法,將 \mathbf{x}_2 填入 U_2 右下 2\times 2 分塊的第一行,第二行同樣可由正交化過程確定,可得

U_2=\begin{bmatrix}    1&\vline&0& & 0\\ \hline    0&\vline&\mathbf{x}_2&\vline&\ast\\    0&\vline& &\vline&\ast    \end{bmatrix}

展開整理各項次,不難確認下式成立:

BU_2=U_2\begin{bmatrix}    \lambda_1&\bullet&\vline&\bullet\\    0&\lambda_2&\vline&\bullet\\ \hline    0&0&\vline&\ast    \end{bmatrix}

或寫為

U_2^{\ast}BU_2=\begin{bmatrix}    \lambda_1&\bullet&\vline&\bullet\\    0&\lambda_2&\vline&\bullet\\ \hline    0&0&\vline&\ast    \end{bmatrix}

至此,我們得到了ㄧ個上三角矩陣 T,整個計算過程表示如下:

U_2^{\ast}U_1^{\ast}AU_1U_2=\begin{bmatrix}    \lambda_1&\bullet&\bullet\\    0&\lambda_2&\bullet\\    0&0&\lambda_3    \end{bmatrix}=T

其中么正矩陣乘積 U=U_1U_2 仍然是么正矩陣,因為

(U_1U_2)^{-1}=U_2^{-1}U_1^{-1}=U_2^{\ast}U_1^{\ast}=(U_1U_2)^{\ast}

也就證得 U^{\ast}AU=T

 
下面我們用一個例子展示計算過程。考慮

A=\left[\!\!\begin{array}{crr}    4&-4&-3\\    1&2&-1\\    2&-4&-1    \end{array}\!\!\right]

先找出 A 的一個特徵值 \lambda_1=1,對應的單位特徵向量是 \mathbf{x}_1=\frac{1}{\sqrt{2}}\begin{bmatrix}    1\\    0\\    1    \end{bmatrix},擴充出 \mathbb{C}^3 的一組基底 (見“線性獨立向量集的判定與算法”,例3),再使用 Gram-Schmidt 正交程序得到么正矩陣 U_1 的另兩個單位向量,結果如下:

U_1=\begin{bmatrix}    \frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}&0\\    0&0&1\\    \frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}&0    \end{bmatrix}

接者算出

B=U_1^{\ast}AU_1=\begin{bmatrix}    1&5&-4\sqrt{2}\\    0&2&0\\    0&\sqrt{2}&2    \end{bmatrix}

再考慮 B 矩陣右下 2\times 2 階分塊 \begin{bmatrix}    2&0\\    \sqrt{2}&2    \end{bmatrix},其特徵值為 \lambda_2=2,特徵向量為 \mathbf{x}_2=\begin{bmatrix}    0\\    1    \end{bmatrix},就有

U_2=\begin{bmatrix}    1&0&0\\    0&0&1\\    0&1&0    \end{bmatrix}

所以相似於 A 的上三角矩陣為

T=U_2^{\ast}BU_2=\begin{bmatrix}    1&-4\sqrt{2}&5\\    0&2&\sqrt{2}\\    0&0&2    \end{bmatrix}

 
對於大尺寸方陣,第一步要計算 U_1,接下來是 U_2U_3,等等,最後還要將它們相乘才能得到 U。這整個計算過程顯然一點也不有趣,或許因為這個理由,矩陣三角化不常見於近代基礎線性代數教本,往後我將介紹一些矩陣三角化在矩陣理論推導的應用。

相關閱讀:
廣告
本篇發表於 特徵分析, 線性代數專欄 並標籤為 , , , , , , 。將永久鏈結加入書籤。

4 Responses to 矩陣三角化的 Schur 定理

  1. 無極真人 說道:

    以前好像可以直接下載~
    請問版主~那個功能是否被移除了?

  2. ccjou 說道:

    之前管理員曾經嘗試外掛 pdf 轉檔功能,但試了幾套程式仍無法獲得良好效果,暑假期間變更頁面時便將此功能移除。目前我們覺得效果最好的方式是由網友自行將打開頁面轉成 pdf,方法之一是安裝免費軟體 pdf995,網址如下:
    http://toget.pchome.com.tw/category/business/9376.html
    以列印方式指定輸出印表機為 pdf995 即可產生 pdf 檔,之後再儲存至指定資料夾,不過頁面上的所有文字包括迴響也都會一併列印出來。

  3. vtriplev 說道:

    我自己的解讀做一些註解:
    U1是選擇{x1,&…}為1組基底,以N維空間標準基底{e1,e2…en}所表示的基底矩陣
    而U2則是再稍微變換1下選擇另1組調整過的{x1,*…}基底,且在以U1為基底的表示下
    [U2]based on U1=第一行為e1(1,0,0..),第一列的第2行以後的元素均為0
    這個新選的微調基底在以N維空間標準基底{e1,e2…en}所表示時
    就是U, U=U1*U2

  4. 計組小粉絲 說道:

    文中範例
    x_{1}= \begin{bmatrix} \frac{1}{2^{\frac{1}{2}}}\\  0\\  \frac{1}{2^{\frac{1}{2}}} \end{bmatrix}
    之後再與 I= \begin{bmatrix} 1 & 0 & 0\\  0 & 1 & 0\\  0 & 0 & 1 \end{bmatrix} 的行向量做 GSO 正交化
    得出 U_{1}
    是這樣子對吧
    之前我找不到 x_{2}x_{3} 是多少
    想破頭都無法 GSO 正交化

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s