三角矩陣的逆矩陣

本文的閱讀等級:初級

A=[a_{ij}] 為一個 n\times n 階上三角矩陣,即 a_{ij}=0i>j。假設 A 是可逆的,\det A=a_{11}\cdots a_{nn}\neq 0 表明可逆上三角矩陣的主對角不含零元。上三角矩陣的逆矩陣也是上三角矩陣,本文介紹三種證明方法:(1) 高斯─約當法,(2) 冪零 (nilpotent) 矩陣,(3) 不變子空間 (invariant subspace)。因為 A^T 是下三角矩陣,利用 (A^T)^{-1}=(A^{-1})^T 可推論下三角矩陣 A^T 的逆矩陣 (A^{-1})^T 也是下三角矩陣。

 
高斯─約當法

首先我介紹一個採用高斯─約當法的計算證法 (見“高斯─約當法”)。將上三角矩陣 A 表示成 A=DU,其中 D=\mathrm{diag}(a_{11},\ldots,a_{nn})U=[u_{ij}] 是上三角矩陣,其中每一 u_{ii}=1。利用 A^{-1}=(DU)^{-1}=U^{-1}D^{-1}D^{-1} 是對角矩陣 (也是上三角矩陣),如果能證明 U^{-1} 是上三角矩陣,便可推論 A^{-1} 是上三角矩陣 (因為兩個上三角矩陣的積也是上三角矩陣)。使用基本列運算將增廣矩陣 \begin{bmatrix}  U&I  \end{bmatrix} 化簡為簡約列梯形式 \begin{bmatrix}  I&X  \end{bmatrix},其中 X=U^{-1}。為方便說明,考慮 3\times 3 階矩陣 U,計算過程如下:

\begin{bmatrix}  1&a&b&\vline&1&0&0\\  0&1&c&\vline&0&1&0\\  0&0&1&\vline&0&0&1  \end{bmatrix}\to\left[\!\!\begin{array}{ccccccr}  1&a&0&\vline&1&0&-b\\  0&1&0&\vline&0&1&-c\\  0&0&1&\vline&0&0&1  \end{array}\!\!\right]\to\left[\!\!\begin{array}{cccccrc}  1&0&0&\vline&1&-a&ac-b\\  0&1&0&\vline&0&1&-c\\  0&0&1&\vline&0&0&1  \end{array}\!\!\right]

對於 n\times n 階矩陣 U,使用同樣方式亦可證明 U^{-1} 是上三角矩陣。

 
冪零矩陣

沿用前面的定義,第二個證法將上三角矩陣 A 表示成 A=DU=D(I+N),其中 N 是上三角矩陣且主對角元全部是零,稱為嚴格上三角矩陣。以 n=4 為例,冪矩陣 N^k 的型態如下:

N=\begin{bmatrix}  0&\ast&\ast&\ast\\  0&0&\ast&\ast\\  0&0&0&\ast\\  0&0&0&0  \end{bmatrix},~~N^2=\begin{bmatrix}  0&0&\ast&\ast\\  0&0&0&\ast\\  0&0&0&0\\  0&0&0&0  \end{bmatrix},~~N^3=\begin{bmatrix}  0&0&0&\ast\\  0&0&0&0\\  0&0&0&0\\  0&0&0&0  \end{bmatrix},~~N^4=0

我們可以歸納 n\times n 階嚴格上三角矩陣 N 滿足 N^n=0,即知 N 是冪零矩陣 (見“特殊矩陣 (1):冪零矩陣”)。寫出 A^{-1}=(I+N)^{-1}D^{-1},直接計算可驗證

(I+N)^{-1}=I-N+N^{2}-\cdots+(-1)^{n-1}N^{n-1}

上式等號右邊的所有項皆為上三角矩陣,故 (I+N)^{-1} 是上三角矩陣,也就證明 A^{-1} 是上三角矩陣。

 
不變子空間

最後介紹一個採用幾何觀點的證法,不過你需要知道一些向量空間分析的知識 (見“不變子空間──解構線性算子的利器”)。將上三角矩陣 A 視為從 \mathbb{C}^n 映至 \mathbb{C}^n 的一個線性變換。令 \mathbf{e}_i 代表 \mathbb{C}^n 的第 i 個標準基底向量 (\mathbf{e}_i 的第 i 元等於 1,其餘各元為零),則

\begin{aligned}  A\mathbf{e}_1&=a_{11}\mathbf{e}_1\\  A\mathbf{e}_2&=a_{12}\mathbf{e}_1+a_{22}\mathbf{e}_2\\  &\vdots\\  A\mathbf{e}_n&=a_{1n}\mathbf{e}_1+a_{2n}\mathbf{e}_2+\cdots+a_{nn}\mathbf{e}_n,  \end{aligned}

對於 i=1,\ldots,nA\mathbf{e}_i\mathbf{e}_1,\ldots,\mathbf{e}_i 的線性組合,也就是說,

\begin{aligned}  A\mathbf{e}_1&\in\mathrm{span}\{\mathbf{e}_1\}\\  A\mathbf{e}_2&\in\mathrm{span}\{\mathbf{e}_1,\mathbf{e}_2\}\\  &\vdots\\  A\mathbf{e}_n&\in\mathrm{span}\{\mathbf{e}_1,\mathbf{e}_2,\ldots,\mathbf{e}_n\},    \end{aligned}

其中 \hbox{span}S 代表向量集合 S 的生成 (span),即所有線性組合形成的集合。上面的事實提供一個上三角矩陣的界定方法:若每一子空間 \mathcal{X}_k=\mathrm{span}\{\mathbf{e}_1,\ldots,\mathbf{e}_k\}k=1,\ldots,n 滿足 A\mathcal{X}_k\subseteq\mathcal{X}_k,其中 A\mathcal{X}_k\equiv\mathrm{span}\{A\mathbf{e}_1,\ldots,A\mathbf{e}_k\}\mathcal{X}_k 稱為 A 的一個不變子空間,則 A 是上三角矩陣。若 A 是可逆的,所有 a_{ii} 皆不為零,立得 A\mathcal{X}_k=\mathcal{X}_k。根據以上結果,對於任一 \mathbf{x}\in\mathcal{X}_kk=1,\ldots,n,由於 A\mathcal{X}_k=\mathcal{X}_k,因此存在 \mathbf{y}\in\mathcal{X}_k 使得 A\mathbf{y}=\mathbf{x},或 A^{-1}\mathbf{x}=\mathbf{y}。換句話說,A^{-1}\mathbf{x}\in \mathcal{X}_k,故可推論 A^{-1}\mathcal{X}_k\subseteq\mathcal{X}_k,即證明 A^{-1} 是上三角矩陣。

Advertisements
本篇發表於 線性方程, 線性代數專欄 並標籤為 , , , 。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s