你不能不知道的矩陣秩

本文的閱讀等級:初級

提及矩陣,我們經常以其外表尺寸描述它,例如,A 是一個 4\times 5 階矩陣表示 A 有四個列 (row) 和五個行 (column)[1],總計包含 20 個元 (entry)。如果矩陣的用途只是像電腦程式裡的陣列或數組 (array) 用來儲存物件,那麼表明幾何尺寸便足以規範其體量。在線性代數中,矩陣不僅是儲存體,它也表示向量空間之間的線性變換。自然地,我們想要知道矩陣所代表的線性變換攜帶了多少訊息?淺白一點的說法是矩陣的真實「尺寸」為何?它與線性代數裡的空間概念又有何關聯?

 
看下面這個 3\times 4 階矩陣,試想此矩陣包含多少訊息?

\begin{bmatrix}  1&2&3&0\\  1&2&3&0\\  1&2&3&0  \end{bmatrix}

讀者可能回答:這個矩陣包含 1 個單位的訊息。你之所以如此認定的原因是它有相同的三個列 \begin{bmatrix}  1&2&3&0  \end{bmatrix},那麼此矩陣的四個行也只包含了 1 個單位的訊息嗎?觀察發現第 4 行的所有元為零故不起作用,第 2 行與第 3 行是第 1 行的倍數。另外,第 3 行也可以表示成第 1 行與第 2 行之和,因此確實只有 1 個真正有價值的訊息。

 
事情到此應該已經十分明朗,矩陣所攜帶的訊息亦即其真實尺寸,就是最小的行 (列) 向量集合──經過線性組合足以衍生出所有的行 (列)──所包含的向量數;較為直接的說法是,最大的線性獨立行 (列) 向量集合所包含的向量數。這個度量值的正式名稱叫做矩陣秩 (rank),或簡稱為秩,記作 \mathrm{rank}A。下面我整理了與梯形矩陣 (echelon form)、線性獨立、維數、秩—零度定理 (rank-nullity theorem),以及奇異值分解有關的十條矩陣秩的等價界定。

 
A 為一個 m\times n 階矩陣,U 為列運算化簡 A 後得到的列等價梯形矩陣。底下用一個例子將各個性質串接起來,你可以藉此相互參照比較。考慮

A=\begin{bmatrix}  1&0&1\\  4&3&7  \end{bmatrix}

使用高斯消去法將 A 化簡為梯形矩陣

U=\begin{bmatrix}  1&0&1\\  0&3&3  \end{bmatrix}

 
梯形矩陣

(1) \mathrm{rank}AU 所含的軸 (pivot) 數。

這個性質等於告訴我們如何計算矩陣秩,詳細討論請見“利用行列式計算矩陣秩”。上例中,矩陣 U=[u_{ij}] 包含兩個軸,軸是各列的非零領先元,即 u_{11}=1u_{22}=3,故 \mathrm{rank}A=2

(2) \mathrm{rank}AU 的軸行 (pivot column) 數。

(3) \mathrm{rank}AU 的軸列 (pivot row) 數。

包含軸的行稱為軸行,U 有兩個軸行 \begin{bmatrix}  1\\ 0  \end{bmatrix}\begin{bmatrix}  0\\3  \end{bmatrix};包含軸的列稱為軸列,U 有兩個軸列 \begin{bmatrix}  1&0&1  \end{bmatrix}\begin{bmatrix}  0&3&3  \end{bmatrix}。 明顯地,每一個軸對應唯一一個軸行與軸列,故軸數等於軸行數也等於軸列數。換句話說,一個矩陣的行秩等於列秩。

 
線性獨立

(4) \mathrm{rank}AA 的最大線性獨立行向量數。

梯形矩陣 U 的第 12 行為軸行,因此 A 的對應行 \begin{bmatrix}  1\\4  \end{bmatrix}\begin{bmatrix}  0\\3  \end{bmatrix} 是線性獨立的 (見“由簡約列梯形式判斷行空間基底”)。請注意,最大的線性獨立的行向量集合未必是唯一的,但其中所含的向量數 (即矩陣秩) 卻是唯一的,此例中任選 A 的兩個行向量都可以形成最大的線性獨立行向量集合。

(5) \mathrm{rank}AA 的最大線性獨立列向量數。

因為基本列運算可能變換列位置,我們不可直接從 A 對應 U 的軸列挑選線性獨立列集合,而要根據梯形矩陣 U 加以判斷。基本列運算是列的線性組合,且 U 的軸列是線性獨立的,故 A 的最大線性獨立列向量數即為 U 的軸列數。

 
維數

(6) \mathrm{rank}AA 的行空間的維數,記為 \mathrm{dim}C(A)

(7) \mathrm{rank}AA 的列空間的維數,記為 \mathrm{dim}C(A^T)

從 (4) 得知 A 的行空間的一組基底為

\left\{\begin{bmatrix}  1\\4  \end{bmatrix},\begin{bmatrix}  0\\3  \end{bmatrix}\right\}

又從 (5),A 的列空間的一組基底為

\left\{\begin{bmatrix}  1&0&1  \end{bmatrix},\begin{bmatrix}  0&3&3  \end{bmatrix}\right\}

行 (列) 空間的維數等於行 (列) 空間的基底所包含的線性獨立向量個數,陳述 (6) 和 (7) 分別等同於陳述 (4) 和 (5)。

 
秩—零度定理

(8) \mathrm{rank}A=\mathrm{dim}C(A^T)=n-\mathrm{dim}N(A)

(9) \mathrm{rank}A=\mathrm{dim}C(A)=m-\mathrm{dim}N(A^T)

這兩條等式特別之處是它給出了列空間的維數 \mathrm{dim}C(A^T) 與零空間 (nullspace) 的維數 \mathrm{dim}N(A) 的關係,以及行空間的維數 \mathrm{dim}C(A) 與左零空間的維數 \mathrm{dim}N(A^T) 的關係。要深入了解這個主題,請閱讀“線性代數基本定理 (一)”和“行秩=列秩”。上例,矩陣 A 的零空間由 \begin{bmatrix}  -1&-1&1  \end{bmatrix} 所擴張,故 \mathrm{dim}N(A)=1,因此 \mathrm{rank}A=3-1=2。因為 A 有兩個線性獨立的行,A^T 的零空間僅包含零向量,\mathrm{dim}N(A^T)=0,由第二個等式得知 \mathrm{rank}A=2-0=2

 
奇異值分解

(10) \mathrm{rank}AA 的非零奇異值 (singular value) 數。

矩陣 A 的奇異值即為 A^TAAA^T 的特徵值之平方根。算出

AA^T=\begin{bmatrix}  2&11\\  11&74  \end{bmatrix}

其特徵多項式為

\mathrm{det}(AA^T-\lambda I)=\lambda^2-76\lambda+27

解出 AA^T 的兩個特徵值,38\pm\sqrt{1417},因此 A 有兩個非零奇異值。除了 (10) 屬於進階內容 (見“奇異值分解 (SVD)”),其他都是你不能不知道的矩陣秩。

 
註解
[1] 在台灣,橫向稱為列,縱向稱為行。在中國大陸,橫向稱為行,縱向稱為列。

廣告
本篇發表於 線性代數專欄, 向量空間 並標籤為 , , , , 。將永久鏈結加入書籤。

2 Responses to 你不能不知道的矩陣秩

  1. Ajex 說道:

    最後特徵多項式少了一個 Lambda,應為
    \mathrm{det}(AA^T-\lambda I)=\lambda^2-\lambda*76+27
    title="\mathrm{det}(AA^T-\ambda I)=\lambda^2-76+27$

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s