本文的閱讀等級:初級
提及矩陣,我們經常以其外表尺寸描述它,例如, 是一個
階矩陣表示
有四個列 (row) 和五個行 (column)[1],總計包含
個元 (entry)。如果矩陣的用途只是像電腦程式裡的陣列或數組 (array) 用來儲存物件,那麼表明幾何尺寸便足以規範其體量。在線性代數中,矩陣不僅是儲存體,它是向量空間之間的線性變換的表達方式。自然地,我們想知道矩陣所代表的線性變換攜帶了多少訊息?淺白一點的說法是矩陣的真實「尺寸」為何?它與線性代數裡的空間概念又有何關聯?
看下面這個 階矩陣,試想此矩陣包含多少訊息?
讀者可能回答:這個矩陣包含 個單位的訊息。你之所以如此認定的原因是它有相同的三個列
,那麼此矩陣的四個行也只包含了一個單位的訊息嗎?觀察發現第
行的所有元為零故不起作用,第
行與第
行是第
行的倍數。另外,第
行也可以表示成第
行與第
行之和,因此確實只有一個真正有價值的訊息。
事情到此應該已經十分明朗,矩陣所攜帶的訊息亦即其真實尺寸,就是最小的行 (列) 向量集合──經過線性組合足以衍生出所有的行 (列)──所包含的向量數;較為直接的說法是,最大的線性獨立行 (列) 向量集合所包含的向量數。這個度量值的正式名稱叫做矩陣秩 (rank),或簡稱為秩,記作 。下面我整理了與梯形矩陣 (echelon form)、線性獨立、維數、秩—零度定理 (rank-nullity theorem),以及奇異值分解有關的十條矩陣秩的等價界定。
設 為一個
階矩陣,
為列運算化簡
後得到的列等價梯形矩陣。底下用一個例子將各個性質串接起來,你可以藉此相互參照比較。考慮
,
使用高斯消去法將 化簡為梯形矩陣
。
梯形矩陣
(1) 是
所含的軸 (pivot) 數。
這個性質等於告訴我們如何計算矩陣秩,詳細討論請見“利用行列式計算矩陣秩”。上例中,矩陣 包含兩個軸,軸是各列的非零領先元,即
,
,故
。
(2) 是
的軸行 (pivot column) 數。
(3) 是
的軸列 (pivot row) 數。
包含軸的行稱為軸行, 有兩個軸行
和
;包含軸的列稱為軸列,
有兩個軸列
和
。 明顯地,每一個軸對應唯一一個軸行與軸列,故軸數等於軸行數也等於軸列數。換句話說,一個矩陣的行秩等於列秩。
線性獨立
(4) 是
的最大線性獨立行向量數。
梯形矩陣 的第
,
行為軸行,因此
的對應行
和
是線性獨立的 (見“由簡約列梯形式判斷行空間基底”)。請注意,最大的線性獨立的行向量集合未必是唯一的,但其中所含的向量數 (即矩陣秩) 卻是唯一的,此例中任選
的兩個行向量都可以形成最大的線性獨立行向量集合。
(5) 是
的最大線性獨立列向量數。
因為基本列運算可能變換列位置,我們不可直接從 對應
的軸列挑選線性獨立列集合,而要根據梯形矩陣
加以判斷。基本列運算是列的線性組合,且
的軸列是線性獨立的,故
的最大線性獨立列向量數即為
的軸列數。
維數
(6) 是
的行空間的維數,記為
。
(7) 是
的列空間的維數,記為
。
從 (4) 得知 的行空間的一組基底為
,
又從 (5), 的列空間的一組基底為
。
行 (列) 空間的維數等於行 (列) 空間的基底所包含的線性獨立向量個數,陳述 (6) 和 (7) 分別等同於陳述 (4) 和 (5)。
秩—零度定理
(8)
(9)
這兩條等式特別之處是它給出了列空間的維數 與零空間 (nullspace) 的維數
的關係,以及行空間的維數
與左零空間的維數
的關係。要深入了解這個主題,請閱讀“線性代數基本定理 (一)”和“行秩=列秩”。上例,矩陣
的零空間由
所擴張,故
,因此
。因為
有兩個線性獨立的行,
的零空間僅包含零向量,
,由第二個等式得知
。
奇異值分解
(10) 是
的非零奇異值 (singular value) 數。
矩陣 的奇異值即為
或
的特徵值之平方根。算出
,
其特徵多項式為
。
解出 的兩個特徵值,
,因此
有兩個非零奇異值。除了 (10) 屬於進階內容 (見“奇異值分解 (SVD)”),其他都是你不能不知道的矩陣秩。
註解
[1] 在台灣,橫向稱為列,縱向稱為行。在中國大陸,橫向稱為行,縱向稱為列。
最後特徵多項式少了一個 Lambda,應為

title=”\mathrm{det}(AA^T-\ambda I)=\lambda^2-76+27$
謝謝,已訂正。