本文的閱讀等級:中級
LU 分解是高斯消去法的一種表達形式 (見“LU 分解”),QR 分解記錄 Gram-Schmidt 正交化的結果 (見“Gram-Schmidt 正交化與 QR 分解”)。那麼奇異值分解的根基又是甚麼?答案並非一個演算法,而是一個性質:Gramian 矩陣的譜分解 (spectral decomposition)。矩陣的特徵值也稱為譜,所謂譜分解就是將特徵值分解出來。設 為一
階矩陣,我們稱
階
和
階
為 Gramian 矩陣。不難確認
和
皆為 Hermitian 半正定矩陣 (見“特殊矩陣 (14):Gramian 矩陣”)。Hermitian 矩陣的譜分解稱作么正對角化 (unitary diagonalization):任一
階 Hermitian 矩陣
可表示為
,其中
是么正矩陣,
,且
是實矩陣,
是
的特徵值 (見“特殊矩陣 (9):Hermitian 矩陣”)。本文運用基礎矩陣代數從
的譜分解推導
的奇異值分解[1] (採行
的推導方式亦類似),這個過程能夠幫助我們對奇異值分解的構造矩陣有更深刻的理解。
由於 是半正定矩陣,其特徵值不為負值,可令
為
的特徵值。假設
,且
,稱為
的奇異值。稍後我們將證明
。因為
和
有相同的非零特徵值 (見“AB 和 BA 有何關係?”),故
的非零特徵值亦為
。根據 Hermitian 矩陣的譜分解,存在一
階么正矩陣
使得
,
或表示為
,
其中 。為便利分塊矩陣運算,設
,其中
是
階,
是
階。代入上式,乘開可得
。
比較最後一個等式的主對角分塊,即得 ,
。使用矩陣秩性質
(見“利用 Gramian 矩陣證明行秩等於列秩”),立知
。因為
是么正矩陣,
,
就有 ,
,
且
。。另一方面,
。
接下來的工作是將 從關鍵式
分離開來。定義
階矩陣
。
因此,
式 稱為瘦奇異值分解 (見“奇異值分解 (SVD)”)。注意,
的
個行向量組成單範正交集 (orthonormal set),驗證於下:
為了得到標準奇異值分解,選擇 階矩陣
使得
為一么正矩陣,也就有
。令
階矩陣
,
其中底列由左至右分別是 階和
階零矩陣。套用瘦奇異值分解,
此即奇異值分解。
最後我們討論奇異值分解的一些性質:
,
,也就是說,
,
[2]。
瘦奇異值分解
,右乘
即得
。第二式
先前已經證明過。因為
有線性獨立的行向量且
是可逆矩陣,推知
。
,
,也就是說,
,
。
使用瘦奇異值分解,可得
和
。
,
,也就是說,
的特徵向量為
的行向量,對應特徵值
,以及
個零。
使用瘦奇異值分解和 (1),
且
。
,
,也就是說,
的特徵向量為
的行向量,對應特徵值
,以及
個零。
使用瘦奇異值分解和 (2),
且
。
註解與來源:
[1] 維基百科:Singular value decomposition
[2] 表示
的行空間 (column space),
表示
的零空間 (nullspace)。