本文的閱讀等級:高級
在一些涉及資料壓縮、特徵抽取或雜音消除的分析應用中,我們常希望得到一個矩陣的最佳近似矩陣,並透過設定矩陣的秩來控制近似誤差,這個問題稱為矩陣近似。詳細的問題陳述如下:若 為一個
階實矩陣,求同尺寸矩陣
使最小化
,並滿足
且
。奇異值分解 (singular value decomposition) 提供了最佳矩陣近似的答案,由於具備這個特性再加上優異的數值穩定性,奇異值分解已逐漸成為應用最廣泛的矩陣計算法之一。
矩陣的大小度量稱為矩陣範數 (norm),目前存在兩種常用的定義 (見“矩陣範數”)。第一個是由幾何向量長度推廣而得的 Frobenius 範數,定義為矩陣各元平方和的開方,計算如下:
。
另一個是從線性變換 對向量
的長度改變誘生的比值定義,稱為2-範數 (2-norm,參閱“Hermitian 矩陣特徵值的變化界定”):
,
其中 表示
的最大奇異值。矩陣
的奇異值平方即為
和
的特徵值 (見“奇異值分解(SVD)”),而矩陣譜為特徵值所成的集合,所以有些人稱此定義為「譜範數」(spectral norm);又因為定義中的向量長度計算採用歐幾里得公式,所以也有人稱之為2-範數,並以
表示。不論你採用
或
,最佳近似矩陣解都由
的奇異值分解決定。
設 的奇異值分解為
,
其中 和
分別為
和
階正交矩陣,
,
,
為
階奇異值矩陣,
,其中
,
,因此得知
。最佳矩陣近似問題要解出
,且
。
首先我們要知道正交變換 (即正交矩陣乘法) 不改變 Frobenius 範數,因為
,
,
上式中 是任意可相乘的正交矩陣。利用矩陣範數具有正交變換不變性,可得到 Frobenius 範數的奇異值表達式:
。
從奇異值表達式可以清楚說明 Frobenius 範數與2-範數的差異。
將目標函數以 Frobenius 範數計算並改寫為
。
Frobenius 範數由各元平方和計算而得,既然 是對角矩陣,
也應為對角矩陣方能最小化 Frobenius 範數,亦即
,
其中 。因此,
。
原問題等價於
。
當 ,
恰有
個不為零的主對角元。因為
按遞減排序,滿足誤差最小化的矩陣
其各元必定是
,
,且
,
。換句話說,最佳近似矩陣
保留最大的
個奇異值,並以零取代最小的
個奇異值。
同樣地,正交矩陣乘法也不改變2-範數。若 ,
,
,
上式中我們令 。正交變換不改變向量長度,因為
。
採用2-範數的最佳矩陣近似解需要引用下面這個性質:設 和
為
階矩陣,奇異值分解為
,
,奇異值矩陣
,
的主對角元皆按遞減排序,則
。此定理的證明過程相當冗長繁複,故在此省略。假設
,其中
,
,也就有
。
不難驗證等號發生於 ,
,
,
。這證明2-範數與 Frobenius 範數具有相同的最佳近似矩陣
,最小誤差分別為
,
。
參考來源:
Roger A. Horn 和 Charles R. Johnson 合著的 Matrix Analysis, 1985.
看完老師的解釋,再看關聯的文章
Click to access svd.pdf
瞬間感覺,矩陣的近似,本質上也是類似正交投影
正交的基底是u(i)v(j)’,奇異值就是投影量