本文的閱讀等級:中級
令 為一個
階實矩陣。我們用
代表
的行空間 (值域,column space),即
。請注意,
是
的一個子空間。對於任一
,線性方程
必定有解。在解集合中,有一個解最為特別,該特解位於
的列空間 (row space),即
的行空間
,並具有最小的2-範數 (歐氏範數,見“向量範數”),稱為極小範數解 (minimum norm solution),記為
。這篇短文介紹極小範數解的性質與表達式。
定理一:若 ,則存在唯一的
使得
。
設 使得
。在
中,矩陣
的列空間
是零空間 (nullspace)
的正交補餘 (orthogonal complement,見“線性代數基本定理 (二)”),特解
可唯一分解為
,其中
且
。證明於下:將分解式代入線性方程,
,
可知 也是一個特解。接著證明唯一性,假設
使得
且
。令兩式相減,可得
,說明
。然而,
和
的任意線性組合必仍在列空間內,
。合併以上結果,
,推得
。
定理二:若 且
具有最小2-範數,則
。
定理一表明任一特解皆可表示為 ,其中
,
,且
唯一存在。因為
,畢氏定理說
,不等式的等號發生於
,故得證。
根據定理一與定理二,對於每一 ,我們定義極小範數解為
使得
。接下來討論極小範數解
的表達式。
定理三:若 ,即
有線性獨立的列,則
必然有解,且極小範數解為
。
若 ,則
,行空間
充滿
,這意味任一
皆使
有解。下面解說兩個推導極小範數解的方法。第一個方法採用向量空間分析。因為
有線性獨立的列,極小範數解
可唯一表示為
的列向量的線性組合,即存在唯一的
使得
。將上式代入
,就有
。因為
(見“利用 Gramian 矩陣證明行秩等於列秩”),推論
階 Gramian 矩陣
是可逆的,故
,即得
。
第二個方法運用約束優化 (constrained optimization) 技巧。考慮這個問題
請注意,最小化 等價於最小化
。使用 Lagrange 乘數法 (見“Lagrange 乘數法”),寫出 Lagrangian 函數
,
其中 是
維 Lagrange 乘數向量。計算偏導數 (見“矩陣導數”,SV-9,SV-11),
令上面兩式為零得到最佳條件式。將 代入
,可得
,解出
,因此
。
在數值計算時,我們可以採用 QR 分解 (見“線代膠囊──QR 分解”)。設 ,其中
是
階矩陣滿足
,
是
階上三角矩陣。因此,
所求的最佳值為
若 有線性相關的列,即
,這時
是不可逆的,定理三給出的表達式不成立。對於
,線性方程
仍存在極小範數解
,其中
稱為
的 Moore-Penrose 偽逆矩陣 (pseudoinverse)。欲深入了解這個主題的讀者,請參閱
“偽逆矩陣與轉置矩陣的二三事” (見Q7) 和“Moore-Penrose 偽逆矩陣”。
老师您好,请问A^T是不是A的转置?我看有的文章上说是共轭转置,还有的是说共轭算子,这很让我困惑。这究竟是怎么回事呢?Hermitian adjoint operator应该如何求呢?能否给些启发,或是相关资料的链接,谢谢您
在多數文獻中,
或
表示轉置,而
或
表示共軛轉置。請參考下文:
https://ccjou.wordpress.com/2013/02/27/%E8%BD%89%E7%BD%AE%E8%88%87%E5%85%B1%E8%BB%9B%E8%BD%89%E7%BD%AE/
adjoint 的詳細討論請見下文:
https://ccjou.wordpress.com/2011/06/27/%E7%B7%9A%E6%80%A7%E6%B3%9B%E5%87%BD%E8%88%87%E4%BC%B4%E9%9A%A8/
周老師你好,
幾個問題請教,
1.這個極小範數解會是特解 X 在列空間的正交投影向量嗎?
2. 定理三中若A沒有full row rank 的話要怎麼解呢?
3. 若是在求 Ax=b 且 b不在C(A)中的minimum 2-norm least square approximation,是要先把b做
正交投影到C(A) (令這向量為c ) 然後再解Ax=c的minimum 2-norm solution嗎?
1) 是的,如定理一所述,任一特解可唯一分解為
,其中
且
。但
,正交補集之意,故
即是
至列空間
的正交投影。
3) 是的,詳細請參閱
https://ccjou.wordpress.com/2009/06/10/%E9%80%9A%E9%81%8E%E6%8E%A8%E5%B0%8E%E5%81%BD%E9%80%86%E7%9F%A9%E9%99%A3%E8%AA%8D%E8%AD%98%E7%B7%9A%E6%80%A7%E4%BB%A3%E6%95%B8%E7%9A%84%E6%B7%B1%E5%B1%A4%E7%B5%90%E6%A7%8B/
老師你好,
我已經閱讀完並大致了解pseudoinverse了 ,但這要先求A的SVD,然後再做矩陣的相乘 才能求得minimal solution,計算量也蠻大的。
為甚麼不直接找row space 的一組orthonormal basis 然後再算特解X在 A之row space上的正交投影向量 就可以求得minimum norm least square solution ,這樣計算量感覺比較不那麼複雜?
謝謝了!
SVD是穩定的數值算法,手算自然複雜。求極小範數解有很多方法,請參見下文:
https://ccjou.wordpress.com/2014/06/23/%E6%AF%8F%E9%80%B1%E5%95%8F%E9%A1%8C-june-23-2014/
老師請問你 定理二的最後一句話等號發生在z=0故得證是什麼意思 謝謝
剛剛沒看完 , 第二個問題我會去參考pseudoinverse的資料
謝謝!
正文第二行开始的地方,
应该是
?
這裡
是一個
階矩陣,
必須是
維向量 (即
階矩陣) 才能算得
。因此,
,而
,故
是
的一個子空間。你可以將
視為一個從
映至
的線性映射。
你好,我在用Lagrange 乘数求解一个类似的问题,约束条件也是一个方程组 AX = b, 我的目标是最大化解的信息熵。但最后会有无穷多解,请问为什么会出现这样的情况?
老師請問你 定理二的最後一句話等號發生在z=0故得證是什麼意思 謝謝