本文的閱讀等級:中級
令 為一個 階實矩陣, 為 維實向量,具有以下形式的實函數稱為二次型 (quadratic form):
。
請注意,二次型 是一個純量。任意二次型 都可以轉換為等價的 ,其中 是一個實對稱矩陣。利用一點運算技巧改寫矩陣乘法公式可得
矩陣 與 有相等的二次型,不難驗證 是對稱的。例如,
。
正定矩陣的概念建立於二次型之上。若 是一個實對稱矩陣且任一 滿足 ,我們稱 是正定的,詳見“特殊矩陣 (6):正定矩陣”。因此僅討論具對稱性的二次型已足夠應付一般的問題,這與我們習慣將對稱性納入正定的定義其道理是相同的。
特徵值與特徵向量是線性代數裡分析矩陣結構與線性變換最重要的概念,二次型的最大化 (或最小化) 問題是特徵值和特徵向量的一個典型應用。設 是實對稱矩陣,考慮此問題:
最大化 , 滿足 。
求解這個約束最佳化 (constrained optimization) 問題的傳統方法是引入 Lagrangian 函數 (見“Lagrange 乘數法”):
。
產生極值的必要條件是 對 的各元的一次偏導數都等於零,亦即 是 的一個駐點 (參見“最佳化理論與正定矩陣”)。因為 ,請讀者自行計算驗證
。
單位向量 (unit vector) 要使 最大化的必要條件即為特徵方程式 ,將此式代入二次型可得
。
實對稱矩陣的特徵值必為實數,因此使二次型最大化的向量 正是對應最大特徵值的特徵向量。
另一方面,我們也可以直接利用實對稱矩陣是正交可對角化此性質來分解二次型。設 ,其中 是正交特徵向量矩陣,, 是主對角特徵值矩陣。令 ,二次型可用主對角分解化簡為
。
因為 是正交矩陣, (見“特殊矩陣 (3):么正矩陣(酉矩陣)”),故可推論 的最大值即為 的最大特徵值。
統計學中的主成分分析 (principal components analysis),簡稱 PCA,是二次型最大化的典型應用。設 是由 個隨機變數組成的向量,
。
我們沿用機率學的慣用符號,以大寫英文字母表示隨機變數,請特別注意各符號的意義勿與矩陣混淆。共變異數矩陣 (covariance matrix) 的第 元定義為隨機變數 和 的共變異數或稱協方差:
,
其中 為 的期望值。因此 ,共變異數矩陣是對稱的,可表示為
。
假設每個隨機變數的期望值為零,,共變異數矩陣可化簡為
。
主成分分析的目的在尋找單位向量 使隨機變數向量 於 方向的投影具有最大變異量。因為 的期望值為零, 為常數向量可以提至期望值運算符號之外,就有
,
所以
。
上式指出對於任意非零向量 ,。展開等號右側,
。
推知共變量矩陣 是半正定,故其特徵值皆不為負,對應 最大特徵值的特徵向量指向最大投影變異的方向,見下圖。
中間有段亂碼唷~
也不是亂碼啦,轉換沒成功的樣子~~
對了老師~舊討論區還沒重建好嘛? 想找幾個以前大家討論過的舊文看,都看不到了 >”<
謝謝,確實是轉換出錯。
年後管理員會另尋其他空間恢復討論區。
老師,請教一個問題。
已知A,B,C為半正定(semi positive definite)矩陣,證明: 對任意x,如果二次型x^T(A*B*C)x = 0, 則A*B*C=0.
這題我想很久都找不到思緒,希望老師指點一下。
A,B,C為半正定隱含Hermitian,是吧?
x,A,B,C都是複矩陣?而問題是x^T(A*B*C)x,並非x*(A*B*C)x?
(補充)
喔,我會錯意了,*是乘法運算,不是conjugate transpose?問題是
實對稱矩陣A,B,C>=0 & x^T(ABC)x=0 ===> ABC=0
正如老師理解的一樣,x是向量,*是乘法。一開始沒說清楚不好意思。
好的,我想一想再回覆。
如果A,B,C之中任一矩陣為正定,我找到二種方法可證明ABC=0。但仍無法證明A,B,C皆不可逆(全部都是半正定而非正定)的情況。你確定這個命題是正確的?
老師,題目是這樣的:
已知A,B,C都為半正定(semi positive definite)矩陣,證明: 如果二次型 x^T(ABC)x = 0 對任意向量x都成立, 則ABC=0。這裡ABC是A乘以B乘以C。
好,那就使用continuity argument證明A,B,C皆不可逆的情況,過二天貼上證法。
(已回覆)見
周老师,这个公式第二个转置符号是不是错了?
謝謝,等我休假回來再訂正。