本文的閱讀等級:初級
令 為一個隨機向量,其中 是隨機變數。共變異數矩陣 (covariance matrix) 定義如下:
,
其中 是期望值算子,。根據定義, 為 階矩陣,具有下列形式:
共變異數矩陣 的 元是 和 的共變異數 (covariance,或稱協方差) 。因為 ,共變異數矩陣的主對角元即為隨機變數 的變異數 (variance)。本文介紹共變異數矩陣的一些基本性質。
計算公式
對於隨機向量 ,共變異數矩陣可由下列公式算得:
。
使用定義,,以及 為線性算子,可得
若隨機向量 退化為隨機變數 ,則 ,此即我們熟悉的變異數公式。
常數向量加法
對於 維隨機向量 和常數向量 ,
。
使用期望算子性質 ,
常數矩陣乘法
對於 維隨機向量 和 階常數矩陣 ,
。
使用期望算子性質 ,
仿射變換
對於 維隨機向量 ,常數向量 和 階常數矩陣 ,合併前面兩個性質,可得仿射變換 (見“仿射變換”) 的共變異數矩陣
。
對稱
共變異數矩陣 是一個對稱矩陣,證明於下:
半正定
共變異數矩陣 是半正定的 (見“半正定矩陣的判別方法”),也就是說,對於任一 ,
。
將 視為 階矩陣,套用常數矩陣乘法性質,
,
不等式成立係因任何隨機變數 (或隨機變數的組合) 的變異數必不為負值。
這裡補充說明 的變異數計算方式。若 ,則
所以, 等價於 。若任意 滿足 ,則 。但請特別注意反向推論不成立,譬如,
,
其中 。
相關係數
我們定義隨機變數 和 的相關係數 (correlation coefficient) 為
,
其中 和 分別是 和 的標準差 (standard deviation)。因為 ,相關係數具有對稱性:。半正定矩陣的任一主子陣都是半正定 (見“半正定矩陣的判別方法”),即知
是一個半正定矩陣。因此,
,
推論 。相關係數的詳細討論請見“相關係數”。
線性組合的共變異數
考慮隨機變數 的兩個線性組合 和 ,隨機變數 和 的共變異數可表示為雙線性形式 (bilinear form)
。
證明於下:使用恆等式 ,
最後舉一例說明共變異數矩陣的應用 (取自“Math Pro: 2014年台中二中教師甄選試題”):某次數學測驗,總分100分,其中選擇題占60分,計算題占40分。甲班學生選擇題的平均分數為52分、標準差為8分,計算題的平均分數為18分、標準差為15分。若該班選擇題成績與計算題成績的相關係數為 ,則甲班學生數學測驗成績的標準差是多少?
令 為數學測驗成績,其中 代表選擇題成績, 代表計算題成績。從給定條件可知 ,隨機向量 的共變異數矩陣則為
。
套用線性組合的共變異數公式,
,
故數學測驗成績的標準差為 。另外,我們還可以回答:選擇題成績還是計算題成績與數學測驗成績的相關性較高?數學成績與選擇題成績的共變異數為
,
相關係數為
。
數學成績與計算題成績的共變異數為
,
相關係數為
。
結論:計算題雖然僅占40分,但因其標準差15分遠大於選擇題成績的標準差8分,使得數學測驗成績與計算題成績比選擇題成績有較高的相關性。
平均數用不到是不是?那題目給平均數做啥
順便跟老師請教一下,變異數是恆正嗎?它和共變異數不是有差?是當共變異數相等時才能換嗎?想釐清觀念一下
平均數用不到是不是?那題目給平均數做啥–>我也不知道
變異數是恆正嗎?–>
它和共變異數不是有差?–>不了解你的問題
是當共變異數相等時才能換嗎?–>還是不懂你的問題
I seek not to know the answers, but to understand the questions. 果真不假
我的意思是共變異數和變異數相等時是什麼情況?
上文相關係數一節,共變異矩陣是半正定,可推論 。若 ,則 。又如果 ,則相關係數等於1,表示 。
Pingback: 維度縮減Dimension Reduction,通往線性代數的聖母峰 : 特徵值分解(Eigenvalue Decomposition)、奇異值分解(Singular Value Decomposition) 與主成分分析(Principal Component Analysis) – 服務科學的分子廚房 Molecular Ser
如果X隨機向量為複數型,那在計算共變數時,要把轉至改成轉置共扼嗎