網友Yanjun Li留言:
近期拜讀了周老師寫的變異數矩陣,主成份分析,奇異值分解等專題,感覺對線性代數的一些知識有了重新認識。在閱讀過程中,產生了一些疑問,請周老師不吝賜教:
是兩兩互不相關的變量,另有 和 兩個變量,是 的線性組合:
- 如果 中的某一個係數明顯比其餘每一個係數大很多,同時 中的某一個係數明顯比其餘每一個係數大很多,並且兩組係數中,最大的 和 滿足 不等於 。當滿足上述條件時,是否可以認為, 和 的相關程度很低?
- 如果 中的某一個係數大於其餘每一個係數,同時 中的某一個係數大於其餘每一個係數,並且兩組係數中,最大的 和 滿足 不等於 。當滿足上述條件時,是否可以認為, 和 的相關程度不高?
- 與 之間的共變異數,是否可以用 和 ,以及 的變異數,計算出來?
感謝周老師在百忙之中閱讀我的問題!
答曰:
先考慮問題3。給定 和 ,如何計算 和 的共變異數 ?為便利推導,令 和 ,並令 。因此, 且 。使用恆等式 ,以及期望值 為線性算子,可得
其中 是變量 的 階共變異數矩陣, 元為 。因為 是兩兩互不相關的變量,即 ,,推知 是對角矩陣。令 ,其中 是 的變異數。據此, 的計算公式為
。
直白地說, 由 的變異數 構造而成,組合權重為 ,。
我們經常使用相關係數 (correlation coefficient) 來度量 和 的線性相關性 (見“共變異數矩陣的性質”):
,
其中 和 分別是 和 的變異數。套用 的算式,
使用以上結果,
。
請注意 。若 ,則 與 的相關性很小。如果排除變異數 此因素,假設 ,相關係數可簡化為
。
令 表示 維實向量 與 的夾角。根據內積定義,,推得 。對於問題1,假設 ,,以及 ,,且 。在此情況下, (即 空間中第 軸與第 軸的夾角),故 。問題2的條件無法確定夾角 的大小,譬如,即便 與 分別為最大元,但若 與 的所有元的數值皆相近,則 ,即有 。
後記:
重讀此文後我想起一個機率學課本的問題:若 與 是不相關的兩個隨機變數並有相同的變異數 ,則 與 的相關係數近似 。延用上文定義的符號,設 且 ,則 。利用簡化後的相關係數表達式,
。
上式的幾何解釋是向量 和 的夾角為 ,故 。類似地,因為 和 垂直, 與 的相關係數為零。