常態分布與二次型

本文的閱讀等級:中級

服從多變量常態分布 (normal distribution) 的隨機向量 (隨機變數組成的向量) \mathbf{x} 的機率密度函數完全由平均數向量 \boldsymbol{\mu}=E[\mathbf{x}] 和共變異數矩陣 \Sigma=\hbox{cov}[\mathbf{x}] 決定,記為 \mathbf{x}\sim\mathcal{N}(\boldsymbol{\mu},\Sigma)。若 \mathbf{z}=(z_1,\ldots,z_p)\sim\mathcal{N}(\mathbf{0},I),我們說隨機向量 \mathbf{z} 服從標準多變量常態分布,其中隨機變數 z_1,\ldots,z_p\sim\mathcal{N}(0,1) 相互獨立。本文討論具多變量常態分布的隨機向量所構成的二次型 \mathbf{x}^TA\mathbf{x},其中 A 是實對稱矩陣,並引介一個重要的統計分布──卡方分布 (chi-squared distribution)。本文的預備知識包括 (見“多變量常態分布”):

  • 期望值 E[\cdot] 是線性算子,共變異數矩陣 \Sigma 是半正定 (對稱) 矩陣。
  • 服從常態分布的隨機向量的仿射變換 (affine transformation) 也為常態分布。令 \mathbf{x} 為一 p 維隨機向量,且 \mathbf{x}\sim\mathcal{N}(\boldsymbol{\mu},\Sigma)。若 \mathbf{y}=A\mathbf{x}+\mathbf{b},其中 Am\times p 階常數矩陣,\mathbf{b}m 維常數向量,則 \mathbf{y}\sim\mathcal{N}(A\boldsymbol{\mu}+\mathbf{b},A\Sigma A^T),即 E[\mathbf{y}]=A\boldsymbol{\mu}+\mathbf{b}\hbox{cov}[\mathbf{y}]=A\Sigma A^T
  • \mathbf{x}\mathbf{y} 為兩個隨機向量 (維數可不同),\begin{bmatrix} \mathbf{x}\\ \mathbf{y} \end{bmatrix} 服從常態分布。若交互 (cross) 共變異數矩陣 \hbox{cov}[\mathbf{x},\mathbf{y}]=E\left[(\mathbf{x}-E[\mathbf{x}])(\mathbf{y}-E[\mathbf{y}])^T\right]=0,則 \mathbf{x}\mathbf{y} 是獨立的隨機向量,反之亦然。

 
(1) 卡方分布

z_1,\ldots,z_p\sim\mathcal{N}(0,1)p 個相互獨立的隨機變數,我們說隨機變數 y=z_1^2+\cdots+z_p^2 服從卡方分布,記為 y\sim\chi^2(p),其中 p 稱為自由度 (degrees of freedom)。定理一說明如何從標準多變量常態分布的隨機向量生成卡方分布。

定理一:令 p 維隨機向量 \mathbf{z}\sim\mathcal{N}(\mathbf{0},I)。若 A 為一 p\times p 階實對稱冪等 (idempotent) 矩陣,即 A^T=A=A^2,則

\displaystyle x=\mathbf{z}^TA\mathbf{z}\sim\chi^2(q)

其中 q=\text{trace}A

實對稱冪等矩陣即為實正交投影矩陣 (見“正交投影矩陣的性質與界定”)。實對稱矩陣可正交對角化,也就是說 A 可分解成 A=QDQ^T,其中 Q 是正交矩陣 (orthogonal matrix) 使得 Q^T=Q^{-1}D 是由 A 的特徵值構成的對角矩陣。另外,冪等矩陣的特徵值必為 10 (見“特殊矩陣(5):冪等矩陣”)。在不失一般性的情況下,設 D=\begin{bmatrix} I_q&0\\ 0&0 \end{bmatrix}q\le p。常態分布隨機向量 \mathbf{z} 的線性變換 \mathbf{w}=Q^T\mathbf{z} 也為常態分布。因為 E[\cdot] 是線性算子,

\displaystyle  E[\mathbf{w}]=E[Q^T\mathbf{z}]=Q^TE[\mathbf{z}]=Q^T\mathbf{0}=\mathbf{0}

套用線性變換的共變異數矩陣轉換公式,

\displaystyle \hbox{cov}[\mathbf{w}]=\hbox{cov}[Q^T\mathbf{z}]=Q^T\hbox{cov}[\mathbf{z}](Q^T)^T=Q^TIQ=Q^TQ=I

上面使用了 \hbox{cov}[\mathbf{z}]=I。所以,\mathbf{w}=(w_1,\ldots,w_p)^T\sim\mathcal{N}(\mathbf{0},I),即每一 w_i\sim\mathcal{N}(0,1)。利用以上結果,可得

\displaystyle\begin{aligned} x&=\mathbf{z}^TA\mathbf{z}=\mathbf{z}^TQ\begin{bmatrix} I_q&0\\ 0&0 \end{bmatrix}Q^T\mathbf{z}\\ &=\mathbf{w}^T\begin{bmatrix} I_q&0\\ 0&0 \end{bmatrix}\mathbf{w}=\sum_{i=1}^qw_i^2, \end{aligned}

也就證明 x\sim\chi^2(q)。再使用跡數的循環不變性,

\displaystyle \text{trace}A=\text{trace}(QDQ^T)=\text{trace}(DQ^TQ)=\text{trace}D=q

 
A=I (單位矩陣 I 是實對稱冪等矩陣),定理一給出 \mathbf{z}^T\mathbf{z}\sim\chi^2(p),此即卡方分布的定義。考慮 p 維隨機向量 \mathbf{x}\sim\mathcal{N}(\mathbf{0},\sigma^2 I)。令 \mathbf{z}=\mathbf{x}/\sigma。不難證明 \mathbf{z}\sim\mathcal{N}(\mathbf{0},I),於是得到定理一的必然結果:若 A 為一實對稱冪等矩陣,則

\displaystyle \frac{\mathbf{x}^TA\mathbf{x}}{\sigma^2}\sim\chi^2(q)

其中 q=\text{trace}A。定理二是定理一的推廣。

 
定理二:令 p 維隨機向量 \mathbf{x}\sim\mathcal{N}(\boldsymbol{\mu},\Sigma)。若 \Sigma 為可逆矩陣,則

\displaystyle w=(\mathbf{x}-\boldsymbol{\mu})^T\Sigma^{-1}(\mathbf{x}-\boldsymbol{\mu})\sim\chi^2(p)

如果我們能證明 w=\mathbf{z}^T\mathbf{z},其中 \mathbf{z}\sim\mathcal{N}(\mathbf{0},I),即得 w\sim\chi^2(p)。可逆共變異數矩陣 \Sigma 是正定矩陣,特徵值 \lambda_1,\ldots,\lambda_p 皆為正數 (見“共變異數矩陣的性質”)。寫出正交對角化形式 \Sigma=Q\Lambda Q^T,其中 Q 是正交矩陣,\Lambda=\text{diag}(\lambda_1,\ldots,\lambda_p)。我們定義 \sqrt{\Lambda}=\text{diag}(\sqrt{\lambda_1},\ldots,\sqrt{\lambda_p})。使用 Q^T=Q^{-1},推得

\displaystyle\begin{aligned} \Sigma^{-1}&=(Q^T\Lambda Q)^{-1}=Q^T\Lambda^{-1}Q\\ &=Q^T(\sqrt{\Lambda}QQ^T\sqrt{\Lambda})^{-1}Q\\ &=Q^T\sqrt{\Lambda}^{-1}QQ^T\sqrt{\Lambda}^{-1}Q=B^TB, \end{aligned}

上面令 B=Q^T\sqrt{\Lambda}^{-1}Q,明顯地,B 是實對稱矩陣。令 \mathbf{z}=B(\mathbf{x}-\boldsymbol{\mu})。因此,w=(\mathbf{x}-\boldsymbol{\mu})^T\Sigma^{-1}(\mathbf{x}-\boldsymbol{\mu})=(\mathbf{x}-\boldsymbol{\mu})^TB^TB(\mathbf{x}-\boldsymbol{\mu})=\mathbf{z}^T\mathbf{z}。我們知道 \mathbf{x}\sim\mathcal{N}(\boldsymbol{\mu},\Sigma) 的仿射變換 \mathbf{z}=B\mathbf{x}-B\boldsymbol{\mu} 亦為常態分布,期望值和共變異數矩陣分別為

\displaystyle E[\mathbf{z}]=E\left[B(\mathbf{x}-\boldsymbol{\mu})\right]=B\left(E[\mathbf{x}]-\boldsymbol{\mu}\right)=\mathbf{0}

\displaystyle\begin{aligned} \hbox{cov}[\mathbf{z}]&=\hbox{cov}[B\mathbf{x}-B\boldsymbol{\mu}]=B\hbox{cov}[\mathbf{x}]B^T\\ &=B\Sigma B^T=B(B^TB)^{-1}B^T\\ &=BB^{-1}(B^T)^{-1}B^T=I, \end{aligned}

\mathbf{z}\sim\mathcal{N}(\mathbf{0},I),證畢。

 
(2) 線性變換的獨立性

定理三:令 p 維隨機向量 \mathbf{z}\sim\mathcal{N}(\mathbf{0},I)。令 ABm\times p 階矩陣。若 AB^T=0,則 \mathbf{x}=A\mathbf{z}\mathbf{y}=B\mathbf{z} 是獨立的隨機向量,反之亦然。

隨機向量 \mathbf{x}=A\mathbf{z}\mathbf{y}=B\mathbf{z} 是標準常態分布隨機向量 \mathbf{z} 的線性變換,故 \mathbf{x}\mathbf{y} 也服從常態分布。計算 \mathbf{x}\mathbf{y} 的交互共變異數矩陣:

\displaystyle\begin{aligned} \hbox{cov}[\mathbf{x},\mathbf{y}]&=E\left[(\mathbf{x}-E[\mathbf{x}])(\mathbf{y}-E[\mathbf{y}])^T\right]\\ &=E\left[(A\mathbf{z}-E[A\mathbf{z}])(B\mathbf{z}-E[B\mathbf{z}])^T\right]\\ &=AE\left[(\mathbf{z}-E[\mathbf{z}])(\mathbf{z}-E[\mathbf{z}])^T\right]B^T\\ &=A\hbox{cov}[\mathbf{z}]B^T\\ &=AB^T. \end{aligned}

然而,\hbox{cov}[\mathbf{x},\mathbf{y}]=0 等價於 \mathbf{x}\mathbf{y} 是獨立的隨機變數,即證明 AB^T=0 若且惟若 \mathbf{x}\mathbf{y} 是獨立的隨機向量。

 
(3) 線性變換與二次型的獨立性

定理四:令 p 維隨機向量 \mathbf{z}\sim\mathcal{N}(\mathbf{0},I)。令 Am\times p 階矩陣,Bp\times p 階實對稱冪等矩陣。若 AB=0,則隨機向量 \mathbf{x}=A\mathbf{z} 和隨機變數 y=\mathbf{z}^TB\mathbf{z} 是獨立的,反之亦然。

因為 B^T=B=B^2,可得

\displaystyle\begin{aligned} y&=\mathbf{z}^TB\mathbf{z}=\mathbf{z}^TB^2\mathbf{z}\\ &=\mathbf{z}^TB^TB\mathbf{z}=(B\mathbf{z})^T(B\mathbf{z}).\end{aligned}

A\mathbf{z}B\mathbf{z} 是獨立的隨機向量,則 \mathbf{x}=A\mathbf{z}y=(B\mathbf{z})^T(B\mathbf{z}) 是獨立的隨機向量 (變數),反之亦然。使用定理三,AB^T=0A\mathbf{z}B\mathbf{z} 是獨立的隨機向量的充分與必要條件。但 B 是對稱矩陣,故得證。

 
(4) 二次型的獨立性

定理一表明 x=\mathbf{z}^TA\mathbf{z}y=\mathbf{z}^TB\mathbf{z} 服從卡方分布,定理五給出獨立卡方分布隨機變數的充分與必要條件。

定理五:令 p 維隨機向量 \mathbf{z}\sim\mathcal{N}(\mathbf{0},I)。令 ABp\times p 階實對稱冪等矩陣。若 AB=0,則 x=\mathbf{z}^TA\mathbf{z}y=\mathbf{z}^TB\mathbf{z} 為服從卡方分布的獨立隨機變數,反之亦然。

如定理四的證明,寫出 x=(A\mathbf{z})^T(A\mathbf{z})y=(B\mathbf{z})^T(B\mathbf{z})。明顯地,若 A\mathbf{z}B\mathbf{z} 是獨立的隨機向量,則 xy 是獨立的隨機變數,反向論述亦為真。根據定理三,AB^T=0A\mathbf{z}B\mathbf{z} 是獨立的隨機向量的充分與必要條件。但 B 是對稱矩陣,因此得證。

 
如果將定理五的冪等矩陣條件去除,定理六說明具有獨立性的二次型 (隨機變數) 的充分與必要條件。

定理六:令 p 維隨機向量 \mathbf{z}\sim\mathcal{N}(\mathbf{0},I)。令 ABp\times p 階實對稱矩陣。若 AB=0,則 x=\mathbf{z}^TA\mathbf{z}y=\mathbf{z}^TB\mathbf{z} 是獨立的隨機變數,反之亦然。

二次型的獨立性的必要條件推導相當困難,在此省略,底下證明充分條件。假設 AB=0,則 BA=B^TA^T=(AB)^T=0,故 AB=BA=0AB 是可交換矩陣。可交換對稱矩陣可同時正交對角化,意思是存在一正交矩陣 Q 使得 C=Q^TAQD=Q^TBQ 為對角矩陣 (見“同時可對角化矩陣”)。但 DC=CD=Q^TAQQ^TBQ=Q^TABQ=Q^T0Q=0,由此推斷 C=\begin{bmatrix} C_1&0\\ 0&0 \end{bmatrix}D=\begin{bmatrix} 0&0\\ 0&D_2 \end{bmatrix},其中 C_1q\times q 階對角矩陣,D_2(p-q)\times(p-q) 階對角矩陣。令 \mathbf{w}=\begin{bmatrix} \mathbf{w}_1\\ \mathbf{w}_2 \end{bmatrix}=Q^T\mathbf{z},其中 \mathbf{w}_1q 維隨機向量,\mathbf{w}_2p-q 維隨機向量。使用上面結果,

\displaystyle\begin{aligned} x&=\mathbf{z}^TA\mathbf{z}=\mathbf{z}^TQCQ^T\mathbf{z}=\mathbf{w}^TC\mathbf{w}\\ &=\begin{bmatrix} \mathbf{w}_1^T&\mathbf{w}_2^T \end{bmatrix}\begin{bmatrix} C_1&0\\ 0&0 \end{bmatrix}\begin{bmatrix} \mathbf{w}_1\\ \mathbf{w}_2 \end{bmatrix}=\mathbf{w}_1^TC_1\mathbf{w}_1. \end{aligned}

類似地,

\displaystyle\begin{aligned} y&=\mathbf{z}^TB\mathbf{z}=\mathbf{z}^TQDQ^T\mathbf{z}=\mathbf{w}^TD\mathbf{w}\\ &=\begin{bmatrix} \mathbf{w}_1^T&\mathbf{w}_2^T \end{bmatrix}\begin{bmatrix} 0&0\\ 0&D_2 \end{bmatrix}\begin{bmatrix} \mathbf{w}_1\\ \mathbf{w}_2 \end{bmatrix}=\mathbf{w}_2^TD_2\mathbf{w}_2. \end{aligned}

定理一的證明過程已經確認 \mathbf{w}\sim\mathcal{N}(\mathbf{0},I),因此 \mathbf{w}_1\mathbf{w}_2 是獨立的隨機向量,故可推論 x=\mathbf{w}_1^TC_1\mathbf{w}_1y=\mathbf{w}_2^TD_2\mathbf{w}_2 是獨立的隨機變數。

 
定理七:令 p 維隨機向量 \mathbf{x}\sim\mathcal{N}(\boldsymbol{\mu},\Sigma),其中 \Sigma 是可逆矩陣。令 ABp\times p 階實對稱矩陣。若 A\Sigma B=0,則 u=\mathbf{x}^TA\mathbf{x}v=\mathbf{x}^TB\mathbf{x} 是獨立的隨機變數,反之亦然。

定理七是定理六的推廣,稱為 Craig 定理。仿造定理六的證法可推導出充分條件。因為共變異數矩陣 \Sigma 可逆,即為正定矩陣 (見“共變異數矩陣的性質”),故可分解為 \Sigma=MM^T,其中 M 是可逆矩陣 (見“正定矩陣的性質與判別方法”)。令 G=M^TAMH=M^TBM。假設 A\Sigma B=0,則

\displaystyle GH=M^TAMM^TBM=M^TA\Sigma BM=M^T0M=0

GH 都是對稱矩陣,就有 HG=H^TG^T=(GH)^T=0。可交換對稱矩陣 GH 可同時正交對角化為 G=Q\begin{bmatrix} C_1&0\\ 0&0 \end{bmatrix}Q^TH=Q\begin{bmatrix} 0&0\\ 0&D_2 \end{bmatrix}Q^T,其中 C_1q\times q 階對角矩陣,D_2(p-q)\times(p-q) 階對角矩陣。令 \mathbf{w}=\begin{bmatrix} \mathbf{w}_1\\ \mathbf{w}_2 \end{bmatrix}=Q^TM^{-1}\mathbf{x},其中 \mathbf{w}_1q 維隨機向量,\mathbf{w}_2p-q 維隨機向量。使用上面結果,

\displaystyle\begin{aligned} u&=\mathbf{x}^TA\mathbf{x}=\mathbf{x}^T(M^T)^{-1}GM^{-1}\mathbf{x}\\ &=\mathbf{x}^T(M^{-1})^TQ\begin{bmatrix} C_1&0\\ 0&0 \end{bmatrix}Q^TM^{-1}\mathbf{x}\\ &=\begin{bmatrix} \mathbf{w}_1^T&\mathbf{w}_2^T \end{bmatrix}\begin{bmatrix} C_1&0\\ 0&0 \end{bmatrix}\begin{bmatrix} \mathbf{w}_1\\ \mathbf{w}_2 \end{bmatrix}=\mathbf{w}_1^TC_1\mathbf{w}_1. \end{aligned}

按照同樣方式可得 v=\mathbf{w}_2^TD_2\mathbf{w}_2。隨機向量 \mathbf{w}=Q^TM^{-1}\mathbf{x} 服從多變量常態分布,期望值和共變異數矩陣計算如下:

\displaystyle E[\mathbf{w}]=E\left[Q^TM^{-1}\mathbf{x}\right]=Q^TM^{-1}E[\mathbf{x}]=Q^TM^{-1}\boldsymbol{\mu}

\displaystyle\begin{aligned} \hbox{cov}[\mathbf{w}]&=\hbox{cov}[Q^TM^{-1}\mathbf{x}]=Q^TM^{-1}\hbox{cov}[\mathbf{x}](Q^TM^{-1})^T\\ &=Q^TM^{-1}\Sigma(M^T)^{-1}Q=Q^TM^{-1}MM^T(M^T)^{-1}Q=Q^TQ=I.\end{aligned}

所以,\mathbf{w}\sim\mathcal{N}(Q^TM^{-1}\boldsymbol{\mu},I),這意味 \mathbf{w}_1\mathbf{w}_2 是獨立的隨機向量,故 u=\mathbf{w}_1^TC_1\mathbf{w}_1v=\mathbf{w}_2^TD_2\mathbf{w}_2 是獨立的隨機變數。

 
我們舉一個例子說明如何利用二次型判別獨立的隨機變數。考慮 n 個獨立的隨機變數 x_1,\ldots,x_n,且每一 x_i\in\mathcal{N}(\mu,\sigma^2)\sigma>0。樣本平均數定義為 (見“樣本平均數、變異數和共變異數”)

\displaystyle m=\frac{1}{n}\sum_{i=1}^nx_i

樣本共變異數定義為

\displaystyle s^2=\frac{1}{n-1}\sum_{i=1}^n(x_i-m)^2

下面證明樣本平均數平方 m^2 和樣本共變異數 s^2 是獨立的隨機變數。為方便計算,定義隨機向量 \mathbf{x}=(x_1,\ldots,x_n)^T,也就有 \mathbf{x}\sim\mathcal{N}(\mu\mathbf{1},\sigma^2I),並令 n 維向量 \mathbf{1}=(1,1,\ldots,1)^T。因此,

\displaystyle\begin{aligned} nm^2&=n\left(\frac{1}{n}\mathbf{1}^T\mathbf{x}\right)^2=\frac{1}{n}(\mathbf{x}^T\mathbf{1})(\mathbf{1}^T\mathbf{x})\\ &=\mathbf{x}^T\left(\frac{1}{n}\mathbf{1}\mathbf{1}^T\right)\mathbf{x}=\mathbf{x}^TA\mathbf{x},\end{aligned}

上面令 n\times n 階矩陣 A=\frac{1}{n}\mathbf{1}\mathbf{1}^T,即

\displaystyle A=\begin{bmatrix} \frac{1}{n}&\frac{1}{n}&\cdots&\frac{1}{n}\\[0.3em] \frac{1}{n}&\frac{1}{n}&\cdots&\frac{1}{n}\\ \vdots&\vdots&\ddots&\vdots\\ \frac{1}{n}&\frac{1}{n}&\cdots&\frac{1}{n} \end{bmatrix}

計算可驗證 A^2=A,故 A 是對稱冪等矩陣。另一方面,

\displaystyle\begin{aligned} \mathbf{x}-m\mathbf{1}&=\mathbf{x}-\frac{1}{n}(\mathbf{1}^T\mathbf{x})\mathbf{1}=\mathbf{x}-\frac{1}{n}\mathbf{1}(\mathbf{1}^T\mathbf{x})\\ &=\left(I-\frac{1}{n}\mathbf{1}\mathbf{1}^T\right)\mathbf{x}=(I-A)\mathbf{x}=B\mathbf{x}, \end{aligned}

上面令 B=I-A。但 B^2=(I-A)^2=I-2A+A^2=I-2A+A=I-A=B,可知 B 也是對稱冪等矩陣。樣本共變異數 s^2 可改寫為以 B 表示的二次型:

\displaystyle\begin{aligned} s^2&=\frac{1}{n-1}(\mathbf{x}-m\mathbf{1})^T(\mathbf{x}-m\mathbf{1})\\ &=\frac{1}{n-1}(B\mathbf{x})^T(B\mathbf{x})=\frac{1}{n}\mathbf{x}^TB^TB\mathbf{x}\\ &=\frac{1}{n-1}\mathbf{x}^TB^2\mathbf{x}=\frac{1}{n-1}\mathbf{x}^TB\mathbf{x}. \end{aligned}

算出 A(\sigma^2 I)B=\sigma^2 A(I-A)=\sigma^2(A-A^2)=0,定理七表明 m^2=\mathbf{x}^T(\frac{1}{n}A)\mathbf{x}s^2=\mathbf{x}^T(\frac{1}{n-1}B)\mathbf{x} 是獨立的隨機變數。

 
最後解釋樣本共變異數 s^2 與卡方分布的關係。令 \mathbf{z}=(\mathbf{x}-\mu\mathbf{1})/\sigma。因為 E[\mathbf{z}]=\frac{1}{\sigma}(E[\mathbf{x}]-\mu\mathbf{1})=\mathbf{0}\hbox{cov}[\mathbf{z}]=\frac{1}{\sigma^2}(\sigma^2 I)=I,即知 \mathbf{z}\sim\mathcal{N}(\mathbf{0},I)。將 s^2 改寫如下:

\displaystyle\begin{aligned} s^2&=\frac{1}{n-1}\mathbf{x}^TB\mathbf{x}\\ &=\frac{1}{n-1}(\mathbf{x}-\mu\mathbf{1}+\mu\mathbf{1})^TB(\mathbf{x}-\mu\mathbf{1}+\mu\mathbf{1})\\ &=\frac{\sigma^2}{n-1}\left(\frac{\mathbf{x}-\mu\mathbf{1}}{\sigma}+\frac{\mu}{\sigma}\mathbf{1}\right)^TB\left(\frac{\mathbf{x}-\mu\mathbf{1}}{\sigma}+\frac{\mu}{\sigma}\mathbf{1}\right)\\ &=\frac{\sigma^2}{n-1}\left(\mathbf{z}+\frac{\mu}{\sigma}\mathbf{1}\right)^TB\left(\mathbf{z}+\frac{\mu}{\sigma}\mathbf{1}\right)\\ &=\frac{\sigma^2}{n-1}\left(\mathbf{z}^TB\mathbf{z}+\frac{\mu}{\sigma}\mathbf{z}^TB\mathbf{1}+\frac{\mu}{\sigma}\mathbf{1}^TB\mathbf{z}++\frac{\mu^2}{\sigma^2}\mathbf{1}^TB\mathbf{1}\right). \end{aligned}

B\mathbf{1}=(I-A)\mathbf{1}=\mathbf{1}-A\mathbf{1}=\mathbf{0},上式的後三項皆為零,故

\displaystyle s^2=\frac{\sigma^2}{n-1}\mathbf{z}^TB\mathbf{z}

定理一指出 \mathbf{z}^TB\mathbf{z} 服從卡方分布,自由度為 \text{trace}B=\sum_{i=1}^n(I-A)_{ii}=n(1-\frac{1}{n})=n-1。在機率學中,s^2=\frac{\sigma^2}{n-1}y 稱為具有參數 n-1\sigma^2 的 Gamma 分布,其中 y=\mathbf{z}^TB\mathbf{z}\sim\chi^2(n-1)

Advertisements
This entry was posted in 機率統計 and tagged , , , , , . Bookmark the permalink.

2 則回應給 常態分布與二次型

  1. XiaoH 說:

    关于定理6的必要性,如果A和B可交换,可以正交变换对角化后,用独立变量间特征函数乘积等于和的特征函数来证明。如果AB不可交换,似乎一定相关,不过想不出合适的证明。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s