特殊矩陣 (9):Hermitian 矩陣

本文的閱讀等級:中級

實對稱矩陣滿足 A^T=A,是所有實矩陣中應用最廣泛的特殊矩陣。實對稱矩陣的特徵值皆為實數,且存在完整的單範正交的 (orthonormal) 實特徵向量。據此,實對稱矩陣可正交對角化為 A=Q\Lambda Q^{T},其中 \Lambda 是特徵值構成的對角矩陣,Q 是特徵向量構成的正交矩陣 (orthogonal matrix),滿足 Q^T=Q^{-1}。複矩陣也存在與實對稱矩陣相應的美好矩陣,稱為 Hermitian 矩陣或共軛對稱矩陣,也叫自共軛矩陣。關於複矩陣的基礎介紹,請見“從實數系到複數系”。

Charles Hermite (1822-1901) From http://markandrewholmes.com/c_hermite.jpg

 
對應實矩陣的轉置運算 A^T,複矩陣則為共軛轉置,也就是包含共軛和轉置兩個運算 \overline{A}^T,常記作 A^{\ast}A^H。例如,

A=\begin{bmatrix}    1&2-3i\\    0&1+i    \end{bmatrix}

A 的共軛轉置為

A^{\ast}=\begin{bmatrix}    1&0\\    2+3i&1-i    \end{bmatrix}

A^{\ast}=A,我們稱它是 Hermitian 矩陣,下為一例:

A=\begin{bmatrix}    2&1-i&3i\\    1+i&0&2+2i\\    -3i&2-2i&5    \end{bmatrix}

注意,Hermitian 矩陣 A=[a_{ij}] 的主對角元為實數,因為 \overline{a_{ii}}=a_{ii},非主對角元 a_{ij}a_{ji} 則為一組共軛複數,a_{ij}=\overline{a_{ji}}。很明顯,實 Hermitian 矩陣就是實對稱矩陣。法國數學家埃爾米特 (Charles Hermite) 於1855年證明若 A^{\ast}=A,則 A 的特徵值皆為實數 (見下面性質二),今天我們便稱這類矩陣為 Hermitian。

 
下面討論 Hermitian 矩陣最重要的四個性質,這些性質為擴展 Hermitian 矩陣的應用提供強大的火力支援。

 
性質一:若 A 是 Hermitian 矩陣,對於任意向量 \mathbf{x}\in\mathbb{C}^n\mathbf{x}^{\ast}A\mathbf{x} 是實數。

先掌握這個重點:\mathbf{x}^{\ast}A\mathbf{x} 是一個純量,可視為一個 1\times 1 階矩陣。使用已知條件 A^{\ast}=A,計算

(\mathbf{x}^{\ast}A\mathbf{x})^{\ast}=\mathbf{x}^{\ast}A^{\ast}(\mathbf{x}^{\ast})^{\ast}=\mathbf{x}^{\ast}A\mathbf{x}

既然 \mathbf{x}^{\ast}A\mathbf{x} 與其共軛相等,可推論 \mathbf{x}^{\ast}A\mathbf{x} 必為實數。

 
考慮下例:

A=\begin{bmatrix}    4&-1+i\\    -1-i&3    \end{bmatrix}

展開 \mathbf{x}^{\ast}A\mathbf{x}

\begin{bmatrix}    \overline{x_1}&\overline{x_2}    \end{bmatrix}\begin{bmatrix}    4&-1+i\\    -1-i&3    \end{bmatrix}\begin{bmatrix}    x_1\\    x_2    \end{bmatrix}=4\overline{x_1}x_1+3\overline{x_2}x_2+(-1+i)\overline{x_1}x_2+(-1-i)x_1\overline{x_2}

其中來自於主對角元的前面兩項 \overline{x_1}x_1\overline{x_2}x_2 皆是實數,而來自非主對角元的後面兩項互為共軛,該兩項之和消去虛部,故亦為實數。

 
值得注意的是,性質一的反向陳述也為真,亦即若對於任意 \mathbf{x}\in\mathbb{C}^n\mathbf{x}^{\ast}A\mathbf{x} 是實數,則 A 是 Hermitian 矩陣。證明於下。根據假設條件,對於任意 \mathbf{x},\mathbf{y}\in\mathbb{C}^n,下式為實數:

(\mathbf{x}+\mathbf{y})^{\ast}A(\mathbf{x}+\mathbf{y})=(\mathbf{x}^{\ast}A\mathbf{x}+\mathbf{y}^{\ast}A\mathbf{y})+(\mathbf{x}^{\ast}A\mathbf{y}+\mathbf{y}^{\ast}A\mathbf{x})

\mathbf{x}^{\ast}A\mathbf{x}+\mathbf{y}^{\ast}A\mathbf{y} 是實數,剩下的證明步驟利用 \mathbf{x}^{\ast}A \mathbf{y}+\mathbf{y}^{\ast}A\mathbf{x} 是實數。令 \mathbf{e}_j=\begin{bmatrix}  0&\cdots&1\cdots&0\end{bmatrix}^T,其中第 j 元為 1,其餘各元皆為 0。若 \mathbf{x}=\mathbf{e}_j\mathbf{y}=\mathbf{e}_k,則 \mathbf{x}^{\ast}A\mathbf{y}+\mathbf{y}^{\ast}A\mathbf{x}=a_{jk}+a_{kj} 為實數,即 \mathrm{Im}(a_{jk})=-\mathrm{Im}(a_{kj})。 若 \mathbf{x}=i\mathbf{e}_j\mathbf{y}=\mathbf{e}_k,則 \mathbf{x}^{\ast}A\mathbf{y}+\mathbf{y}^{\ast}A\mathbf{x}=-ia_{jk}+ia_{kj} 為實數,即 \mathrm{Re}(a_{jk})=\mathrm{Re}(a_{kj})。合併以上結果,可推得 a_{jk}=\overline{a_{kj}},因為 jk 是任意的,也就有 A=A^{\ast}

 
性質二:Hermitian 矩陣的特徵值皆為實數。

由性質一可推得性質二。假設特徵方程式為 A\mathbf{x}=\lambda\mathbf{x}\mathbf{x}\neq\mathbf{0},等號兩側左乘 \mathbf{x}^{\ast},就有 \mathbf{x}^{\ast}A\mathbf{x}=\lambda\mathbf{x}^{\ast}\mathbf{x}。利用性質一,可知上式等號左邊 \mathbf{x}^{\ast}A\mathbf{x} 是實數,等號右邊 \mathbf{x}^\ast\mathbf{x}=\Vert\mathbf{x}\Vert^2 是非零向量 \mathbf{x} 的長度平方,故為一正數。因此,\lambda=\mathbf{x}^{\ast}A\mathbf{x}/\mathbf{x}^{\ast}\mathbf{x} 是實數。

 
上例 Hermitian 矩陣 A 有特徵多項式:

\begin{aligned}  \begin{vmatrix}    4-\lambda&-1+i\\    -1-i&3-\lambda    \end{vmatrix}&=\lambda^2-7\lambda+12-\vert -1+i\vert^2\\    &=\lambda^2-7\lambda+10\\  &=(\lambda-2)(\lambda-5),\end{aligned}

得知特徵值為 25

 
性質三:Hermitian 矩陣對應相異特徵值的特徵向量互為正交。

設 Hermitian 矩陣 A 有相異實特徵值 \lambda\mu,對應的特徵向量分別為 \mathbf{x}\mathbf{y}。在 A\mathbf{x}=\lambda\mathbf{x} 同時左乘 \mathbf{y}^{\ast},就有

\mathbf{y}^{\ast}A\mathbf{x}=\lambda\mathbf{y}^{\ast}\mathbf{x}

\mathbf{y}^{\ast}A^{\ast}=\mu\mathbf{y}^{\ast} 同時右乘 \mathbf{x}

\mathbf{y}^{\ast}A^{\ast}\mathbf{x}=\mu\mathbf{y}^{\ast}\mathbf{x}

並利用 A^{\ast}=A,上面兩式等號左邊相等,所以

\lambda\mathbf{y}^{\ast}\mathbf{x}=\mu\mathbf{y}^{\ast}\mathbf{x}

但已知 \lambda\neq\mu,必定有 \mathbf{y}^{\ast}\mathbf{x}=0\mathbf{y} 正交於 \mathbf{x}

 
上例中,對應特徵值 25 的特徵向量分別是

\mathbf{x}=\begin{bmatrix}    1\\    1+i    \end{bmatrix},~\mathbf{y}=\begin{bmatrix}    1-i\\    -1    \end{bmatrix}

直接計算確認

\mathbf{y}^{\ast}\mathbf{x}=\begin{bmatrix}    1+i&-1    \end{bmatrix}\begin{bmatrix}    1\\    1+i    \end{bmatrix}=0

 
性質四:Hermitian 矩陣的特徵值的代數重數等於幾何重數。

此性質等同於 Hermitian 矩陣不存在廣義特徵向量 (這個主題較為艱深,詳見“Jordan 形式大解讀之尋找廣義特徵向量”)。假設廣義特徵向量 \mathbf{x} 滿足 (A-\lambda I)^k\mathbf{x}=\mathbf{0},我們想要證明 (A-\lambda I)\mathbf{x}=\mathbf{0},也就是說,\mathbf{x} 是一般特徵向量。若 k=2,則有 (A-\lambda I)^2\mathbf{x}=\mathbf{0},左乘 \mathbf{x}^\ast,可得

0=\mathbf{x}^\ast(A-\lambda I)^2\mathbf{x}=\mathbf{x}^\ast(A-\lambda I)^\ast(A-\lambda I)\mathbf{x}=\Vert(A-\lambda I)\mathbf{x}\Vert^2

(A-\lambda I)\mathbf{x}=\mathbf{0}。使用歸納法。寫出

(A-\lambda I)^k\mathbf{x}=(A-\lambda I)^2(A-\lambda I)^{k-2}\mathbf{x}=\mathbf{0}

\mathbf{z}=(A-\lambda I)^{k-2}\mathbf{x}。上式等於 (A-\lambda I)^2\mathbf{z}=\mathbf{0},使用先前結果可知 (A-\lambda I)\mathbf{z}=\mathbf{0},也就是 (A-\lambda I)^{k-1}\mathbf{x}=\mathbf{0}。重複歸納步驟即證得 (A-\lambda I)\mathbf{x}=\mathbf{0}

 
使用性質二、三和四,我們可以推論 Hermitian 矩陣是可正交對角化的 (見“特殊矩陣 (2):正規矩陣”)。以前例說明,先將特徵向量 \mathbf{x}\mathbf{y} 予以正規化,使其長度等於 1。令

\displaystyle  \mathbf{u}_1=\frac{\mathbf{x}}{(\mathbf{x}^{\ast}\mathbf{x})^{1/2}}=\frac{1}{\sqrt{3}}\begin{bmatrix}    1\\    1+i    \end{bmatrix}

\displaystyle  \mathbf{u}_2=\frac{\mathbf{y}}{(\mathbf{y}^{\ast}\mathbf{y})^{1/2}}=\frac{1}{\sqrt{3}}\begin{bmatrix}    1-i\\    -1    \end{bmatrix}

定義 U 矩陣的行向量由單範正交特徵向量組成,如下:

\displaystyle  U=\begin{bmatrix}    \mathbf{u}_1&\mathbf{u}_2    \end{bmatrix}=\frac{1}{\sqrt{3}}\begin{bmatrix}    1&1-i\\    1+i&-1    \end{bmatrix}

矩陣 U 滿足 U^{\ast}U=I,即 U^{-1}=U^{\ast},稱為么正矩陣或酉矩陣 (unitary matrix)。又設對角特徵值矩陣為

\Lambda=\begin{bmatrix}    2&0\\    0&5    \end{bmatrix}

由於 U 是可逆矩陣,特徵方程式的矩陣形式 AU=U\Lambda 可寫為分解式 \Lambda=U^{\ast}AUA=U\Lambda U^{\ast},這說明 Hermitian 矩陣是可么正對角化的 (unitarily diagonalizable)。

相關閱讀:
This entry was posted in 特殊矩陣, 線性代數專欄 and tagged , , , , , . Bookmark the permalink.

Leave a comment