Hermitian 矩陣乘積的性質

本文的閱讀等級:高級

在線性代數理論與應用中,Hermitian 矩陣可謂最重要的一種特殊矩陣。若一 n\times n 階矩陣 A 滿足 A^\ast=A,我們稱之為 Hermitian,它具備下列美好的性質 (見“Hermitian 特殊矩陣 (9):Hermitian 矩陣”):

  1. A 的特徵值 \lambda_1,\ldots,\lambda_n 必為實數;
  2. An 個完整的單範正交 (orthonormal) 特徵向量,也就是說,A 可么正對角化 (unitarily diagonalizable) 為 A=UDU^\ast,其中 U 是么正矩陣,U^\ast=U^{-1}D=\text{diag}(\lambda_1,\ldots,\lambda_n)

對於 Hermitian 矩陣 ABABBA 未必是 Hermitian (除非 AB 是可交換矩陣,見定理一)。本文將探討二個 Hermitian 矩陣乘積的一些性質,包括特徵值、跡數 (trace)、可對角化和相似性 (AB 是否相似於 BA)。

 
定理一:令 AB 是 Hermitian 矩陣。以下是等價的陳述:

  1. ABBA 是 Hermitian 矩陣;
  2. AB=BA
  3. 存在一 n\times n 階么正矩陣 U 使得 U^\ast AUU^\ast BU 為實對角矩陣。

證明於下:
(1)\Rightarrow(2):假設 (AB)^\ast=AB,則 AB=(AB)^\ast=B^\ast A^\ast=BA

(2)\Rightarrow(3):若 AB=BA,也就是說,AB 是可交換矩陣,則存在一可逆矩陣 U 使得 D_1=U^{-1}AUD_2=U^{-1}BU 為實對角矩陣 (見“同時可對角化矩陣”),因為 AB 皆可對角化且特徵值均為實數。因此,A=UD_1U^{-1}A^\ast=(UD_1U^{-1})^\ast=(U^\ast)^{-1}D_1U^\ast,二式相等即知存在 U 使得 U^\ast=U^{-1}

(3)\Rightarrow(1):若 AB 可么正對角化為 U^\ast AU=D_1U^\ast BU=D_2,其中 U^\ast=U^{-1}D_1D_2 是實對角矩陣,則

\displaystyle\begin{aligned}  (AB)&=(UD_1U^\ast)(UD_2U^\ast)=UD_1D_2U^\ast=UD_2D_1U^\ast\\  &=(UD_2U^\ast)(UD_1U^\ast)=BA=B^\ast A^\ast=(AB)^\ast.\end{aligned}

所以,(BA)^\ast=A^\ast B^\ast=AB=(AB)^\ast=B^\ast A^\ast=BA

 
特徵值

對於 Hermitian 矩陣 ABAB 的特徵值未必是實數。例如,A=\left[\!\!\begin{array}{cr}  1&0\\  0&-1  \end{array}\!\!\right]B=\left[\!\!\begin{array}{cr}  1&1\\  1&-1  \end{array}\!\!\right],則 AB=\left[\!\!\begin{array}{rc}  1&1\\  -1&1  \end{array}\!\right] 的特徵值為 1\pm ii=\sqrt{-1}。但如果加入半正定性至 Hermitian 矩陣,則 AB 的特徵值將為實數,甚至是非負實數。

 
定理二:令 AB 是 Hermitian 矩陣。若 A\succcurlyeq 0B\succcurlyeq 0,則 AB 的特徵值皆為實數。若 A\succcurlyeq 0B\succcurlyeq 0,則 AB 的特徵值皆為非負實數。

我們需要這個性質:對於 n\times n 階矩陣 XYXYYX 有相同的特徵值 (見“AB 和 BA 有何關係?”)。令 A\succcurlyeq 0。使用 A=\sqrt{A}\sqrt{A},其中 \sqrt{A}\succcurlyeq 0 稱為 A 的平方根 (見“半正定矩陣的偏序關係”),可知 AB=\sqrt{A}\left(\sqrt{A}B\right)\left(\sqrt{A}B\right)\sqrt{A} 有相同的特徵值。但 \sqrt{A}B\sqrt{A} 是 Hermitian 矩陣,故可推論 AB 的特徵值為實數。若 B\succcurlyeq 0,相同方法亦可證明 AB\sqrt{B}A\sqrt{B} 有相同的實特徵值。如果 A\succcurlyeq 0B\succcurlyeq 0,則對於任意 \mathbf{x}

\displaystyle\begin{aligned}  \mathbf{x}^\ast\sqrt{A}B\sqrt{A}\mathbf{x}&=\mathbf{x}^\ast\sqrt{A}\sqrt{B}\sqrt{B}\sqrt{A}\mathbf{x}=\left(\sqrt{B}\sqrt{A}\mathbf{x}\right)^\ast\left(\sqrt{B}\sqrt{A}\mathbf{x}\right)\\  &=\left\| \sqrt{B}\sqrt{A}\mathbf{x} \right\|\ge 0,\end{aligned}

\sqrt{A}B\sqrt{A}\succcurlyeq 0。半正定矩陣的特徵值皆為非負數 (見“半正定矩陣的判別方法”),因此 AB 有非負的特徵值。

 
跡數

二個 Hermitian 矩陣乘積的特徵值未必是實數,但跡數必為實數。

 
定理三:若 AB 是 Hermitian 矩陣,則 \text{trace}(AB) 是實數。

使用跡數的循環不變性,可得

\displaystyle\begin{aligned}  \text{trace}(AB)&=\text{trace}(A^\ast B^\ast)=\text{trace}((BA)^\ast)=\text{trace}((\overline{BA})^T)\\  &=\text{trace}(\overline{BA})=\overline{\text{trace}(BA)}=\overline{\text{trace}(AB)}.\end{aligned}

上式說明 \text{trace}(AB) 不含虛部,故為實數。

 
可對角化

對於 Hermitian 矩陣 ABAB 未必可對角化。例如,A=\left[\!\!\begin{array}{cc}  1&1\\  1&1  \end{array}\!\!\right]B=\left[\!\!\begin{array}{cr}  1&0\\  0&-1  \end{array}\!\!\right],則 AB=\left[\!\!\begin{array}{cc}  1&-1\\  1&-1  \end{array}\!\right] 有相重特徵值 0,但僅有一個線性獨立的特徵向量 \begin{bmatrix}  1\\  1  \end{bmatrix}。如果加入正定性至其中一個 Hermitian 矩陣,則 AB 將可對角化。值得注意的是,半正定性仍不足使 AB 可對角化,如上例所示。

 
定理四:令 AB 是 Hermitian 矩陣。若 A\succ 0,則 AB 是可對角化矩陣且 ABB 有相同的正特徵值數、負特徵值數及零特徵值數。

A\succ 0。正定矩陣 A 的特徵值皆為正數,因此 A 是可逆矩陣,即知 AB 相似於 \sqrt{A}^{-1}AB\sqrt{A}=\sqrt{A}B\sqrt{A}。後者是 Hermitian,故可么正對角化為 \sqrt{A}B\sqrt{A}=UDU^\ast,其中 U^\ast=U^{-1}D 是實對角矩陣。所以,AB 亦可對角化,如下:

\displaystyle AB=\sqrt{A}\left(\sqrt{A}B\sqrt{A}\right)\sqrt{A}^{-1}=\sqrt{A}UDU^\ast\sqrt{A}^{-1}=\left(\sqrt{A}U\right)D\left(\sqrt{A}U\right)^{-1}

注意,AB\sqrt{A}B\sqrt{A} 有相同的特徵值。根據 Sylvester 定理,\sqrt{A}B\sqrt{A} 相合於 (congruent) B,推論 \sqrt{A}B\sqrt{A} 有相同的慣性 (inertia),即兩者有相同的正特徵值數、負特徵值數和零特徵值數 (見“相合變換”)。使用同樣的方法可證明當 B\succ 0AB 可對角化且 ABA 有相同的慣性。

 
定理五可視為定理四的反向陳述。

 
定理五:若 M 為一可對角化矩陣且特徵值皆為實數,則存在 A\succ 0 及 Hermitian 矩陣 B 使得 M=AB

M=SDS^{-1},其中 D 是一個實對角矩陣。寫出 M=(SS^\ast)((S^{-1})^\ast DS^{-1})=AB,其中 A=SS^\ast\succ 0B=(S^{-1})^\ast DS^{-1} 是 Hermitian。

 
相似性

對於 n\times n 階矩陣 AB,雖然 ABBA 有相同的特徵值,但 AB 不總是相似於 BA。例如,A=\begin{bmatrix}  1&0\\  0&0  \end{bmatrix}B=\begin{bmatrix}  0&1\\  0&1  \end{bmatrix},則 AB=\begin{bmatrix}  0&1\\  0&0  \end{bmatrix} 不可對角化,但 BA=\begin{bmatrix}  0&0\\  0&0  \end{bmatrix} 可對角化。若 AB 為可逆矩陣,則 AB 相似於 BA。證明過程很簡單:若 A 可逆,則 AB 相似於 A^{-1}(AB)A=BA;若 B 可逆,則 AB 相似於 B(AB)B^{-1}=BA。然而,當 AB 都是 Hermmitian,不需要引進可逆條件恆有 AB 相似於 BA。這是性質不常見於線性代數教科書,原因或許是證明援用 Jordan 典型形式[1]

 
定理六:若 AB 是 Hermitian 矩陣,則 M=AB 相似於 M^\ast=BA。相反的,若 M 相似於 M^\ast,則 M 可表示為 M=AB,其中 AB 是 Hermitian 矩陣。

(\Rightarrow):令 M=AB,其中 AB 是 Hermitian 矩陣。寫出

\displaystyle  MA=ABA=A(AB)^\ast=AM^\ast

再由 M 的定義式和 MA=AM 可歸納出冪矩陣恆等式 (請讀者自行證明)

\displaystyle  M^kA=A(M^\ast)^k,~~k\ge 1

M 的 Jordan 形式為 M=SJS^{-1},其中 J 是 Jordan 矩陣。因此,

\displaystyle  J=S^{-1}MS=S^{-1}ABS=\left(S^{-1}A(S^{-1})^\ast\right)\left(S^\ast BS\right)

上式中,S^{-1}A(S^{-1})^\astS^\ast BS 是 Hermitian。若能證明 J 相似於 J^\ast,即知 M 相似於 M^\ast。在不失一般性的前提下,以下假設 M 為一 Jordan 矩陣並具備下列分塊形式:

\displaystyle  M=\begin{bmatrix}  J_1&0\\  0&J_2  \end{bmatrix}

其中 J_1 包含零特徵值的 Jordan 分塊,J_2 包含非零特徵值的 Jordan 分塊,故 J_1 是冪零 (nilpotent) 矩陣,J_2 是可逆矩陣 (見“Jordan 形式大解讀 (上)”)。按照 J_1J_2 的尺寸寫出 AB 的分塊表達式,如下:

\displaystyle  A=\begin{bmatrix}  P&Q\\  Q^\ast&R  \end{bmatrix},~~B=\begin{bmatrix}  X&Y\\  Y^\ast&Z  \end{bmatrix}

MA 的分塊表達式代入冪矩陣恆等式,

\displaystyle  \begin{bmatrix}  J_1^k&0\\  0&J_2^k  \end{bmatrix}\begin{bmatrix}  P&Q\\  Q^\ast&R  \end{bmatrix}=\begin{bmatrix}  P&Q\\  Q^\ast&R  \end{bmatrix}\begin{bmatrix}  (J_1^\ast)^k&0\\  0&(J_2^\ast)^k  \end{bmatrix}

乘開比較等號兩邊的非主對角分塊,可得 J_2^kQ^\ast=Q^\ast (J_1^\ast)^kk\ge 1。冪零矩陣 J_1 滿足 (J_1^k)^\ast=(J_1^\ast)^k=0k\ge n,推得 Q=0,因為 J_2 是可逆矩陣。所以,A 是分塊對角矩陣,且 M=AB 可簡化為

\displaystyle  \begin{bmatrix}  J_1&0\\  0&J_2  \end{bmatrix}=\begin{bmatrix}  P&0\\  0&R  \end{bmatrix}\begin{bmatrix}  X&Y\\  Y^\ast&Z\end{bmatrix}

即有 J_2=RZ,並知 RZ 是可逆分塊。當 k=1

\displaystyle  \begin{bmatrix}  J_1&0\\  0&J_2  \end{bmatrix}\begin{bmatrix}  P&0\\  0&R  \end{bmatrix}=\begin{bmatrix}  P&0\\  0&R  \end{bmatrix}\begin{bmatrix}  J_1^\ast&0\\  0&J_2^\ast  \end{bmatrix}

J_2R=RJ_2^\astR^{-1}J_2R=J_2^\ast,也就是說,J_2 相似於 J_2^\ast。另一方面,任一矩陣相似於其轉置矩陣 (見“矩陣與其轉置的相似性”),故 J_1 相似於 J_1^T=J_1^\ast (因為 J_1 是實矩陣)。合併以上結果,證明 M 相似於 M^\ast

(\Leftarrow):假設 M 相似於 M^\ast。如果我們能證明 M 相似於 PQ,其中 PQ 是 Hermitian,則存在一可逆矩陣 S 使得

\displaystyle  M=S^{-1}PQS=S^{-1}P(S^{-1})^\ast S^\ast QS

如此即得證,因為 S^{-1}P(S^{-1})^\astS^\ast QS 都是 Hermitian 矩陣。使用這個性質:M 相似於 M^\ast 的條件是 M 的非實特徵值必須為共軛對,而且對應的 Jordan 分塊也為共軛對 (見“矩陣相似於其共軛轉置的充要條件”)。由於 MM^\ast 的相似性未涉及實特徵值,我們只要證明非實特徵值 \lambda 的 Jordan 分塊對 \begin{bmatrix}  J(\lambda)&0\\  0&J(\overline{\lambda})  \end{bmatrix} 相似於二個 Hermitian 矩陣的積即可。論證於下:\begin{bmatrix}  J(\lambda)&0\\  0&J(\overline{\lambda})  \end{bmatrix} 相似於 \displaystyle  \begin{bmatrix}  J(\lambda)&0\\  0&(J(\overline{\lambda}))^T  \end{bmatrix}=  \begin{bmatrix}  J(\lambda)&0\\  0&(J(\lambda))^\ast\end{bmatrix},但後者是二個 Hermitian 矩陣的積:

\displaystyle  \begin{bmatrix}  J(\lambda)&0\\  0&(J(\lambda))^\ast\end{bmatrix}=\begin{bmatrix}  0&J(\lambda)\\  (J(\lambda))^\ast&0  \end{bmatrix}\begin{bmatrix}  0&I\\  I&0  \end{bmatrix}

 
參考來源:
[1] Fuzhen Zhang, Matrix Theory: Basic Results and Techniques, Springer, 1999, pp 215-216.

This entry was posted in 線性代數專欄, 二次型 and tagged , , , , , , . Bookmark the permalink.

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s