正規矩陣的等價條件

本文的閱讀等級:高級

A 為一個 n\times n 階矩陣。若 A^\ast A=AA^\ast,也就是說 AA^\ast 可交換,則 A 稱為正規矩陣 (normal matrix)。例如,實對稱矩陣 A^T=A、Hermitian 矩陣 A^\ast=A、反共軛對稱矩陣 A^\ast=-A,以及么正 (unitary) 矩陣 A^\ast=A^{-1} 皆為正規矩陣 (見“特殊矩陣 (2):正規矩陣”)。目前已知的正規矩陣等價條件大約有 90 個[1],其中很多條件引用的概念相近,另有少許冷僻艱澀。本文挑選 25 個 (文獻[2]列舉出 70 個) 有關於特徵值、特徵向量、奇異值、跡數、範數、二次型、可交換、不變子空間 (invariant subspace)、正定、譜分解 (spectral decomposition),以及極分解 (polar decomposition) 等較具代表性的等價條件,並給出證明 (部分已刊登的證明僅提供連結)。

 
首先簡要回顧一些預備知識:每一方陣 A 有極分解 A=UP,其中 U 是一個么正矩陣,P 是 (Hermitian) 一個半正定矩陣 (見“極分解”)。每一方陣 A 可三角化為 A=UTU^\ast,其中 U 是一個么正矩陣,T 是一個上三角矩陣 (見“矩陣三角化的 Schur 定理”)。方陣 A 的奇異值平方等於 A^\ast A (或 AA^\ast) 的特徵值(見“奇異值分解 (SVD)”)。令 \mathcal{X}\mathbb{C}^n 的一個子空間。若每一 \mathbf{x}\in\mathcal{X} 使得 A\mathbf{x}\in\mathcal{X},則 \mathcal{X} 稱為 A 的一個不變子空間 (見“不變子空間──解構線性算子的利器”)。這兩個引理可以幫助底下的證明:

引理1:若 AB 可交換,則 UAU^\astUBU^\ast 可交換,其中 U 是一個么正矩陣。證明於下:因為 U^\ast =U^{-1}

\begin{aligned}  AB=BA&\Leftrightarrow UABU^\ast=UBAU^\ast\\  &\Leftrightarrow UAU^\ast UBU^\ast=UBU^\ast UAU^\ast  \end{aligned}

引理2\hbox{trace}(A^\ast A)=0\Leftrightarrow A^\ast A=0 \Leftrightarrow A=0。證明於下:因為 A^\ast A 是半正定,寫出正交對角化形式 A^\ast A=U\hbox{diag}(\mu_1,\ldots,\mu_n)U^\ast,其中 U 是么正矩陣,且每一 \mu_i\ge 0。因此,\hbox{trace}(A^\ast A)=\mu_1+\cdots+\mu_n=0 等價於 \mu_1=\cdots=\mu_n=0,即 A^\ast A=0。另一方面,\hbox{rank}(A^\ast A)=\hbox{rank}A,推得 A^\ast A=0 等價於 A=0

 
n\times n 階矩陣 A=[a_{ij}] 的特徵值為 \lambda_1,\ldots,\lambda_n。以下是正規矩陣的等價條件:

  1. A 是一個正規矩陣,即 A^\ast A=AA^\ast
  2. A 可么正對角化 (unitarily diagonalizable),即存在一個么正矩陣 U 使得 U^\ast AU=\hbox{diag}(\lambda_1,\ldots,\lambda_n)
  3. A 的特徵向量構成 \mathbb{C}^n 的一組單範正交基底 (orthonormal basis);
  4. U 是一個么正矩陣使得 U^\ast AU=\begin{bmatrix}B&C\\ 0&D \end{bmatrix},其中 BD 是方陣,則 BD 是正規矩陣且 C=0
  5. \mathcal{X}\subseteq \mathbb{C}^nA 的一個不變子空間,則 \mathcal{X}^\perpA 的一個不變子空間;
  6. \mathbf{x}A 的一個特徵向量,則 \hbox{span}\{\mathbf{x}\}^\perpA 的一個不變子空間;
  7. 存在 \lambda_1,\ldots,\lambda_n\in\mathbb{C} 使得 A=\sum_{i=1}^n\lambda_iE_i,其中 E_i 滿足 E_i^2=E_i=E_i^\astE_iE_j=0i\neq j,且 \sum_{i=1}^nE_i=I
  8. 存在一多項式 p 使得 A^\ast=p(A)
  9. A 的每一個特徵向量皆為 A^\ast 的特徵向量;
  10. 存在一個么正矩陣 U 使得 A^\ast=AU
  11. A=B+iCi=\sqrt{-1},其中 BC 是可交換 Hermitian 矩陣;
  12. \sum_{i=1}^n\vert\lambda_i\vert^2=\hbox{trace}(A^\ast A)=\sum_{i=1}^n\sum_{j=1}^n\vert a_{ij}\vert^2
  13. A 的奇異值為 \vert\lambda_1\vert,\ldots,\vert\lambda_n\vert
  14. \sum_{i=1}^n(\hbox{Re}\lambda_i)^2=\frac{1}{4}\hbox{trace}(A+A^\ast)^2
  15. \sum_{i=1}^n(\hbox{Im}\lambda_i)^2=-\frac{1}{4}\hbox{trace}(A-A^\ast)^2
  16. A+A^\ast 的特徵值為 \lambda_1+\overline{\lambda_1},\ldots,\lambda_n+\overline{\lambda_n}
  17. \hbox{trace}(A^\ast A)^2=\hbox{trace}\left((A^\ast)^2A^2\right)
  18. (A^\ast A)^2=(A^\ast)^2A^2
  19. 對於所有的 \mathbf{x}\in\mathbb{C}^n\Vert A\mathbf{x}\Vert=\Vert A^\ast \mathbf{x}\Vert
  20. 對於所有的 \mathbf{x},\mathbf{y}\in\mathbb{C}^n\mathbf{x}^\ast A^\ast A\mathbf{y}=\mathbf{x}AA^\ast\mathbf{y}
  21. A+A^\astA-A^\ast 是可交換矩陣;
  22. AB=BA,則 A^\ast B=BA^\ast
  23. A 的極分解為 A=UP,則 UP=PU
  24. A 的極分解為 A=UP,則 AP=PA
  25. A^\ast A-AA^\ast 是一個半正定矩陣;

 
(2)\Leftrightarrow(1):整個論述核心在於將 A 三角化為 U^\ast AU=T,其中 U 是一個么正矩陣,T 是一個上三角矩陣,由此推論 A^\ast A=AA^\ast 等價於 T^\ast T=TT^\ast,而後者又等價於 T 是對角矩陣,詳細證明見“每週問題 November 10, 2014”。

(3)\Leftrightarrow(2):A 可么正對角化為 U^\ast AU=\hbox{diag}(\lambda_1,\ldots,\lambda_n) 等價於 AU=U\hbox{diag}(\lambda_1,\ldots,\lambda_n)U^\ast=U^{-1},或表示為 A\mathbf{u}_j=\lambda_j\mathbf{u}_j1\le j\le n,其中 \mathbf{u}_jU 的第 j 個行向量 (column vector)。因為 U^\ast U=I,即 \mathbf{u}_i^\ast\mathbf{u}_j=1i=j\mathbf{u}_i^\ast\mathbf{u}_j=0i\neq j,可知 A 的特徵向量 \{\mathbf{u}_1,\ldots,\mathbf{u}_n\} 組成 \mathbb{C}^n 的一組單範正交基底。

(4)\Rightarrow(1):設 A=U\begin{bmatrix}  B&0\\  0&D  \end{bmatrix}U^\ast,其中 U^\ast=U^{-1}B^\ast B=BB^\astD^\ast D=DD^\ast。因為 \begin{bmatrix}  B&0\\  0&D  \end{bmatrix}\begin{bmatrix}  B^\ast&0\\  0&D^\ast  \end{bmatrix} 可交換,引理1表明 U\begin{bmatrix}  B&0\\  0&D  \end{bmatrix}U^\astU\begin{bmatrix}  B^\ast&0\\  0&D^\ast  \end{bmatrix}U^\ast 可交換,即 A^\ast A=AA^\ast

(1)\Rightarrow(4):設 A^\ast A=AA^\ast,代入 A=\begin{bmatrix}  B&C\\  0&D  \end{bmatrix},可得

\displaystyle  \begin{bmatrix}  B^\ast B&B^\ast C\\  C^\ast B&C^\ast C+D^\ast D  \end{bmatrix}=\begin{bmatrix}  BB^\ast+CC^\ast&CD^\ast\\  DC^\ast&DD^\ast  \end{bmatrix}

因此,B^\ast B=BB^\ast+CC^\astC^\ast C+D^\ast D=DD^\ast。第一式取跡數,使用循環不變性,

\hbox{trace}(B^\ast B)=\hbox{trace}(BB^\ast+CC^\ast)=\hbox{trace}(B^\ast B)+\hbox{trace}(C^\ast C)

即得 \hbox{trace}(C^\ast C)=0,引理2說明 C=0,上面兩式變成 B^\ast B=BB^\astD^\ast D=DD^\ast

(5)\Rightarrow(3):假設 \mathbf{x}A 的一個單位特徵向量,A\mathbf{x}=\lambda\mathbf{x}\mathcal{X}=\text{span}\{\mathbf{x}\}A 的一個不變子空間,則 \mathcal{X}^\perp 是一個不變子空間。對於限定算子 (restriction) A_{/\mathcal{X}^\perp}:\mathcal{X}^\perp\to\mathcal{X}^\perp,我們可以找到一個單位特徵向量 \mathbf{x}'\in\mathcal{X}^\perp 使得 A\mathbf{x}'=\lambda'\mathbf{x}' (見“拒絕行列式的特徵分析”)。令 \mathcal{X}'=\text{span}\{\mathbf{x},\mathbf{x}'\}。明顯地,\mathcal{X}' 是一個不變子空間,故 (\mathcal{X}')^\perp 是一個不變子空間。限定算子 A_{/(\mathcal{X}')^\perp}:(\mathcal{X}')^\perp\to(\mathcal{X}')^\perp 給出另一個單位特徵向量 \mathbf{x}''\in(\mathcal{X}')^\perp 使得 A\mathbf{x}''=\lambda''\mathbf{x}''。重複此程序,可得 An 個單範正交特徵向量。

(4)\Rightarrow(5):若 \mathcal{X}\subseteq\mathbb{C}^nA 的一個不變子空間,設 \dim \mathcal{X}=k\mathcal{X} 有一組單範正交基底 \{\mathbf{u}_1,\ldots,\mathbf{u}_k\}1\le k\le n。據此,A\mathbf{u}_j=b_{1j}\mathbf{u}_1+\cdots+b_{kj}\mathbf{u}_k1\le j\le k。將 \mathcal{X} 的基底擴充為 \mathbb{C}^n 的一組單範正交基底 \{\mathbf{u}_1,\ldots,\mathbf{u}_n\},顯然 \{\mathbf{u}_{k+1},\ldots,\mathbf{u}_n\}\mathcal{X}^\perp 的一組基底。寫出

A\begin{bmatrix}  \mathbf{u}_1&\cdots&\mathbf{u}_n  \end{bmatrix}=\begin{bmatrix}  \mathbf{u}_1&\cdots&\mathbf{u}_n  \end{bmatrix}\begin{bmatrix}  B&C\\  0&D  \end{bmatrix}

其中 B=[b_{ij}]k\times k 階分塊。令么正矩陣 U=\begin{bmatrix}  \mathbf{u}_1&\cdots&\mathbf{u}_n  \end{bmatrix}。因為 U^\ast AU=\begin{bmatrix}  B&C\\  0&D  \end{bmatrix} 推得 C=0,即有 A\begin{bmatrix}  \mathbf{u}_{k+1}&\cdots&\mathbf{u}_n  \end{bmatrix}=\begin{bmatrix}  \mathbf{u}_{k+1}&\cdots&\mathbf{u}_n  \end{bmatrix}D,證明 \mathcal{X}^\perpA 的一個不變子空間。

(6)\Rightarrow(3):假設 \mathbf{x}A 的一個單位特徵向量,A\mathbf{x}=\lambda\mathbf{x}\mathcal{X}=\text{span}\{\mathbf{x}\}A 的一個不變子空間,則 \mathcal{X}^\perp 是一個不變子空間。對於限定算子 A_{/\mathcal{X}^\perp}:\mathcal{X}^\perp\to\mathcal{X}^\perp,我們可以找到一個單位特徵向量 \mathbf{y}\in\mathcal{X}^\perp 使得 A\mathbf{y}=\lambda'\mathbf{y}。令 \mathcal{Y}=\text{span}\{\mathbf{x}\}+\hbox{span}\{\mathbf{y}\}。因此,\mathcal{Y}^\perp=\hbox{span}\{\mathbf{x}\}^\perp\cap \hbox{span}\{\mathbf{y}\}^\perp (見“每週問題 December 12, 2011”)。對於任一 \mathbf{u}\in\mathcal{Y}^\perp,即 \mathbf{u}\in\hbox{span}\{\mathbf{x}\}^\perp\mathbf{u}\in\hbox{span}\{\mathbf{y}\}^\perp,恆有 A\mathbf{u}\in\hbox{span}\{\mathbf{x}\}^\perpA\mathbf{u}\in\hbox{span}\{\mathbf{y}\}^\perp,也就是說 A\mathbf{u}\in\mathcal{Y}^\perp,因此 \mathcal{Y}^\perp 是一個不變子空間。限定算子 A_{/\mathcal{Y}^\perp}:\mathcal{Y}^\perp\to\mathcal{Y}^\perp 給出另一個單位特徵向量 \mathbf{z}\in\mathcal{Y}^\perp 使得 A\mathbf{z}=\lambda''\mathbf{z}。重複此程序,可得 An 個單範正交特徵向量。

(3)\Rightarrow(6):假設 \mathbf{u}_1,\ldots,\mathbf{u}_nA 的特徵向量構成的 \mathbb{C}^n 的一組單範正交基底,且 A\mathbf{u}_i=\lambda_i\mathbf{u}_i1\le i\le n。在不失一般性的原則下,設 \mathbf{x}=\mathbf{u}_1,對於任一 \mathbf{y}\in\hbox{span}\{\mathbf{x}\}^\perp,寫出 \mathbf{y}=c_2\mathbf{u}_2+\cdots+c_n\mathbf{u}_n,故 A\mathbf{y}=c_2\lambda_2\mathbf{u}_2+\cdots+c_n\lambda_n\mathbf{u}_n\in\hbox{span}\{\mathbf{x}\}^\perp,證明 \hbox{span}\{\mathbf{x}\}^\perpA 的一個不變子空間。

(7)\Rightarrow(1):假設存在 \lambda_1,\ldots,\lambda_n 使得 A=\sum_{i=1}^n\lambda_iE_i,其中 E_i^2=E_i=E_i^\astE_iE_j=0i\neq j。使用上述性質計算,可得

\displaystyle\begin{aligned}  A^\ast A&=\left(\sum_{i=1}^n\lambda_iE_i\right)^\ast\left(\sum_{j=1}^n\lambda_jE_j\right)  =\sum_{i=1}^n\sum_{j=1}^n\overline{\lambda_i}\lambda_jE_i^\ast E_j\\  &=\sum_{i=1}^n\sum_{j=1}^n\overline{\lambda_i}\lambda_jE_i E_j=\sum_{i=1}^n\vert \lambda_i\vert^2E_i^2  =\sum_{i=1}^n\vert \lambda_i\vert^2E_i  \end{aligned}

\displaystyle\begin{aligned}  AA^\ast&=\left(\sum_{i=1}^n\lambda_iE_i\right)\left(\sum_{j=1}^n\lambda_jE_j\right)^\ast  =\sum_{i=1}^n\sum_{j=1}^n\lambda_i\overline{\lambda_j}E_iE_j^\ast\\  &=\sum_{i=1}^n\sum_{j=1}^n\lambda_i\overline{\lambda_j}E_i E_j=\sum_{i=1}^n\vert \lambda_i\vert^2E_i^2  =\sum_{i=1}^n\vert \lambda_i\vert^2E_i.  \end{aligned}

(2)\Rightarrow(7):令 U=\begin{bmatrix}  \mathbf{u}_1&\cdots&\mathbf{u}_n  \end{bmatrix}。寫出 A 的么正對角化形式,展開如下:

\displaystyle\begin{aligned}  A&=U\hbox{diag}(\lambda_1,\ldots,\lambda_n)U^\ast=\begin{bmatrix}  \mathbf{u}_1&\cdots&\mathbf{u}_n  \end{bmatrix}\begin{bmatrix}  \lambda_1&&\\  &\ddots&\\  &&\lambda_n  \end{bmatrix}\begin{bmatrix}  \mathbf{u}_1^\ast\\  \vdots\\  \mathbf{u}_n^\ast  \end{bmatrix}\\  &=\lambda_1\mathbf{u}_1\mathbf{u}_1^\ast+\cdots+\lambda_n\mathbf{u}_n\mathbf{u}_n^\ast.  \end{aligned}

E_i=\mathbf{u}_i\mathbf{u}_i^\ast1\le i\le n。因此,E_i^\ast=(\mathbf{u}_i\mathbf{u}_i^\ast)^\ast=\mathbf{u}_i\mathbf{u}_i^\ast=E_i。使用 U^\ast U=I,可推得 E_i^2=\mathbf{u}_i\mathbf{u}_i^\ast\mathbf{u}_i\mathbf{u}_i^\ast=\mathbf{u}_i\mathbf{u}_i^\ast=E_i 且當 i\neq jE_iE_j=\mathbf{u}_i\mathbf{u}_i^\ast\mathbf{u}_j\mathbf{u}_j=0。使用 UU^\ast=I,可得 \sum_{i=1}^nE_i=\sum_{i=1}^n\mathbf{u}_i\mathbf{u}_i^\ast=UU^\ast=I

(8)\Rightarrow(1):若存在一多項式 p 使得 A^\ast=p(A),則

\displaystyle  A^\ast A=p(A)A=Ap(A)=AA^\ast

(2)\Rightarrow(8):假設 A 可么正對角化為 A=U\Lambda U^\ast,其中 \Lambda=\hbox{diag}(\lambda_1,\ldots,\lambda_n),則 A^\ast=U\Lambda^\ast U^\ast。考慮一多項式 p 使得 p(\lambda_i)=\overline{\lambda}_ii=1,\ldots,n (見“線性世界的根基──疊加原理”)。所以,

p(\Lambda)=\begin{bmatrix}  p(\lambda_1)&&\\  &\ddots&\\  &&p(\lambda_n)  \end{bmatrix}=\begin{bmatrix}  \overline{\lambda}_1&&\\  &\ddots\\  &&\overline{\lambda}_n  \end{bmatrix}=\Lambda^\ast

也就有矩陣多項式 (見“矩陣函數 (上)”)

\displaystyle  p(A)=Up(\Lambda)U^\ast=U\Lambda^\ast U^\ast=A^\ast

(9)\Rightarrow(4) 與 (1)\Rightarrow(9):證明見“每週問題 June 15, 2015”。

(10)\Rightarrow(1) 與 (2)\Rightarrow(10):證明見“每週問題 September 7, 2015”。

(11)\Leftrightarrow(1):證明見“特殊矩陣 (2):正規矩陣”。

(12)\Leftrightarrow(2):證明見“特殊矩陣 (2):正規矩陣”。

(13)\Rightarrow(12):假設 A 的奇異值為 \sigma_i=\vert\lambda_i\vert。因為 A^\ast A 的特徵值為 \sigma_1^2,\ldots,\sigma_n^2

\displaystyle  \hbox{trace}(A^\ast A)=\sigma_1^2+\cdots+\sigma_n^2=\vert\lambda_1\vert^2+\cdots+\vert\lambda_n\vert^2

(2)\Rightarrow(13):設 A=U\Lambda U^\ast 為么正對角化形式,其中 \Lambda=\hbox{diag}(\lambda_1,\ldots,\lambda_n),計算可得

\displaystyle  A^\ast A=(U\Lambda U^\ast)^\ast(U\Lambda U^\ast)=U\Lambda^\ast\Lambda U^\ast=U\hbox{diag}(\vert\lambda_1\vert^2,\ldots,\vert\lambda_n\vert^2)U^\ast

A 的奇異值為 \vert\lambda_1\vert,\ldots,\vert\lambda_n\vert

(14)\Rightarrow(13):跡數是線性函數並有循環不變性,因此

\begin{aligned}  \hbox{trace}(A+A^\ast)^2&=\hbox{trace}(A^2+AA^\ast+A^\ast A+(A^\ast)^2)\\  &=\hbox{trace}A^2+2\,\hbox{trace}(A^\ast A)+\hbox{trace}(A^\ast)^2,  \end{aligned}

或寫為

\displaystyle  \hbox{trace}(A^\ast A)=\frac{1}{2}\left(\hbox{trace}(A+A^\ast)^2-\hbox{trace}A^2-\hbox{trace}(A^\ast)^2\right)

A 可三角化為 U^\ast AU=T=[t_{ij}],其中 U^\ast=U^{-1}t_{ii}=\lambda_i。使用跡數循環不變性,\hbox{trace}A^2=\hbox{trace}(UT^2U^\ast)=\hbox{trace}(T^2U^\ast U)=\hbox{trace}T^2。類似地,\hbox{trace}(A^\ast)^2=\hbox{trace}(T^\ast)^2。若 \sum_{i=1}^n\left(\hbox{Re}\lambda_i\right)^2=\frac{1}{4}\hbox{trace}(A+A^\ast)^2,使用 (\hbox{Re}\lambda_i)^2=\left(\frac{\lambda_i+\overline{\lambda_i}}{2}\right)^2=\frac{1}{4}(\lambda_i+\overline{\lambda_i})^2\hbox{trace}T^2=\sum_{i=1}^n\lambda_i^2\hbox{trace}(T^\ast)^2=\sum_{i=1}^n\overline{\lambda_i}^2,可得

\displaystyle\begin{aligned}  \hbox{trace}(A^\ast A)  &=\frac{1}{2}\left(\hbox{trace}(A+A^\ast)^2-\hbox{trace}T^2-\hbox{trace}(T^\ast)^2\right)\\  &=\frac{1}{2}\left(\sum_{i=1}^n(\lambda_i+\overline{\lambda_i})^2-\sum_{i=1}^n\lambda_i^2-\sum_{i=1}^n\overline{\lambda_i}^2\right)\\  &=\sum_{i=1}^n\vert\lambda_i\vert^2.  \end{aligned}

(2)\Rightarrow(14):設 A=U\Lambda U^\ast 為么正對角化形式,\Lambda=\hbox{diag}(\lambda_1,\ldots,\lambda_n),計算可得

\displaystyle\begin{aligned}  \hbox{trace}(A+A^\ast)^2&=\hbox{trace}(U(\Lambda+\Lambda^\ast)U^\ast)^2=\hbox{trace}(U(\Lambda+\Lambda^\ast)^2U^\ast)\\  &=\hbox{trace}((\Lambda+\Lambda^\ast)^2U^\ast U)=\hbox{trace}(\Lambda+\Lambda^\ast)^2\\  &=\sum_{i=1}^n\left(\lambda_i+\overline{\lambda_i}\right)^2=4\sum_{i=1}^n(\hbox{Re}\lambda_i)^2.  \end{aligned}

(15)\Rightarrow(13) 與 (2)\Rightarrow(15):類似 (14)\Rightarrow(13) 與 (2)\Rightarrow(14)。

(16)\Rightarrow(14):假設 A+A^\ast 的特徵值為 \lambda_1+\overline{\lambda_1},\ldots,\lambda_n+\overline{\lambda_n},則 (A+A^\ast)^2 的特徵值為 (\lambda_1+\overline{\lambda_1})^2,\ldots,(\lambda_n+\overline{\lambda_n})^2。因此,

\displaystyle  \hbox{trace}(A+A^\ast)^2=\sum_{i=1}^n\left(\lambda_i+\overline{\lambda_i}\right)^2=4\sum_{i=1}^n(\hbox{Re}\lambda_i)^2

(2)\Rightarrow(16):設 A=U\Lambda U^\ast 為么正對角化形式,\Lambda=\hbox{diag}(\lambda_1,\ldots,\lambda_n),立得 A+A^\ast=U(\Lambda+\Lambda^\ast)U^\ast,故 A+A^\ast 的特徵值為 \lambda_1+\overline{\lambda_1},\ldots,\lambda_n+\overline{\lambda_n}

(17)\Rightarrow(1):假設 \hbox{trace}(A^\ast A)^2=\hbox{trace}\left((A^\ast)^2A^2\right)。計算 A^\ast A-AA^\ast 的 Frobenius 範數 (見“矩陣範數”):

\begin{aligned}  \Vert A^\ast A-AA^\ast\Vert^2_F&=\hbox{trace}(A^\ast A-AA^\ast)^\ast(A^\ast A-AA^\ast)=\hbox{trace}(A^\ast A-AA^\ast)^2\\  &=\hbox{trace}(A^\ast AA^\ast A)-\hbox{trace}(A^\ast AAA^\ast)-\hbox{trace}(AA^\ast A^\ast A)+\hbox{trace}(AA^\ast AA^\ast)\\  &=\hbox{trace}(A^\ast AA^\ast A)-\hbox{trace}(A^\ast A^\ast AA)-\hbox{trace}(A^\ast A^\ast AA)+\hbox{trace}(A^\ast AA^\ast A)=0.  \end{aligned}

所以,A^\ast A-AA^\ast=0

(1)\Rightarrow(17):若 A^\ast A=AA^\ast,則

\hbox{trace}(A^\ast A)^2=\hbox{trace}(A^\ast AA^\ast A)=\hbox{trace}(A^\ast A^\ast AA)=\hbox{trace}\left((A^\ast)^2A^2\right)

(18)\Rightarrow(17):顯而易見。

(1)\Rightarrow(18):設 A^\ast A=AA^\ast,則

(A^\ast A)^2=A^\ast AA^\ast A=A^\ast A^\ast AA=(A^\ast)^2A^2

(19)\Leftrightarrow(1):直接計算

\begin{aligned}  \Vert A\mathbf{x}\Vert^2=\Vert A^\ast\mathbf{x}\Vert^2&\Leftrightarrow\mathbf{x}^\ast A^\ast A\mathbf{x}=\mathbf{x}^\ast AA^\ast\mathbf{x}\\  &\Leftrightarrow\mathbf{x}^\ast(A^\ast A-AA^\ast)\mathbf{x}=0  \end{aligned}

上式對每一 \mathbf{x}\in\mathbb{C}^n 皆成立等價於 A^\ast A-AA^\ast=0 (見“每週問題 April 4, 2011”)。

(20)\Rightarrow(19):設 \mathbf{x}=\mathbf{y},則每一 \mathbf{x}\in\mathbb{C}^n 使得 \mathbf{x}^\ast A^\ast A\mathbf{x}=\mathbf{x}^\ast AA^\ast\mathbf{x},即 \Vert A\mathbf{x}\Vert^2=\Vert A^\ast\mathbf{x}\Vert^2

(1)\Rightarrow(20):因為 AA^\ast=A^\ast A,故對於每一 \mathbf{x},\mathbf{y}\in\mathbb{C}^n\mathbf{x}^\ast A^\ast A\mathbf{y}=\mathbf{x}^\ast AA^\ast\mathbf{y}

(21)\Leftrightarrow(1):直接計算

\begin{aligned}  (A+A^\ast)(A-A^\ast)=(A-A^\ast)(A+A^\ast)&\Leftrightarrow A^\ast A-AA^\ast=AA^\ast-A^\ast A\\  &\Leftrightarrow A^\ast A=AA^\ast  \end{aligned}

(22)\Rightarrow(1):設 B=A,立即有 A^\ast A=AA^\ast

(2)\Rightarrow(22):假設 A=U\Lambda U^\ast 為么正對角化形式,\Lambda=\hbox{diag}(\lambda_1,\ldots,\lambda_n),則 AB=BA 蘊含 \Lambda U^\ast BU=U^\ast BU\Lambda。令 C=[c_{ij}]=U^\ast B U。上式簡化為 \Lambda C-C\Lambda=0,乘開可得 (\lambda_i-\lambda_j)c_{ij}=0,包含兩種情況:c_{ij}=0\lambda_i=\lambda_j,即有 (\overline{\lambda_i}-\overline{\lambda_j})c_{ij}=01\le i,j\le n。再從 \Lambda^\ast C=C\Lambda^\ast 可得 \Lambda^\ast U^\ast BU=U^\ast BU\Lambda^\ast,推論 A^\ast B=BA^\ast

(23)\Leftrightarrow(1):假設 A=UP,其中 U^\ast=U^{-1}P 是半正定。計算如下:

\begin{aligned}  A^\ast A=AA^\ast&\Leftrightarrow (UP)^\ast(UP)=(UP)(UP)^\ast\\  &\Leftrightarrow P^\ast P=UPP^\ast U^\ast\\  &\Leftrightarrow P^2=UP^2U^\ast\\  &\Leftrightarrow P=UPU^\ast\\  &\Leftrightarrow PU=UP  \end{aligned}

上面倒數第二個步驟在等號兩邊取平方根 (見“半正定矩陣的偏序關係”)。

(24)\Rightarrow(23):假設 A=UP,其中 U^\ast=U^{-1}P 是一個半正定矩陣。若 AP=PA,則 UP^2=PUP。若 P 可逆,則 UP=PU。若 P 不可逆,則 r=\hbox{rank}A=\hbox{rank}P<n。因為 P 是半正定,寫出正交對角化形式

P=V\begin{bmatrix}  D&0\\  0&0  \end{bmatrix}V^\ast

其中 V^\ast=V^{-1}D 是一個 r\times r 階正定對角矩陣。將上式代入 UP^2=PUP

UV\begin{bmatrix}  D^2&0\\  0&0  \end{bmatrix}V^\ast=V\begin{bmatrix}  D&0\\  0&0  \end{bmatrix}V^\ast UV\begin{bmatrix}  D&0\\  0&0  \end{bmatrix}V^\ast

等號兩邊左乘 V^\ast,右乘 V,並令 W=\begin{bmatrix}  W_1&W_2\\  W_3&W_4  \end{bmatrix}=V^\ast UV,其中 W_1r\times r 階分塊,可得

\begin{bmatrix}  W_1&W_2\\  W_3&W_4  \end{bmatrix}\begin{bmatrix}  D^2&0\\  0&0  \end{bmatrix}=\begin{bmatrix}  D&0\\  0&0  \end{bmatrix}\begin{bmatrix}  W_1&W_2\\  W_3&W_4  \end{bmatrix}\begin{bmatrix}  D&0\\  0&0  \end{bmatrix}

乘開即得 W_1D^2=DW_1DW_3D^2=0。但 D 可逆,故 W_1D=DW_1W_3=0。再者,W 是一個么正矩陣 (么正矩陣之積仍為么正矩陣),W^\ast=W^{-1},其中 W^\ast 是分塊下三角矩陣,W^{-1} 是分塊上三角矩陣,因此 W 是一個分塊對角矩陣 (即 W_2=0)。所以,

W\begin{bmatrix}  D&0\\  0&0  \end{bmatrix}=\begin{bmatrix}  D&0\\  0&0  \end{bmatrix}W

或寫為

V^\ast UV\begin{bmatrix}  D&0\\  0&0  \end{bmatrix}=\begin{bmatrix}  D&0\\  0&0  \end{bmatrix}V^\ast UV

等號兩邊左乘 V,右乘 V^\ast,即得 UP=PU

(23)\Rightarrow(24):若 A=UPUP=PU,則 AP=UPP=PUP=PA

(25)\Rightarrow(1):若 A^\ast A-AA^\ast 是半正定,由引理2可知 \hbox{trace}(A^\ast A-AA^\ast)=0 等價於 A^\ast A-AA^\ast=0

(1)\Rightarrow(25):若 A^\ast A=AA^\ast,顯然 A^\ast A-AA^\ast =0 是半正定。

 
以上證明顯示可么正對角化是最常被使用,也是最重要的正規矩陣等價條件。利用正規矩陣的定義式或么正對角化形式不難證明下列性質,這個工作留給讀者完成:

  • A 是一個正規矩陣,則 AA^\ast 有相同的行空間 (column space) 和零空間 (nullspace),記為 C(A)=C(A^\ast)N(A)=N(A^\ast)
  • A 是一個正規矩陣,則 \mathbb{C}^n=C(A)\oplus N(A)\mathbb{C}^n=C(A^\ast)\oplus N(A^\ast)
  • AB 是正規矩陣且 AB=BA,則 AB 是一個正規矩陣。
  • AB 是正規矩陣且 AB^\ast=B^\ast A,則 ABBA 是正規矩陣。
  • ABAB 是正規矩陣,則 BA 是一個正規矩陣。
  • AB 是正規矩陣,則 A+iB 是一個正規矩陣等價於 A^\ast B+AB^\ast 是一個 Hermitian 矩陣。

 
參考來源:
[1] Fuzhen Zhang, Matrix Theory: Basic Results and Techniques, 2nd edition, Springer, 2011, pp 302.

[2] Robert Grone, Charles R. Johnson, Eduardo M. Sa and Henry Wolkowicz, Normal matrices, Linear Algebra and its Applications, Vol. 87, 1987, pp 213-225.

廣告
本篇發表於 線性代數專欄, 二次型 並標籤為 , , , , , , , , 。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s