特殊矩陣 (2):正規矩陣

本文的閱讀等級:中級

基礎線性代數曾經介紹實對稱矩陣是正交可對角化 (orthogonally diagonalizable),其特徵向量組成完整的單範正交集 (orthonormal set),詳見“實對稱矩陣可正交對角化的證明”。還有哪些矩陣也是正交可對角化?要完整的回答此問題,必須將實數系延伸至複數系 (見“從實數系到複數系”)。令 A 為一 n\times n 階複矩陣。若 AA^{\ast} 是可交換矩陣,即

A^{\ast}A=AA^{\ast}

A 稱為正規 (normal) 矩陣。正規矩陣最重要的等價性質是可么正對角化 (unitarily diagonalizable),非正規矩陣不可么正對角化。么正對角化是說 A=UDU^\ast,其中 U 是一個么正 (unitary) 矩陣,U^\ast=U^{-1},且 D 是一個對角矩陣。

 
正規矩陣可么正對角化的證明包含兩個步驟:

  1. A 是一正規矩陣,則上三角矩陣 T=U^{-1}AU 也是正規矩陣。
  2. T 是上三角矩陣且 T 是正規矩陣,則 T 是對角矩陣。

利用 Schur 定理,任意矩陣 A 都可以被三角化為 A=UTU^\ast,其中 T 是上三角矩陣,U 是么正矩陣,U^{\ast}=U^{-1} (見“矩陣三角化的 Schur 定理”)。考慮 T=U^\ast AU,就有

T^{\ast}T=U^{\ast}A^{\ast}UU^\ast AU=U^\ast A^{\ast}AU

代入 A^{\ast}A=AA^{\ast},可得

T^{\ast}T=U^\ast AA^{\ast}U=U^{\ast}AUU^\ast A^\ast U=TT^\ast

證得 T 也是正規矩陣。第二個步驟僅考慮 T3\times 3 階矩陣以方便說明 (完整證明見“每週問題 November 10, 2014”),

T=\begin{bmatrix}  \lambda_1&a&b\\  0&\lambda_2&c\\  0&0&\lambda_3  \end{bmatrix}

因為 T 相似於 AT 的主對角元 \lambda_1,\lambda_2,\lambda_3 即為 A 的特徵值。乘開 T^{\ast}TTT^{\ast},下面僅顯示主對角元:

\begin{aligned} T^\ast T&=\begin{bmatrix} \overline{\lambda_1}&0&0\\ \overline{a}&\overline{\lambda_2}&0\\ \overline{b}&\overline{c}&\overline{\lambda_3} \end{bmatrix}\begin{bmatrix}  \lambda_1&a&b\\  0&\lambda_2&c\\  0&0&\lambda_3  \end{bmatrix} =\begin{bmatrix} \vert\lambda_1\vert^2&\ast&\ast\\ \ast&\vert\lambda_2\vert^2+\vert a\vert^2&\ast\\ \ast&\ast&\vert\lambda_3\vert^2+\vert b\vert^2+\vert c\vert^2 \end{bmatrix}\\ TT^\ast&=\begin{bmatrix}  \lambda_1&a&b\\  0&\lambda_2&c\\  0&0&\lambda_3  \end{bmatrix}\begin{bmatrix} \overline{\lambda_1}&0&0\\ \overline{a}&\overline{\lambda_2}&0\\ \overline{b}&\overline{c}&\overline{\lambda_3}\end{bmatrix}=\begin{bmatrix} \vert\lambda_1\vert^2+\vert a\vert^2+\vert b\vert^2&\ast&\ast\\ \ast&\vert\lambda_2\vert^2+\vert c\vert^2&\ast\\ \ast&\ast&\vert\lambda_3\vert^2 \end{bmatrix}. \end{aligned}

因為 T^{\ast}T=TT^{\ast},比較等號兩邊矩陣的主對角元推得 \vert a\vert^2=\vert b\vert^2=\vert c\vert^2=0,即 a=b=c=0,證明 T 是對角矩陣。

 
A 可么正對角化為 A=U\Lambda U^\ast,其中 \Lambda=\hbox{diag}(\lambda_1,\ldots,\lambda_n),則

\displaystyle\begin{aligned} A^\ast A&=(U\Lambda U^\ast)^\ast (U\Lambda U^\ast)=U\Lambda^\ast U^\ast U\Lambda U^\ast \\ &=U\Lambda^\ast \Lambda U^\ast=U\Lambda\Lambda^\ast U^\ast\\ &=U\Lambda U^\ast U\Lambda^\ast U^\ast=AA^\ast, \end{aligned}

證明 A 是一正規矩陣。

 
哪些我們熟知的矩陣是正規矩陣?

  1. 實對稱矩陣是正規矩陣。若 A=A^T,則 A^TA=AA^T=A^2\Lambda 為實矩陣,U=Q 則是正交矩陣。
  2. Hermitian 矩陣,即共軛對稱矩陣是正規矩陣。若 A=A^{\ast},則 A^{\ast}A=AA^{\ast}=A^2\Lambda 也是實矩陣。
  3. 么正矩陣 (unitary matrix) 與實正交矩陣也是正規矩陣。若 U^{\ast}=U^{-1},則 U^{\ast}U=UU^{\ast}=I,且 \vert\lambda_i\vert=1
  4. 反共軛對稱矩陣 (skew-Hermitian) 矩陣亦是正規矩陣。若 A^{\ast}=-A,則 A^{\ast}A=AA^{\ast}=-A^2,特徵值 \lambda_i 為純虛數。

 
以下是正規矩陣 A=[a_{ij}] 的等價條件:

  1. A 可么正對角化為 A=U\Lambda U^\ast,其中 \Lambda=\hbox{diag}(\lambda_1,\ldots,\lambda_n)\lambda_1,\ldots,\lambda_nA 的特徵值,U 是么正矩陣,U^\ast=U^{-1}
  2. A=B+iCi=\sqrt{-1},其中 BC 是可交換 (即 BC=CB) Hermitian 矩陣。
  3. \sum_{i=1}^n\vert\lambda_i\vert^2=\sum_{i=1}^n\sum_{j=1}^n\vert a_{ij}\vert^2

 
(1) 已經證明完畢,我們考慮陳述 (2) 和 (3)。

(2) 首先我們證明任一矩陣 A 有唯一的卡氏分解 A=B+iC,其中 BC 是 Hermitian 矩陣 (iC 是 skew-Hermitian 矩陣)。假設卡氏分解成立,則 A^\ast=B^\ast-iC^\ast=B-iC,由上面兩式可解出 B=(A+A^\ast)/2C=(A-A^\ast)/(2i)。不難確認 (A+A^\ast)/2(A-A^\ast)/(2i) 是 Hermitian。使用 A^\ast=B-iC,可得

\displaystyle \begin{aligned} A^\ast A&=(B-iC)(B+iC)=B^2+C^2+i(BC-CB)\\ AA^\ast&=(B+iC)(B-iC)=B^2+C^2-i(BC-CB).\end{aligned}

所以 A^\ast A=AA^\ast 等價於 BC=CB

(3) 使用 Schur 定理 A=UTU^\ast,則 A^\ast A=UT^\ast TU^\ast。利用跡數循環不變性,

\displaystyle \hbox{trace}(A^\ast A)=\hbox{trace}(UT^\ast TU^\ast)=\hbox{trace}(T^\ast TU^\ast U)=\hbox{trace}(T^\ast T)

寫出跡數的表達式,

\displaystyle \hbox{trace}(A^\ast A)=\sum_{i=1}^n\sum_{j=1}^n\overline{a_{ij}}a_{ij}=\sum_{i=1}^n\sum_{j=1}^n\vert a_{ij}\vert^2

\displaystyle \hbox{trace}(T^\ast T)=\sum_{i=1}^n\sum_{j=1}^n\vert t_{ij}\vert^2=\sum_{i=1}^n\vert t_{ii}\vert^2+\sum_{i<j}\vert t_{ij}\vert^2

因為 t_{ii}=\lambda_ii=1,\ldots,n\hbox{trace}(A^\ast A)=\sum_{i=1}^n\vert\lambda_i\vert^2 等價於 t_{ij}=0i<j,也就是 T 是對角矩陣,A 可么正對角化,再由 (1) 即得證。

 
接著我們討論正規矩陣的性質。

性質一N(A^\ast)=N(A)C(A^\ast)=C(A)

因為

\displaystyle \Vert A^\ast\mathbf{x}\Vert^2=(A^\ast\mathbf{x})^\ast(A^\ast\mathbf{x})=\mathbf{x}^\ast AA^\ast\mathbf{x}=\mathbf{x}^\ast A^\ast A\mathbf{x}=(A\mathbf{x})^\ast(A\mathbf{x})=\Vert A\mathbf{x}\Vert^2

可知 A^\ast\mathbf{x}=\mathbf{0} 同義於 A\mathbf{x}=\mathbf{0}。若 A^\ast\mathbf{x}=\mathbf{0},對於任一 \mathbf{y},就有 \mathbf{x}^\ast(A\mathbf{y})=(A^\ast\mathbf{x})^\ast\mathbf{y}=0,表明 \mathbf{x}\in C(A)^\perp。反向陳述也成立,所以 C(A)=N(A^\ast)^\perp,將 A 替換為 A^\ast,即得 C(A^\ast)=N(A)^\perp (這個結果也稱為線性代數的第二個基本定理)。由於 N(A^\ast)=N(A),故可推論 C(A^\ast)=C(A)

 
性質二\mathbb{C}^n=N(A)\oplus C(A)\mathbb{C}^n=N(A^\ast)\oplus C(A^\ast)

性質二是性質一的必然結果。因為 C(A)=C(A^\ast)=N(A)^\perp=N(A^\ast)^\perp,根據秩─零度定理 n=\dim C(A)+\dim N(A)=\dim C(A^\ast)+N(A^\ast) 即得證。

 
性質三AA^\ast 有相同的特徵向量。

A 是正規矩陣,很容易證明 A-\lambda I 也是正規矩陣。根據性質一,N(A-\lambda I)=N(A^\ast-\overline{\lambda}I),這意味若 A 有特徵值 \lambda,則 A^\ast 有特徵值 \overline{\lambda},且 A 的特徵向量等於 A^\ast 的特徵向量。

 
性質四A^\ast 可表示為 A 的多項式。

A=U\Lambda U^\ast,則 A^\ast=U\Lambda^\ast U^\ast,其中 \Lambda^\ast=\hbox{diag}(\overline{\lambda}_1,\ldots,\overline{\lambda}_n)。考慮一多項式 p 使得 p(\lambda_i)=\overline{\lambda}_ii=1,\ldots,n (見“線性世界的根基──疊加原理”)。所以,

p(\Lambda)=\begin{bmatrix} p(\lambda_1)&&\\ &\ddots&\\ &&p(\lambda_n) \end{bmatrix}=\begin{bmatrix} \overline{\lambda}_1&&\\ &\ddots\\ &&\overline{\lambda}_n \end{bmatrix}=\Lambda^\ast

也就有矩陣多項式 (見“矩陣函數 (上)”)

\displaystyle p(A)=Up(\Lambda)U^\ast=U\Lambda^\ast U^\ast=A^\ast

 
性質三和性質四的反向命題也成立,也就說它們是正規矩陣的等價條件。

 
性質五:若 AB 是可交換正規矩陣,則 AB 是正規矩陣。

使用性質四,A^\ast=p(A)=\sum_{i}p_iA^iB^\ast=q(B)=\sum_jq_jB^j。因為 AB=BA,可得

\displaystyle\begin{aligned} (AB)^\ast(AB)&=B^\ast A^\ast AB=\left(\sum_jq_jB^j\right)\left(\sum_ip_iA^i\right)AB\\ &=\sum_{j}\sum_iq_jp_iB^jA^iAB=AB\sum_{j}\sum_{i}q_jp_iB^jA^i\\ &=AB\left(\sum_jq_jB^j\right)\left(\sum_ip_iA^i\right)=ABB^\ast A^\ast\\ &=(AB)(AB)^\ast.\end{aligned}

延伸閱讀:
This entry was posted in 特殊矩陣, 線性代數專欄 and tagged , , , , , , , , , , , . Bookmark the permalink.

6 則回應給 特殊矩陣 (2):正規矩陣

  1. Meiyue Shao 說:

    我建议性质三和四先列在前面比较好(证明可以放在后面),因为这些也是正规矩阵的等价条件,另外几条性质则不是。

    正规矩阵至少有数十条等价条件,有兴趣的读者可以参阅 http://dx.doi.org/10.1016/0024-3795(87)90168-6

    • ccjou 說:

      謝謝你提供的連結與建議。有空時我再增添對一般線性代數學者有用的等價性質(大約有10個吧),不過要安排出易讀的證明與順序還需要花點精神。

  2. chen yilun 說:

    周老师,您好,第一个证明正规矩阵可对角化中,仅对比T*T和TT*在主对角线上的相等,还存在解a=c=i, b=1,好像无法证明a=b=c=0吧?

    • ccjou 說:

      我將演算細節補充上去,請參考。不知這樣是否回答了你的問題?

      • chen yilun 說:

        明白了,原来考虑到复数域上的取模,此前没怎么接触过复数域上的运算,导致还麻烦您打了这么大个公式上去。太不好意思了。最近一直在学习您的博客,讲得比大陆的教科书好太多了,真的。在此表示真心的感谢!

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s