特殊矩陣 (2):正規矩陣

本文的閱讀等級:中級

基礎線性代數曾經介紹實對稱矩陣是正交可對角化的 (orthogonally diagonalizable),即特徵向量組成完整的單範正交集 (orthonormal set),詳見“實對稱矩陣可正交對角化的證明”。還有哪些矩陣也是正交可對角化?要完整的回答此問題,必須將實數系延伸至複數系 (見“從實數系到複數系”)。令 A 為一個 n\times n 階複矩陣。若 AA^{\ast} 是可交換矩陣,即

A^{\ast}A=AA^{\ast}

A 稱為正規矩陣 (normal matrix)。正規矩陣最重要的等價性質是可么正對角化 (unitarily diagonalizable),非正規矩陣不可么正對角化。么正對角化是說 A=UDU^\ast,其中 U 是一個么正 (unitary) 矩陣,U^\ast=U^{-1},且 D 是一個對角矩陣。

 
正規矩陣可么正對角化的證明包含兩個步驟:

  1. A 是正規矩陣,則上三角矩陣 T=U^{-1}AU 也是正規矩陣。
  2. T 是上三角矩陣且 T 是正規矩陣,則 T 是對角矩陣。

利用 Schur 定理,任意矩陣 A 都可以被三角化為 A=UTU^\ast,其中 T 是上三角矩陣,U 是么正矩陣,U^{\ast}=U^{-1} (見“矩陣三角化的 Schur 定理”)。考慮 T=U^\ast AU,就有

T^{\ast}T=U^{\ast}A^{\ast}UU^\ast AU=U^\ast A^{\ast}AU

代入 A^{\ast}A=AA^{\ast},可得

T^{\ast}T=U^\ast AA^{\ast}U=U^{\ast}AUU^\ast A^\ast U=TT^\ast

證得 T 也是正規矩陣。第二個步驟僅考慮 T3\times 3 階矩陣以方便說明 (完整證明見“每週問題 November 10, 2014”),

T=\begin{bmatrix}    \lambda_1&a&b\\    0&\lambda_2&c\\    0&0&\lambda_3    \end{bmatrix}

因為 T 相似於 AT 的主對角元 \lambda_1,\lambda_2,\lambda_3 即為 A 的特徵值。乘開 T^{\ast}TTT^{\ast},下面僅顯示主對角元:

\begin{aligned}  T^\ast T&=\begin{bmatrix}  \overline{\lambda_1}&0&0\\  \overline{a}&\overline{\lambda_2}&0\\  \overline{b}&\overline{c}&\overline{\lambda_3}  \end{bmatrix}\begin{bmatrix}    \lambda_1&a&b\\    0&\lambda_2&c\\    0&0&\lambda_3    \end{bmatrix}  =\begin{bmatrix}  \vert\lambda_1\vert^2&\ast&\ast\\  \ast&\vert\lambda_2\vert^2+\vert a\vert^2&\ast\\  \ast&\ast&\vert\lambda_3\vert^2+\vert b\vert^2+\vert c\vert^2  \end{bmatrix}\\  TT^\ast&=\begin{bmatrix}    \lambda_1&a&b\\    0&\lambda_2&c\\    0&0&\lambda_3    \end{bmatrix}\begin{bmatrix}  \overline{\lambda_1}&0&0\\  \overline{a}&\overline{\lambda_2}&0\\  \overline{b}&\overline{c}&\overline{\lambda_3}\end{bmatrix}=\begin{bmatrix}  \vert\lambda_1\vert^2+\vert a\vert^2+\vert b\vert^2&\ast&\ast\\  \ast&\vert\lambda_2\vert^2+\vert c\vert^2&\ast\\  \ast&\ast&\vert\lambda_3\vert^2  \end{bmatrix}.  \end{aligned}

因為 T^{\ast}T=TT^{\ast},比較等號兩邊矩陣的主對角元推得 \vert a\vert^2=\vert b\vert^2=\vert c\vert^2=0,即 a=b=c=0,證明 T 是對角矩陣。

 
A 可么正對角化為 A=U\Lambda U^\ast,其中 \Lambda=\hbox{diag}(\lambda_1,\ldots,\lambda_n),則

\displaystyle\begin{aligned}  A^\ast A&=(U\Lambda U^\ast)^\ast (U\Lambda U^\ast)=U\Lambda^\ast U^\ast U\Lambda U^\ast  \\  &=U\Lambda^\ast \Lambda U^\ast=U\Lambda\Lambda^\ast U^\ast\\  &=U\Lambda U^\ast U\Lambda^\ast U^\ast=AA^\ast,  \end{aligned}

證明 A 是一正規矩陣。

 
哪些我們熟知的矩陣是正規矩陣?

  1. 實對稱矩陣是正規矩陣。若 A=A^T,則 A^TA=AA^T=A^2\Lambda 為實矩陣,U=Q 則是正交矩陣。
  2. Hermitian 矩陣,即共軛對稱矩陣是正規矩陣。若 A=A^{\ast},則 A^{\ast}A=AA^{\ast}=A^2\Lambda 也是實矩陣。
  3. 么正矩陣 (unitary matrix) 與實正交矩陣也是正規矩陣。若 U^{\ast}=U^{-1},則 U^{\ast}U=UU^{\ast}=I,且 \vert\lambda_i\vert=1
  4. 反共軛對稱矩陣 (skew-Hermitian) 矩陣亦是正規矩陣。若 A^{\ast}=-A,則 A^{\ast}A=AA^{\ast}=-A^2,特徵值 \lambda_i 為純虛數。

 
以下是正規矩陣 A=[a_{ij}] 的等價條件:

  1. A 可么正對角化為 A=U\Lambda U^\ast,其中 \Lambda=\hbox{diag}(\lambda_1,\ldots,\lambda_n)\lambda_1,\ldots,\lambda_nA 的特徵值,U 是么正矩陣,U^\ast=U^{-1}
  2. A=B+iCi=\sqrt{-1},其中 BC 是可交換 (即 BC=CB) Hermitian 矩陣。
  3. \sum_{i=1}^n\vert\lambda_i\vert^2=\sum_{i=1}^n\sum_{j=1}^n\vert a_{ij}\vert^2

 
(1) 已經證明完畢,我們考慮陳述 (2) 和 (3)。

(2) 首先我們證明任一矩陣 A 有唯一的卡氏分解 A=B+iC,其中 BC 是 Hermitian 矩陣 (iC 是 skew-Hermitian 矩陣)。假設卡氏分解成立,則 A^\ast=B^\ast-iC^\ast=B-iC,由上面兩式可解出 B=(A+A^\ast)/2C=(A-A^\ast)/(2i)。不難確認 (A+A^\ast)/2(A-A^\ast)/(2i) 是 Hermitian。使用 A^\ast=B-iC,可得

\displaystyle \begin{aligned}  A^\ast A&=(B-iC)(B+iC)=B^2+C^2+i(BC-CB)\\  AA^\ast&=(B+iC)(B-iC)=B^2+C^2-i(BC-CB).\end{aligned}

所以 A^\ast A=AA^\ast 等價於 BC=CB

(3) 使用 Schur 定理 A=UTU^\ast,則 A^\ast A=UT^\ast TU^\ast。利用跡數循環不變性,

\displaystyle  \hbox{trace}(A^\ast A)=\hbox{trace}(UT^\ast TU^\ast)=\hbox{trace}(T^\ast TU^\ast U)=\hbox{trace}(T^\ast T)

寫出跡數的表達式,

\displaystyle  \hbox{trace}(A^\ast A)=\sum_{i=1}^n\sum_{j=1}^n\overline{a_{ij}}a_{ij}=\sum_{i=1}^n\sum_{j=1}^n\vert a_{ij}\vert^2

\displaystyle  \hbox{trace}(T^\ast T)=\sum_{i=1}^n\sum_{j=1}^n\vert t_{ij}\vert^2=\sum_{i=1}^n\vert t_{ii}\vert^2+\sum_{i<j}\vert t_{ij}\vert^2

因為 t_{ii}=\lambda_ii=1,\ldots,n\hbox{trace}(A^\ast A)=\sum_{i=1}^n\vert\lambda_i\vert^2 等價於 t_{ij}=0i<j,也就是 T 是對角矩陣,A 可么正對角化,再由 (1) 即得證。

 
接著我們討論正規矩陣的性質。

性質一N(A^\ast)=N(A)C(A^\ast)=C(A)

因為

\displaystyle  \Vert A^\ast\mathbf{x}\Vert^2=(A^\ast\mathbf{x})^\ast(A^\ast\mathbf{x})=\mathbf{x}^\ast AA^\ast\mathbf{x}=\mathbf{x}^\ast A^\ast A\mathbf{x}=(A\mathbf{x})^\ast(A\mathbf{x})=\Vert A\mathbf{x}\Vert^2

可知 A^\ast\mathbf{x}=\mathbf{0} 同義於 A\mathbf{x}=\mathbf{0}。若 A^\ast\mathbf{x}=\mathbf{0},對於任一 \mathbf{y},就有 \mathbf{x}^\ast(A\mathbf{y})=(A^\ast\mathbf{x})^\ast\mathbf{y}=0,表明 \mathbf{x}\in C(A)^\perp。反向陳述也成立,所以 C(A)=N(A^\ast)^\perp,將 A 替換為 A^\ast,即得 C(A^\ast)=N(A)^\perp (這個結果也稱為線性代數的第二個基本定理)。由於 N(A^\ast)=N(A),故可推論 C(A^\ast)=C(A)

 
性質二\mathbb{C}^n=N(A)\oplus C(A)\mathbb{C}^n=N(A^\ast)\oplus C(A^\ast)

性質二是性質一的必然結果。因為 C(A)=C(A^\ast)=N(A)^\perp=N(A^\ast)^\perp,根據秩─零度定理 n=\dim C(A)+\dim N(A)=\dim C(A^\ast)+N(A^\ast) 即得證。

 
性質三AA^\ast 有相同的特徵向量。

A 是正規矩陣,很容易證明 A-\lambda I 也是正規矩陣。根據性質一,N(A-\lambda I)=N(A^\ast-\overline{\lambda}I),這意味若 A 有特徵值 \lambda,則 A^\ast 有特徵值 \overline{\lambda},且 A 的特徵向量等於 A^\ast 的特徵向量。

 
性質四A^\ast 可表示為 A 的多項式。

A=U\Lambda U^\ast,則 A^\ast=U\Lambda^\ast U^\ast,其中 \Lambda^\ast=\hbox{diag}(\overline{\lambda}_1,\ldots,\overline{\lambda}_n)。考慮一多項式 p 使得 p(\lambda_i)=\overline{\lambda}_ii=1,\ldots,n (見“線性世界的根基──疊加原理”)。所以,

p(\Lambda)=\begin{bmatrix}  p(\lambda_1)&&\\  &\ddots&\\  &&p(\lambda_n)  \end{bmatrix}=\begin{bmatrix}  \overline{\lambda}_1&&\\  &\ddots\\  &&\overline{\lambda}_n  \end{bmatrix}=\Lambda^\ast

也就有矩陣多項式 (見“矩陣函數 (上)”)

\displaystyle  p(A)=Up(\Lambda)U^\ast=U\Lambda^\ast U^\ast=A^\ast

 
性質三和性質四的反向命題也成立,也就說它們是正規矩陣的等價條件。

 
性質五:若 AB 是可交換正規矩陣,則 AB 是正規矩陣。

使用性質四,A^\ast=p(A)=\sum_{i}p_iA^iB^\ast=q(B)=\sum_jq_jB^j。因為 AB=BA,可得

\displaystyle\begin{aligned}  (AB)^\ast(AB)&=B^\ast A^\ast AB=\left(\sum_jq_jB^j\right)\left(\sum_ip_iA^i\right)AB\\  &=\sum_{j}\sum_iq_jp_iB^jA^iAB=AB\sum_{j}\sum_{i}q_jp_iB^jA^i\\  &=AB\left(\sum_jq_jB^j\right)\left(\sum_ip_iA^i\right)=ABB^\ast A^\ast\\  &=(AB)(AB)^\ast.\end{aligned}

延伸閱讀:
Advertisement
This entry was posted in 特殊矩陣, 線性代數專欄 and tagged , , , , , , , , , , , . Bookmark the permalink.

9 Responses to 特殊矩陣 (2):正規矩陣

  1. Meiyue Shao says:

    我建议性质三和四先列在前面比较好(证明可以放在后面),因为这些也是正规矩阵的等价条件,另外几条性质则不是。

    正规矩阵至少有数十条等价条件,有兴趣的读者可以参阅 http://dx.doi.org/10.1016/0024-3795(87)90168-6

    • ccjou says:

      謝謝你提供的連結與建議。有空時我再增添對一般線性代數學者有用的等價性質(大約有10個吧),不過要安排出易讀的證明與順序還需要花點精神。

  2. chen yilun says:

    周老师,您好,第一个证明正规矩阵可对角化中,仅对比T*T和TT*在主对角线上的相等,还存在解a=c=i, b=1,好像无法证明a=b=c=0吧?

    • ccjou says:

      我將演算細節補充上去,請參考。不知這樣是否回答了你的問題?

      • chen yilun says:

        明白了,原来考虑到复数域上的取模,此前没怎么接触过复数域上的运算,导致还麻烦您打了这么大个公式上去。太不好意思了。最近一直在学习您的博客,讲得比大陆的教科书好太多了,真的。在此表示真心的感谢!

  3. 范智忠 says:

    想請教老師
    V是有限維並附有內積的向量空間且正規算子T:V→V 如果有一個子空間是T-invariant
    那麼伴隨算子T*也是T-invariant嗎?
    其實是作業習題 想不透

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s