從實數系到複數系

本文的閱讀等級:中級

當我們發現實矩陣的特徵值可能為複數時,理應將向量與矩陣的數系由實數延伸至複數。話是這麼說,權衡初學課程的內容分配,很多基礎線性代數課本反而將複數系的課題限定至最少範圍。幸好,省略複數系部分並不會對理解線性代數的核心概念與應用技術造成破壞性的影響。本文將矩陣代數從實數系延伸至複數系,藉此補齊那些遺漏的片段。

 
從向量開始,我們習慣的 n 維實向量空間 \mathbb{R}^n 可擴展為複向量空間 \mathbb{C}^n,實向量空間所遵守的向量加法和純量乘法規則在複數空間仍然成立,這個問題不大。實向量 \mathbf{x}=(x_1,\ldots,x_n)^T 的長度計算方式為

\Vert\mathbf{x}\Vert^2=x_1^2+\cdots+x_n^2

考慮複向量 \mathbf{x}=\begin{bmatrix}  1\\  i  \end{bmatrix},其中 i=\sqrt{-1}。上式向量長度公式給出 \Vert\mathbf{x}\Vert=1^2+i^2=0!糟糕,此例的向量長度理應是 \sqrt{2},即 1^2+\vert i\vert^2 的平方根。這個錯誤指出有必要仔細檢討實數系所使用的運算,像是向量內積、矩陣轉置、特殊矩陣──譬如對稱、正交矩陣──的定義,我們習慣使用的這些運算方式很可能必須加以修改。

 
底下先複習一些常用的共軛複數運算規則。複數 a+ib 的共軛定義為 \overline{a+ib}=a-ib。令 zw 為複數,共軛有三個基本性質:

(1) \overline{zw}=\overline{z}~\overline{w}

(2) \overline{z+w}=\overline{z}+\overline{w}

(3) (a+ib)(a-ib)=a^2+b^2=r^2

數值 r 稱為 a+ib 的絕對值,計算方式是 r=\vert a+ib\vert=\sqrt{a^2+b^2}

 
向量空間
回頭從基本向量定義開始,\mathbb{C}^n 包含所有 n 維複向量。檢查向量空間的定義,不論是向量加法或純量乘法的代數性質全都滿足,故可確認 \mathbb{C}^n 的確是一個向量空間。

 
向量長度
前面指出實向量長度的定義不適用於複向量,最簡單的修改方法是將 x_i^2 取代為 \vert x_i\vert^2,如此即可解決長度為負的問題,算式為

\Vert\mathbf{x}\Vert^2=\vert x_1\vert^2+\cdots\vert x_n\vert^2

例如,複向量 \mathbf{x}=\begin{bmatrix}  1+i\\  2-i  \end{bmatrix} 的長度平方是

\Vert\mathbf{x}\Vert^2=\vert 1+i\vert^2+\vert 2-i\vert^2=2+5=7

 
內積
實向量的內積與向量長度的關係為 \Vert\mathbf{x}\Vert^2=\mathbf{x}^T\mathbf{x},我們希望在複數系也能保有類似計算方式。慣用的作法是將內積運算中的第一個向量改為共軛向量 (也可以選擇第二個向量),亦即 (見“內積的定義”)

\overline{\mathbf{x}}^T\mathbf{y}=\overline{x}_1y_1+\cdots+\overline{x}_ny_n

例如,\mathbf{x}=\begin{bmatrix}1+i\\i\end{bmatrix}\mathbf{y}=\begin{bmatrix}3\\2-i\end{bmatrix},則 \overline{\mathbf{x}}^T\mathbf{x}=(1-i)(1+i)+(-i)(i)=3,另外 \overline{\mathbf{x}}^T\mathbf{y}=(1-i)3+(-i)(2-i)=2-5i,而 \overline{\mathbf{y}}^T\mathbf{x}=3(1+i)+(2+i)i=2+5i,這說明 \overline{\mathbf{x}}^T\mathbf{y}\overline{\mathbf{y}}^T\mathbf{x} 彼此共軛。經常我們使用簡寫符號 \overline{\mathbf{x}}^T=\mathbf{x}^{\ast},複向量 \mathbf{x}\mathbf{y} 的內積便可記為 \mathbf{x}^{\ast}\mathbf{y},複向量的長度也可由內積求出,\Vert\mathbf{x}\Vert^2=\mathbf{x}^{\ast}\mathbf{x}

 
轉置
複向量的內積定義可以很自然地延用至複矩陣的轉置,稱之為共軛轉置或 Hermitian轉置,如下:A^{\ast}=\overline{A}^T,若以元為計算單位則可表示成 (A^{\ast})_{ij}=(\overline{A})_{ji}。例如,

\begin{bmatrix}    1+i & 3i\\    4-2i&5\\    0&i    \end{bmatrix}^{\ast}=\begin{bmatrix}    1-i&4+2i&0\\    -3i&5&-i    \end{bmatrix}

類似實矩陣乘積的轉置規則,複矩陣的共軛轉置滿足

(AB)^{\ast}=B^{\ast}A^{\ast}

 
正交
與實向量的正交定義相同,如果 \mathbf{x}^{\ast}\mathbf{y}=0,我們說複向量 \mathbf{x} 正交於 \mathbf{y},這時也有 \mathbf{y}^{\ast}\mathbf{x}=0

 
對稱矩陣
實對稱矩陣 A 滿足 A^T=A,複矩陣若滿足 A^{\ast}=A,則稱作共軛對稱或 Hermitian,例如,

A=\begin{bmatrix}    4&2-3i\\    2+3i&5    \end{bmatrix}=A^{\ast}

注意,共軛對稱矩陣的主對角元必定是實數,且佔據對稱位置的兩個非主對角元互為共軛,即 A_{ij}=\overline{{A}_{ji}}。共軛對稱矩陣也享有實對稱矩陣的三個優美性質,其證明方式和實對稱矩陣類似,在此從略 (見“特殊矩陣 (9):Hermitian 矩陣”,“實對稱矩陣可正交對角化的證明”):

  • 性質一:若 A 是共軛對稱矩陣,則對於任意複向量 \mathbf{x}\mathbf{x}^{\ast}A\mathbf{x} 是實數。
  • 性質二:共軛對稱矩陣的特徵值為實數。
  • 性質三:對應共軛對稱矩陣的相異特徵值的特徵向量彼此正交。

 
正交矩陣
實對稱矩陣 A 總是可被正交對角化,亦即 A=Q\Lambda Q^{-1},其中對角矩陣 \Lambda 的主對角元為實特徵值,特徵向量矩陣 Q 為實正交矩陣,其轉置即為逆矩陣,Q^T=Q^{-1}。既然共軛對稱矩陣也具有與實對稱矩陣相同的性質,自然也可被正交對角化,A=U\Lambda U^{-1},其中對角矩陣 \Lambda 的主對角元同樣是實特徵值,而複特徵向量矩陣 U,稱為么正矩陣 (unitary matrix),滿足 U^{\ast}=U^{-1}

 
下面我們整理了實數系與複數系的對應矩陣運算及性質。

 
實數系

向量空間 \mathbb{R}^n

向量長度 \Vert\mathbf{x}\Vert^2=x_1^2+\cdots+x_n^2

內積 \mathbf{x}^T\mathbf{y}=x_1y_1+\cdots+x_ny_n

轉置 (A^{T})_{ij}=(A)_{ji}

正交 \mathbf{x}^T\mathbf{y}=0

對稱矩陣 A^T=A

正交矩陣 Q^TQ=IQ^T=Q^{-1}

正交對角化 A=Q\Lambda Q^{-1}=Q\Lambda Q^T

 
複數系

向量空間 \mathbb{C}^n

向量長度 \Vert\mathbf{x}\Vert^2=\vert x_1\vert^2+\cdots+\vert x_n\vert^2

內積 \mathbf{x}^{\ast}\mathbf{y}=\overline{x}_1y_1+\cdots+\overline{x}_ny_n

共軛轉置 (A^{\ast})_{ij}=(\overline{A})_{ji}

正交 \mathbf{x}^{\ast}\mathbf{y}=0

共軛對稱矩陣 A^{\ast}=A

么正矩陣 U^{\ast}U=IU^{\ast}=U^{-1}

正交對角化 A=U\Lambda U^{-1}=U\Lambda U^{\ast}

Advertisements
本篇發表於 特徵分析, 線性代數專欄 並標籤為 , , , , , 。將永久鏈結加入書籤。

5 則回應給 從實數系到複數系

  1. Jurgn 說道:

    test

    • Jurgn 說道:

      由性质三想到一个问题,请问相同特征值对应的特征向量满足什么性质呢?感觉可能相互正交,也可能不正交。

      • ccjou 說道:

        Hermitian 矩陣的代數重數 (algebraic multiplicity) 等於幾何重數 (geometric multiplicity)。對於相重特徵值,我們一定可以在特徵空間找到彼此正交的特徵向量。當然,你也可以找到不正交的特徵向量。譬如,單位矩陣 I=\begin{bmatrix} 1&0\\ 0&1 \end{bmatrix} 的特徵值是1,1,特徵空間即為 \mathbb{R}^2

        • 涂瑋辰 說道:

          因為相同特徵值的特徵向量必若在相同特徵空間,而特徵空間是子空間gram. Schm的要正交不正交都可 我這理由也說的通嗎?

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s