特殊矩陣 (3):么正矩陣 (酉矩陣)

本文的閱讀等級:中級

一實 (或複) 正交矩陣 (orthogonal matrix) Q 是一個實 (或複) 方陣滿足

Q^TQ=QQ^T=I

Q^{-1}=Q^T。寫出 n\times n 階實正交矩陣的行向量 (column vector) 表達,Q=\begin{bmatrix}  \mathbf{q}_1&\cdots&\mathbf{q}_n  \end{bmatrix},則 (Q^TQ)_{ij}=\mathbf{q}_i^T\mathbf{q}_j=(I)_{ij},矩陣乘積 Q^TQ(i,j) 元等於 \mathbf{q}_i\mathbf{q}_j 的內積。因此,\mathbf{q}_i^T\mathbf{q}_j=\delta_{ij}=0i\neq j\mathbf{q}_i^T\mathbf{q}_j=\delta_{ij}=1i=j。換句話說,實正交矩陣 Q 的行向量 \{\mathbf{q}_1,\ldots,\mathbf{q}_n\} 是向量空間 \mathbb{R}^n 的一組單範正交基底 (orthonormal basis),單範表示歸一,\mathbf{q}_i 是單位向量,正交意味 \mathbf{q}_i 垂直 \mathbf{q}_j。不過,複正交矩陣的行向量並非 \mathbb{C}^n 的一個單範正交集,因為兩個複向量 \mathbf{x}\mathbf{y} 的內積定義為 \mathbf{x}^\ast\mathbf{y}=\overline{\mathbf{x}}^T\mathbf{y} (見“內積的定義”)。如欲將實正交矩陣推廣至複矩陣,將轉置改為共軛轉置。一么正矩陣 (酉矩陣,unitary matrix) U 是一個複方陣滿足

U^\ast U=UU^\ast=I

U^{-1}=U^\ast。同樣地,設 U=\begin{bmatrix}  \mathbf{u}_1&\cdots&\mathbf{u}_n  \end{bmatrix},則 (U^\ast U)_{ij}=\mathbf{u}_i^\ast\mathbf{u}_j=(I)_{ij}。么正矩陣的行向量 \{\mathbf{u}_1,\ldots,\mathbf{u}_n\} 是向量空間 \mathbb{C}^n 的一組單範正交基底。例如,

U=\begin{bmatrix}  \displaystyle\frac{1+i}{2}&\displaystyle\frac{1+i}{2}\\[0.8em]    \displaystyle\frac{1-i}{2}&\displaystyle\frac{-1+i}{2}    \end{bmatrix}

其中 i=\sqrt{-1}。因為 (U^\ast)^\ast=U,若 U 是一么正矩陣,則 U^\ast 也是么正矩陣。所以,么正矩陣 U 的共軛列向量 (row vector) 構成 \mathbb{C}^n 的一個單範正交集 (事實上,U 的列向量即構成單範正交集,因為 \overline{U}^\ast\,\overline{U}=\overline{U}\,\overline{U}^\ast=I\overline{U} 也是么正矩陣)。類似地,實正交矩陣 Q 的列向量構成 \mathbb{R}^n 的一個單範正交集。在一般情況下,么正矩陣與複正交矩陣是不同的,但實么正矩陣與實正交矩陣是相同的。所以,么正矩陣的所有性質皆可套用於實正交矩陣。

 
么正矩陣出現於許多矩陣分解式,舉兩個例子。第一是矩陣三角化的 Schur 定理:任一方陣 A 可分解為 A=UTU^\ast,其中 U 是一么正矩陣,T 是上三角矩陣 (見“矩陣三角化的 Schur 定理”)。第二是正規矩陣 (normal matrix) 的么正對角化 (unitarily diagonalizable):若 A 為一正規矩陣,A^\ast A=AA^\ast,則存在一么正矩陣 U 使得 A=U\Lambda U^\ast,其中 \Lambda 為一對角矩陣 (見“特殊矩陣 (2):正規矩陣”)。事實上,可么正對角化是正規矩陣的一個充要條件。

 
以下令 U 為一 n\times n 階么正矩陣,所有的性質都是由定義式得來。

 
性質1. 向量的長度不因么正變換而改變,即每一 \mathbf{x}\in\mathbb{C}^n

\Vert U\mathbf{x}\Vert=\Vert\mathbf{x}\Vert

性質1說明么正變換是一個保長 ((length-preserving) 變換。使用定義式,

\Vert U\mathbf{x}\Vert^2=(U\mathbf{x})^{\ast}(U\mathbf{x})=\mathbf{x}^{\ast}U^{\ast}U\mathbf{x}=\mathbf{x}^{\ast}I\mathbf{x}=\mathbf{x}^\ast\mathbf{x}=\Vert\mathbf{x}\Vert^2

反過來說,若所有向量 \mathbf{x}\in\mathbb{C}^n 都滿足 \Vert U\mathbf{x}\Vert=\Vert\mathbf{x}\Vert,平方後整理可得 \mathbf{x}^\ast (U^\ast U-I)\mathbf{x}=0,可知 (U^\ast U-I)\mathbf{x}=\mathbf{0},並推得 U^\ast U-I=0。所以,保長是么正矩陣的一個充要條件。

 
性質2. 兩向量的內積不因么正變換而改變,即任何 \mathbf{x},\mathbf{y}\in\mathbb{C}^n

(U\mathbf{x})^\ast(U\mathbf{y})=\mathbf{x}^\ast\mathbf{y}

性質2說明么正變換具有內積不變性。使用定義式,

(U\mathbf{x})^{\ast}(U\mathbf{y})=\mathbf{x}^{\ast}U^{\ast}U\mathbf{y}=\mathbf{x}^{\ast}I\mathbf{y}=\mathbf{x}^{\ast}\mathbf{y}

將上式的 \mathbf{y} 替換為 \mathbf{x},性質2可推得性質1。所以,內積不變性是么正矩陣的另一個充要條件。

 
性質3. 么正矩陣的特徵值之絕對值為 1

假設 U\mathbf{x}=\lambda\mathbf{x},等號兩邊同時取向量長度。利用性質1,等號左邊為 \Vert U\mathbf{x}\Vert=\Vert\mathbf{x}\Vert,但等號右邊為 \Vert\lambda\mathbf{x}\Vert=\vert\lambda\vert \cdot\Vert\mathbf{x}\Vert,所以 \vert\lambda\vert=1,換句話說,么正矩陣的特徵值可表示為 \lambda=e^{i\theta}

 
性質4. 么正矩陣 U 可么正對角化,U=VDV^\ast,其中 V 是一么正矩陣,D=\hbox{diag}(\lambda_1,\ldots,\lambda_n)

么正矩陣 U 滿足 U^\ast U=UU^\ast,因此屬於正規矩陣家族,本身也可被么正對角化。下面介紹 U 對應相異特徵值的特徵向量互為正交的一個證明。假設非零向量 \mathbf{x}\mathbf{y} 使得 U\mathbf{x}=\lambda_1\mathbf{x}U\mathbf{y}=\lambda_2\mathbf{y},且 \lambda_1\neq\lambda_2。使用性質2,

\mathbf{x}^{\ast}\mathbf{y}=(U\mathbf{x})^{\ast}(U\mathbf{y})=(\lambda_1\mathbf{x})^{\ast}(\lambda_2\mathbf{y})=(\overline{\lambda_1}\lambda_2)(\mathbf{x}^{\ast}\mathbf{y})

比較等號兩邊,推得 \overline{\lambda_1}\lambda_2=1\mathbf{x}^{\ast}\mathbf{y}=0。使用性質三,令 \lambda_1=e^{i\theta_1},則 \overline{\lambda_1}\lambda_1=e^{-i\theta_1}e^{i\theta_1}=1。但已知 \lambda_1 不等於 \lambda_2,推論 \overline{\lambda_1}\lambda_2\neq 1,證明 \mathbf{x} 正交於 \mathbf{y}

 
性質5. 么正矩陣 U 的行列式為 \vert\det U\vert=1

根據性質3,U 的特徵值滿足 \vert\lambda_i\vert=1。行列式等於特徵值之積,故 \vert\det U\vert=\vert \lambda_1\cdots\lambda_n\vert=\vert\lambda_1\vert\cdots\vert\lambda_n\vert=1。另一個作法計算

\det(U^\ast U)=(\det \overline{U^T})(\det U)=(\overline{\det U^T})(\det U)=(\overline{\det U})(\det U)=\vert\det U\vert^2

\det(U^\ast U)=\det I=1,所以 \vert\det U\vert=1

 
對於一實正交矩陣 Q\det Q 為實數,由性質5可知 \det Q=\pm 1。據此,實正交矩陣可以區分為兩類:若 \det Q=1,則 Q 稱為適當的 (proper) 的正交矩陣;若 \det Q=-1,則 Q 稱為不適當的正交矩陣。令 R(\theta) 是平面上逆時針旋轉角為 \theta 的旋轉矩陣,F(\phi) 是平面上以 \begin{bmatrix}  \cos\phi\\  \sin\phi  \end{bmatrix} 為鏡射軸指向的鏡射矩陣,公式如下 (見“幾何變換矩陣的設計”):

R(\theta)=\left[\!\!\begin{array}{cr}  \sin\theta&-\cos\theta\\  \cos\theta&\sin\theta  \end{array}\!\!\right],~~F(\phi)=\left[\!\!\begin{array}{cr}  \cos 2\phi&\sin 2\phi\\  \sin 2\phi&-\cos 2\phi  \end{array}\!\!\right]

因為 \det R(\theta)=\cos^2\theta+\sin^2\theta=1,平面旋轉是適當的正交矩陣。另一方面,\det F(\phi)=-(\cos^2 2\phi+\sin^2 2\phi)=-1,平面鏡射是不適當的正交矩陣 (見“旋轉與鏡射”)。平面旋轉與鏡射是保長變換,提示我們這兩種矩陣是實正交矩陣。

 
最後補充一個么正矩陣的充分條件:假設 n\times n 階矩陣 A 的特徵值 \lambda 滿足 \vert\lambda\vert=1。若每一 \mathbf{x}\in\mathbb{C}^n 使得 \Vert A\mathbf{x}\Vert\le\Vert\mathbf{x}\Vert,則 A 是一個么正矩陣 (見“每週問題 July 6, 2015”)。註解提供兩個證明:第一個證明使用奇異值分解[1],第二個證明使用矩陣三角化的 Schur 定理[2]

 
註解
[1] 令 A 的特徵值為 \lambda_1,\ldots,\lambda_n,奇異值為 \sigma_1,\ldots,\sigma_n\ge 0。給定的不等式等價於

\displaystyle  \Vert A\Vert_2=\max_{\Vert\mathbf{x}\Vert\neq\mathbf{0}}\frac{\Vert A\mathbf{x}\Vert}{\Vert\mathbf{x}\Vert}=\sigma_{\max}\le 1

其中 \sigma_{\max}=\max_{1\le i\le n}\sigma_i。令 A 的奇異值分解為 A=U\Sigma V^\ast,其中 \Sigma=\text{diag}(\sigma_1,\ldots,\sigma_n)U^\ast U=V^\ast V=I。使用恆等式 \det(A^\ast A)=\vert\det A\vert^2,又 \det(A^\ast A)=\det(\Sigma^\ast\Sigma)=\sigma_1^2\cdots\sigma_n^2\det A=\lambda_1\cdots\lambda_n,推得 \sigma_1\cdots\sigma_n=\vert \lambda_1\cdots\lambda_n\vert=\vert\lambda_1\vert\cdots\vert\lambda_n\vert=1。但 \sigma_{\max}\le 1,可知 \sigma_1=\cdots=\sigma_n=1。因此,A=U\Sigma V^\ast=UIV^\ast=UV^\ast,即知 A^\ast A=VU^\ast UV^\ast=I,證明 A 是一么正矩陣。

[2] 根據 Schur 定理,寫出 A=UTU^\ast,其中 U 是么正矩陣,T=[t_{ij}] 是上三角矩陣,主對角元為 A 的特徵值 \lambda_1,\ldots,\lambda_n,每一 \vert\lambda_i\vert=1。考慮 \mathbf{x}=U\mathbf{e}_n,其中 \mathbf{e}_n=(0,\ldots,0,1)^T 是第 n 個標準單位向量,則 \Vert\mathbf{x}\Vert=\Vert U\mathbf{e}_n\Vert=(\mathbf{e}_n^\ast U^\ast U\mathbf{e}_n)^{1/2}=1。我們得到

\displaystyle  \Vert A\mathbf{x}\Vert=\Vert UTU^\ast U\mathbf{e}_n\Vert=\Vert UT\mathbf{e}_n\Vert=\Vert T\mathbf{e}_n\Vert=\left(\vert t_{1n}\vert^2+\cdots+\vert t_{n-1,n}\vert^2+\vert\lambda_n\vert^2\right)^{1/2}

對於單位向量 \mathbf{x},給定條件等價於 \Vert A\mathbf{x}\Vert\le 1,再有 \vert\lambda_n\vert=1,使得 t_{in}=01\le i\le n-1。套用歸納法,重複上述步驟令 \mathbf{x}=U\mathbf{e}_jj=n-1,n-2,\ldots,2,可推論 T 是一個對角矩陣滿足 T^\ast T=I (因為 \overline{\lambda_i}\lambda_i=\vert\lambda_i\vert^2=1)。所以,

A^\ast A=UT^\ast U^\ast UTU^\ast=UT^\ast TU^\ast=UU^\ast =I

相關閱讀:
This entry was posted in 特殊矩陣, 線性代數專欄 and tagged , , , . Bookmark the permalink.

4 則回應給 特殊矩陣 (3):么正矩陣 (酉矩陣)

  1. LeeChuan 說:

    周先生你好,很高兴看到你系统的总结线代的相关知识,浅显易懂。今读此章后,若能加之以背景知识,和关键的物理上应用(物理意义)就更能让我们融会贯通、学以致用到自己的学科里面了。
    学生李 字

  2. Jurgn 說:

    有的酉矩阵的行列式为复数,性质四中的det(U)应该加个绝对值号吧

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s