Cayley 變換

本文的閱讀等級:初級

A 為一個 n\times n 階矩陣。若 I+A 可逆,英國數學家凱萊 (Arthur Cayley) 於1846年提出下列變換,稱為 Cayley 變換[1]

\displaystyle  T(A)=(I+A)^{-1}(I-A)=(I-A)(I+A)^{-1}

其中 I-A(I+A)^{-1} 是可交換矩陣 (證明見註解[2])。除非特別註明,以下考慮實矩陣。通過 Cayley 變換,反對稱矩陣 (anti-symmetric matrix) 或稱斜對稱矩陣 (skew-symmetric matrix) 與特殊的一類正交矩陣 (orthogonal matrix) 具有一對一的對應關係。

 
A^T=-A,則 A 稱為反對稱矩陣,其特徵值必為零或純虛數 (見“特殊矩陣 (13):反對稱矩陣”),可知 I+A 的特徵值 (即 A 的特徵值加 1) 不等於零,故 I+A 是可逆的。若 Q^T=Q^{-1},則 Q 稱為正交矩陣,其特徵值的絕對值等於 1 (見“特殊矩陣 (3):么正矩陣 (酉矩陣)”)。通過 Cayley 變換,反對稱矩陣 A 與特殊的一類正交矩陣 Q 具有一對一的對應關係:Q=T(A)A=T(Q),詳述於下:任何一個不含特徵值 -1 的正交矩陣 Q 必可表示為

\displaystyle  Q=(I+A)^{-1}(I-A)=(I-A)(I+A)^{-1}

其中 A 是反對稱矩陣。相反的,任一反對稱矩陣 A 亦可表示為

\displaystyle  A=(I+Q)^{-1}(I-Q)=(I-Q)(I+Q)^{-1}

我們先證明第一式的 Q 是正交矩陣:

\displaystyle\begin{aligned}  Q^TQ&=\left((I+A)^{-1}(I-A)\right)^T(I+A)^{-1}(I-A)\\  &=(I-A)^T\left((I+A)^{-1}\right)^T(I-A)(I+A)^{-1}\\  &=(I-A^T)(I+A^T)^{-1}(I-A)(I+A)^{-1}\\  &=(I+A)(I-A)^{-1}(I-A)(I+A)^{-1}\\  &=I.  \end{aligned}

欲證明第二式是第一式的反函數,第一式右乘 I+A,可得 Q(I+A)=I-A,乘開移項整理為 I-Q=QA+A=(Q+I)A。由於 Q 不含特徵值 -1,即知 I+Q 不含特徵值 0,因此 A=(I+Q)^{-1}(I-Q)

n=2,反對稱矩陣為 A=\left[\!\!\begin{array}{rc}  0&a\\  -a&0  \end{array}\!\!\right],對應的正交矩陣如下:

\displaystyle  Q=\left[\!\!\begin{array}{rc}  1&a\\  -a&1  \end{array}\!\!\right]^{-1}\left[\!\!\begin{array}{cr}  1&-a\\  a&1  \end{array}\!\!\right]=\left[\!\!\begin{array}{cr}  \frac{1-a^2}{1+a^2}&-\frac{2a}{1+a^2}\\  \frac{2a}{1+a^2}&\frac{1-a^2}{1+a^2}  \end{array}\!\!\right]

使用 (1+a^2)^2=(2a)^2+(1-a^2)^2,以及三角學公式 \frac{\sin\theta}{\cos\theta}=\tan\theta=\frac{2\tan\frac{\theta}{2}}{1-\tan^2\frac{\theta}{2}},設 a=\tan\frac{\theta}{2},可得二階反對稱矩陣和旋轉矩陣的一對一的對應關係:

\displaystyle  A=\left[\!\!\begin{array}{cc}  0&\tan\frac{\theta}{2}\\  -\tan\frac{\theta}{2}&0  \end{array}\!\!\right]\rightleftharpoons Q=\left[\!\!\begin{array}{cr}  \cos\theta&-\sin\theta\\  \sin\theta&\cos\theta  \end{array}\!\!\right],~~~\theta\neq \pm\pi

 
Cayley 變換可以延伸至複矩陣。若 H 為一 Hermitian 矩陣 (見“特殊矩陣 (9):Hermitian 矩陣”),H^{\ast}=H,則 iH (i=\sqrt{-1}) 為一 skew-Hermitian,即 (iH)^{\ast}=-iH^{\ast}=-iH。若 U 是一個不含特徵值 -1 的么正矩陣 (unitary matrix),即 U^\ast=-UI+U 可逆,則有

\displaystyle\begin{aligned}  U&=(I+iH)^{-1}(I-iH)=(I-iH)(I+iH)^{-1}\\  iH&=(I+U)^{-1}(I-U)=(I-U)(I+U)^{-1}.\end{aligned}

考慮這個情況:n\times n 階矩陣退化為一個純量 (見“矩陣與複數的類比”)。具體地說,skew-Hermitian 矩陣 iH 退化為一純虛數 ihh\in\mathbb{R},么正矩陣 U 退化為複數平面單位圓上的一點 u\in\mathbb{C}\vert u\vert=1u\neq -1,兩者之間的關係為

\displaystyle  u=\frac{1-ih}{1+ih}=\frac{i+h}{i-h},~~~  ih=\frac{1-u}{1+u}

在複數平面上,

\displaystyle  z\mapsto\frac{1-z}{1+z}

將虛軸映至單位圓 (扣除 -1),或者

\displaystyle  z\mapsto\frac{i+z}{i-z}

將實軸映至單位圓 (扣除 -1),見下圖:

Cayley transform From Wikipedia

 
註解
[1] 維基百科:Cayley transform
[2] 假設 I+A 是可逆矩陣。若 A 可逆,則

\displaystyle\begin{aligned}  (I+A)^{-1}(I-A)&=(I+A)^{-1}I-(I+A)^{-1}A=(I+A)^{-1}-\left(A^{-1}(I+A)\right)^{-1}\\  &=(I+A)^{-1}-((I+A)A^{-1})^{-1}=(I+A)^{-1}-A(I+A)^{-1}\\  &=(I-A)(I+A)^{-1}.  \end{aligned}

A 不可逆,即 A 有零特徵值,使用連續論證法 (見“連續論證法”)。考慮 A+\epsilon I,存在一正數 \delta,對於任意 \epsilon0<\epsilon<\delta,使得 I+A+\epsilon IA+\epsilon I 是可逆矩陣。根據前面的結果,

\displaystyle  (I+A+\epsilon I)^{-1}(I-A-\epsilon I)=(I-A-\epsilon I)(I+A+\epsilon I)^{-1}

上式等號兩邊都是 \epsilon 的連續函數,令 \epsilon\to 0,即證得所求。

Advertisement
This entry was posted in 線性變換, 線性代數專欄 and tagged , , , , . Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s