交換子與可交換矩陣

本文的閱讀等級:高級

我們知道矩陣乘法不總是滿足交換律,即 AB\neq BA,其中 ABn\times n 階矩陣。但如果 AB=BA,我們說 AB 是可交換矩陣 (或對易矩陣)。當矩陣具備清晰的幾何意義時,無須計算也很容易判斷它們是否為可交換矩陣。譬如,在二維空間 \mathbb{R}^2,令旋轉矩陣 R(\theta) 表示逆時針旋轉 \theta 角,伸縮矩陣 S(s_x,s_y) 表示 X 軸伸縮 s_x 倍,Y 軸伸縮 s_y 倍,如下 (見“幾何變換矩陣的設計”):

R(\theta)=\left[\!\!\begin{array}{cr}  \cos\theta&-\sin\theta\\  \sin\theta&\cos\theta  \end{array}\!\!\right],~~~S(s_x,s_y)=\begin{bmatrix}  s_x&0\\  0&s_y  \end{bmatrix}

從幾何直觀即可確定 R(\theta)R(\phi)=R(\phi)R(\theta)=R(\theta+\phi),而且若 s_x=s_y,則 R(\theta)S(s_x,s_y)=S(s_x,s_y)R(\theta)。自然地,我們想探究:對於旋轉矩陣 R(\theta),甚至任意矩陣 A,哪些 B 滿足乘法交換律?不過說來奇怪,找尋可交換矩陣問題並不常見於線性代數教科書。原因是這個問題不值得討論,還是這個問題尚未被解決?值不值得討論屬於主觀認知,在此不予評論。不過客觀的事實是:僅使用基礎線性代數知識便可求出 A 的所有可交換矩陣 B。為了探討可交換矩陣問題,我們定義交換子 (commutator,或稱對易算符) 為 ABBA 的差,記為

[A,B]=AB-BA

[A,B]=0,則 AB=BAAB 是可交換矩陣。明顯地,[0,B]=0[I,B]=0,零矩陣和單位矩陣與任何矩陣皆可交換。下面我先介紹交換子的運算法則,接著說明如何找尋矩陣 A 的所有可交換矩陣,最後討論交換子與可交換矩陣的一些性質。

 
使用交換子定義很容易證明下列運算法則成立:

  1. [A,A^k]=0k=0,1,\ldots
  2. [A,B]=[-A,-B]=-[B,A],稱為反交換律。
  3. [A,[B,C]]+[B,[C,A]]+[C,[A,B]]=0,稱為 Jacobi 恆等式。
  4. [A,B+C]=[A,B]+[A,C][A+B,C]=[A,C]+[B,C],稱為分配律。
  5. [cA,B]=[A,cB]=c[A,B],其中 c 是一純量。
  6. [A,BC]=[A,B]C+B[A,C][AB,C]=A[B,C]+[A,C]B
  7. [A,B]^{\ast}=[B^\ast,A^\ast],其中 (\cdot)^\ast 表示共軛轉置。

利用上述基本法則可以推導出更為複雜的法則。譬如,重複使用性質 (4),可推得

\begin{aligned}  \left[A+B,C+D\right]&=[A+B,C]+[A+B,D]\\  &=[A,C]+[B,C]+[A,D]+[B,D].\end{aligned}

重複使用性質 (6),可得

\begin{aligned}  \left[AB,CD\right]&=A[B, CD]+[A,CD]B\\  &=A[B,C]D+AC[B,D]+[A,C]DB+C[A,D]B,  \end{aligned}

以及

\begin{aligned}  \left[ABC, D\right] &=A[BC,D]+[A,D]BC\\  &=AB[C,D]+A[B,D]C+[A,D]BC.  \end{aligned}

 
給定 n\times n 階矩陣 A,如何求出所有的可交換矩陣 X 使得 AX=XA?令 \mathcal{M}_n 代表 n\times n 階矩陣所形成的向量空間。對於 A\in\mathcal{M}_n,交換子可以視為一個從 \mathcal{M}_n 映至 \mathcal{M}_n 的變換

T_A(X)=[A,X]=AX-XA

事實上,T_A 是一個線性變換,證明於下:對於 X, Y\in\mathcal{M}_n,純量 c,利用交換子性質 (4) 與 (5),

\begin{aligned}  T_A(X+Y)&=[A,X+Y]=[A,X]+[A,Y]=T_A(X)+T_A(Y)\\  T_A(cX)&=[A,cX]=c[A,X]=cT_A(X).\end{aligned}

X 滿足 T_A(X)=AX-XA=0,則 AX 是可交換矩陣。所以齊次方程 T_A(X)=0 的完整解,也就是線性變換 T_A 的零空間 N(T_A),即為 A 的所有可交換矩陣形成的集合。下面舉一例說明計算程序。若

A=\begin{bmatrix}  1&1\\  0&1  \end{bmatrix}

X=\begin{bmatrix}  w&x\\  y&z  \end{bmatrix} 代入 T_A(X)=0,即有

\begin{bmatrix}  1&1\\  0&1  \end{bmatrix}\begin{bmatrix}  w&x\\  y&z  \end{bmatrix}-\begin{bmatrix}  w&x\\  y&z  \end{bmatrix}\begin{bmatrix}  1&1\\  0&1  \end{bmatrix}=\begin{bmatrix}  y&z-w\\  0&-y  \end{bmatrix}=0

解得 z=wy=0,故 X=\begin{bmatrix}  w&x\\  0&w  \end{bmatrix},其中 w,x 是任意數。換句話說,\left\{\begin{bmatrix}  1&0\\  0&1  \end{bmatrix},\begin{bmatrix}  0&1\\  0&0  \end{bmatrix}\right\}A 的可交換矩陣集 (子空間) N(T_A) 的一組基底。

 
當方陣 A 的階數 n 增大時,解出包含 n^2 個未知數的線性方程組不免耗費大量的計算。然而,N(T_A) 中存在一些顯而易見的可交換矩陣。考慮 A 的矩陣多項式 \sum_{k=0}^{n-1}c_kA^k,利用交換子性質 (1),(4) 和 (5),可得

\left[A,\sum_{k=0}^{n-1}c_kA^k\right]=\displaystyle\sum_{k=0}^{n-1}\left[A,c_kA^k\right]=\sum_{k=0}^{n-1}c_k\left[A,A^k\right]=0

矩陣 A\sum_{k=0}^{n-1}c_kA^k 是可交換矩陣。為甚麼矩陣多項式的最高次冪是 n-1?根據 Cayley-Hamilton 定理:任一 n\times n 階矩陣 A 被其特徵多項式 p_A(t)=\sum_{k=0}^np_kt^k 所消滅,意思是說 p_A(A)=\sum_{k=0}^np_kA^k=0 (見“Cayley-Hamilton 定理”)。任一 A^mm=0,1,\ldots,寫出

A^m=p_A(A)q(A)+r(A)=r(A)

其中 q(A) 是商,r(A) 是次冪最高為 n-1 的餘式。上式等於告訴我們 A 的任何矩陣多項式皆可以表示為 \sum_{k=0}^{n-1}c_kA^k

 
反過來問:是不是 A 的可交換矩陣 X (即 N(T_A) 的成員) 必為 An-1 次矩陣多項式?答案是否定的。不難舉出反例,譬如,若 A=I,任何 X 都滿足 T_I(X)=0,即 N(T_I)=\mathcal{M}_n,但 X 未必是對角矩陣。循環向量定理 (cyclic vector theorem) 給出 N(T_A) 的成員限定是矩陣多項式 \sum_{k=0}^{n-1}c_kA^k 的充要條件。以下陳述都是等價的:

  1. A 有一個循環向量。
  2. A 相似於一個相伴矩陣 (companion matrix)。
  3. A 的最小多項式即為其特徵多項式。
  4. AB 是可交換矩陣,則 B 是由 A 形成的矩陣多項式 B=\sum_{k=0}^{n-1}c_kA^k

這個定理的證明相當艱深,在此不深入討論,有興趣的讀者請查閱“循環向量定理”。下面說明此定理的用途。上例,A=\begin{bmatrix}  1&1\\  0&1  \end{bmatrix} 的最小多項式 (次數最小的消滅多項式) 和特徵多項式都是 p_A(t)=(t-1)^2,陳述 (c) 成立,故陳述 (d) 也成立,N(T_A)IA 擴張而成。另外,陳述 (c) 包含一個特殊情形:如果 A 有相異的特徵值 \lambda_1,\ldots,\lambda_n,則 A 的最小多項式等於特徵多項式 p_A(t)=(t-\lambda_1)\cdots(t-\lambda_n) (見“最小多項式 (下)”),這時 A 的所有可交換矩陣即為 N(T_A)=\mathrm{span}\{I,A,\ldots,A^{n-1}\}。以本文最初給的二維空間的旋轉矩陣為例,R(\theta) 有特徵值 \cos\theta\pm i\sin\theta,其中 i=\sqrt{-1}。若 \theta\neq k\pik 是整數,則 R(\theta) 有相異的特徵值,故 R(\theta) 的所有可交換矩陣必為 c_0I+c_1R(\theta)。設 c_0=s_x, c_1=0,立得 c_0I=S(s_x,s_x)。但其中果真包含 R(\phi)?設 c_0=\cos\phi-\frac{\cos\theta}{\sin\theta}\sin\phi, c_1=\frac{\sin\phi}{\sin\theta},即得 c_0I+c_1R(\theta)=R(\phi)

 
從線性變換角度來看,交換子 T_A(X)=[A,X] 具有甚麼性質?下面列舉跡數、特徵向量,以及 Hermitian 與 skew-Hermitian 矩陣等性質 (見“複數與矩陣的類比”)。

(T1) \mathrm{trace}T_A(X)=0

跡數 (trace) 是一個線性函數,利用循環不變性 (見“跡數的性質與應用”),就有

\mathrm{trace}T_A(X)=\mathrm{trace}[A,X]=\mathrm{trace}(AX-XA)=\mathrm{trace}(AX)-\mathrm{trace}(XA)=0

這個性質說明 I 不屬於 T_A 的值域,也就是說,不存在 X 使得 T_A(X)=I,原因是 \mathrm{trace}I=n>0

(T2) 若 T_A(X)=\lambda X\lambda\neq 0,則 X 是不可逆的。

這個命題表明 T_A 的非零特徵值所對應的特徵向量是不可逆矩陣。使用逆否命題法。假設 X 是可逆的,則 AX-XA=\lambda X 右乘 X^{-1} 可得 A-XAX^{-1}=\lambda I。等號兩邊取跡數,利用循環不變性,左邊是

\mathrm{trace}(A-XAX^{-1})=\mathrm{trace}A-\mathrm{trace}(XAX^{-1})=\mathrm{trace}A-\mathrm{trace}(AX^{-1}X)=0

右邊是 \mathrm{trace}(\lambda I)=n\lambda,即有 \lambda=0,故證得所求。

(T3) 若 AX 是 Hermitian,則 T_A(X) 是一個 skew-Hermitian 矩陣。

A^\ast=AX^\ast=X,利用交換子性質 (2) 和 (7),

(T_A(X))^\ast=[A,X]^{\ast}=[X^\ast,A^\ast]=[X,A]=-[A,X]=-T_A(X)

(T4) 若 AX 是 skew-Hermitian,則 T_A(X) 是一個 skew-Hermitian 矩陣。

A^\ast=-AX^\ast=-X,利用交換子性質 (2) 和 (7),

(T_A(X))^\ast=[A,X]^{\ast}=[X^\ast,A^\ast]=[-X,-A]=[X,A]=-[A,X]=-T_A(X)

(T5) 若 A 是 Hermitian 且 X 是 skew-Hermitian,則 T_A(X) 是一個 Hermitian 矩陣。

A^\ast=AX^\ast=-X,利用交換子性質 (2),(5) 和 (7),

(T_A(X))^\ast=[A,X]^{\ast}=[X^\ast,A^\ast]=[-X,A]=-[X,A]=[A,X]=T_A(X)

 
最後列舉幾個矩陣 A 與其可交換矩陣 X\in N(T_A) 共有的特徵性質,詳細內容請見相關文件。

  • 共同的特徵向量:AX 有一個共同的特徵向量。證明見“每週問題 September 20, 2010”。
  • 同時可對角化:若 AX 是可對角化矩陣,則存在一個可逆矩陣 S 使得 S^{-1}ASS^{-1}XS 同是對角矩陣。詳見“同時可對角化矩陣”。因為 S 的行向量 (column vector) 即為 AX 的特徵向量,故 AX 有完全相同的特徵向量集。
  • 同時可三角化:存在一個么正矩陣 (unitary matrix) U 使得 U^{\ast}AUU^{\ast}XU 同是上三角矩陣。詳見“同時可三角化矩陣”。
This entry was posted in 特徵分析, 線性代數專欄 and tagged , , , , , , , , . Bookmark the permalink.

3 Responses to 交換子與可交換矩陣

  1. 范智忠 says:

    請教老師個問題,這個問題困擾了我幾天,我覺得與方陣的可交換性有關,因此到此一問:
    Let A and B be elements in M_n(C). if A^2B+BA^2=2ABA, show that(AB-BA)^n=0

Leave a comment