答ZoneLin──關於基本列運算不保特徵值與特徵向量

網友ZoneLin留言:

周老師您好:請問如果要計算特徵向量時,如果原本的式子是 (A-rI)\mathbf{x}=\mathbf{0},那可不以把矩陣 A 先用 row operation 化簡成 A',再算 (A'-rI)\mathbf{x}=\mathbf{0} 呢?我試過好像不行,可是要如何證明 N(A-rI)N(A'-rI) 不相等呢?謝謝。

 
答曰:

首先我引述“相合變換”的一段申論:

理解線性代數各主要變換核心觀念和運算機制的一個有效方法是將研究焦點放在變換的不變性質上。例如,高斯消去法運用基本列運算產生列等價梯形矩陣,其效果等於左乘矩陣 A 一個基本矩陣 E,表示如 A\rightarrow EA (參見“特殊矩陣 (10):基本矩陣”)。若一列減去另一列與某數的乘積,矩陣的許多性質維持不變,包括矩陣秩、列空間、零空間,以及行列式。又如相似變換 A\rightarrow S^{-1}AS 的基本運算為基底變換,目的是為了化簡矩陣至對角形式或 Jordan 形式,此過程不改變矩陣秩、行列式、跡數、特徵值和 Jordan 形式 (參閱“相似變換下的不變性質”)。

這段文字強調基本列運算 (elementary row operation) 不改變矩陣秩、列空間和零空間,但未提及特徵值和特徵向量。事實上,基本列運算不保特徵值與特徵向量。舉例來說,

A=\begin{bmatrix}  1&2&0\\  2&1&0\\  0&0&2  \end{bmatrix}

有特徵值 -1, 2, 3。考慮三種基本列運算:(1) 第一列乘以 -2 加進第二列,

B=E_1A=\left[\!\!\begin{array}{rcc}  1&0&0\\  -2&1&0\\  0&0&1  \end{array}\!\!\right]\begin{bmatrix}  1&2&0\\  2&1&0\\  0&0&2  \end{bmatrix}=\left[\!\!\begin{array}{crc}  1&2&0\\  0&-3&0\\  0&0&2  \end{array}\!\!\right]

有特徵值 1, 2, -3;(2) 交換第一列和第二列,

C=E_2A=\begin{bmatrix}  0&1&0\\  1&0&0\\  0&0&1  \end{bmatrix}\begin{bmatrix}  1&2&0\\  2&1&0\\  0&0&2  \end{bmatrix}=\begin{bmatrix}  2&1&0\\  1&2&0\\  0&0&2  \end{bmatrix}

有特徵值 1, 2, 3;(3) 第三列乘以 2

D=E_3A=\begin{bmatrix}  1&0&0\\  0&1&0\\  0&0&2  \end{bmatrix}\begin{bmatrix}  1&2&0\\  2&1&0\\  0&0&2  \end{bmatrix}=\begin{bmatrix}  2&1&0\\  1&2&0\\  0&0&4  \end{bmatrix}

有特徵值 -1, 3, 4

 
n\times n 階矩陣 A 執行一連串的基本列運算的淨效果等同於矩陣乘法 EA,其中 E=E_k\cdots E_1 是可逆矩陣,E_i 代表第 i 個步驟的基本矩陣。若 E\neq I,對於任一 AEAA 未必總有相同的特徵值集合 (稍後給出證明)。一旦特徵值改變,討論對應的特徵空間也就失去意義。針對你提出的問題,令 \lambdaA 的特徵值,\muEA 的特徵值 (\mu 不見得等於 \lambda)。若 \mathbf{x}\in N(A-\lambda I),即 (A-\lambda I)\mathbf{x}=\mathbf{0},左乘 E,可得 (EA-\lambda E)\mathbf{x}=\mathbf{0}。除非 \lambda E\mathbf{x}=\mu\mathbf{x},否則 N(A-\lambda I)\neq N(EA-\mu I)

 
\mathcal{M}_{n\times n} 表示所有 n\times n 階矩陣形成的向量空間,且 T:\mathcal{M}_{n\times n}\to \mathcal{M}_{n\times n} 為一個線性變換 (見“線性變換觀點下的矩陣乘積”)。例如,X=\begin{bmatrix}  x_{11}&x_{12}\\  x_{21}&x_{22}  \end{bmatrix} 參考 \mathcal{M}_{2\times 2} 的有序基底

\mathfrak{B}=\left\{\begin{bmatrix}  1&0\\  0&0  \end{bmatrix},~\begin{bmatrix}  0&0\\  1&0  \end{bmatrix},~\begin{bmatrix}  0&1\\  0&0  \end{bmatrix},~\begin{bmatrix}  0&0\\  0&1  \end{bmatrix}\right\}

的座標向量是 (x_{11},x_{21},x_{12},x_{22})^T,則 T(X) 參考 \mathfrak{B} 的座標向量計算如下:

\left[\!\!\begin{array}{ccccc}  t_{11}&t_{12}&\vline&t_{13}&t_{14}\\  t_{21}&t_{22}&\vline&t_{23}&t_{24}\\ \hline  t_{31}&t_{32}&\vline&t_{33}&t_{34}\\  t_{41}&t_{42}&\vline&t_{43}&t_{44}  \end{array}\!\!\right]\left[\!\!\begin{array}{c}  x_{11}\\  x_{21}\\ \hline  x_{12}\\  x_{22}  \end{array}\!\!\right]

其中係數矩陣 [t_{ij}]T 參考 \mathfrak{B} 的表示矩陣:

\begin{aligned}  \left[\!\!\begin{array}{ccccc}  t_{11}&t_{12}&\vline&t_{13}&t_{14}\\  t_{21}&t_{22}&\vline&t_{23}&t_{24}\\ \hline  t_{31}&t_{32}&\vline&t_{33}&t_{34}\\  t_{41}&t_{42}&\vline&t_{43}&t_{44}  \end{array}\!\!\right]=&\left[\!\!\begin{array}{ccccc}  t_{11}&0&\vline&t_{13}&0\\  0&0&\vline&0&0\\ \hline  t_{31}&0&\vline&t_{33}&0\\  0&0&\vline&0&0  \end{array}\!\!\right]+\left[\!\!\begin{array}{ccccc}  0&t_{12}&\vline&0&t_{14}\\  0&0&\vline&0&0\\ \hline  0&t_{32}&\vline&0&t_{34}\\  0&0&\vline&0&0  \end{array}\!\!\right]\\  &+\left[\!\!\begin{array}{ccccc}  0&0&\vline&0&0\\  t_{21}&0&\vline&t_{23}&0\\ \hline  0&0&\vline&0&0\\  t_{41}&0&\vline&t_{43}&0  \end{array}\!\!\right]+\left[\!\!\begin{array}{ccccc}  0&0&\vline&0&0\\  0&t_{22}&\vline&0&t_{24}\\ \hline  0&0&\vline&0&0\\  0&t_{42}&\vline&0&t_{44}  \end{array}\!\!\right].\end{aligned}

請讀者自行驗證 2\times 2 階矩陣 T(X) 可寫為 (見“Kronecker 積”)

\begin{aligned}  T(X)=&\begin{bmatrix}  1&0\\  0&0  \end{bmatrix}\begin{bmatrix}  x_{11}&x_{12}\\  x_{21}&x_{22}  \end{bmatrix}\begin{bmatrix}  t_{11}&t_{31}\\  t_{13}&t_{33}  \end{bmatrix}+\begin{bmatrix}  0&1\\  0&0  \end{bmatrix}\begin{bmatrix}  x_{11}&x_{12}\\  x_{21}&x_{22}  \end{bmatrix}\begin{bmatrix}  t_{12}&t_{32}\\  t_{14}&t_{34}  \end{bmatrix}\\  &+\begin{bmatrix}  0&0\\  1&0  \end{bmatrix}\begin{bmatrix}  x_{11}&x_{12}\\  x_{21}&x_{22}  \end{bmatrix}\begin{bmatrix}  t_{21}&t_{41}\\  t_{23}&t_{43}  \end{bmatrix}+\begin{bmatrix}  0&0\\  0&1  \end{bmatrix}\begin{bmatrix}  x_{11}&x_{12}\\  x_{21}&x_{22}  \end{bmatrix}\begin{bmatrix}  t_{22}&t_{42}\\  t_{24}&t_{44}  \end{bmatrix}.\end{aligned}

上面結果可推廣至一般情形。任一線性變換 T:\mathcal{M}_{n\times n}\to\mathcal{M}_{n\times n} 皆存在下列表達式:

\displaystyle  T(X)=\sum_{i=1}^{n^2}U_iXV_i

其中 U_i, V_i\in\mathcal{M}_{n\times n}。所謂線性保持算子 (linear preserver) 問題是指求 U_iV_i 使得線性算子 T(X) 具備某種性質。可逆性保持定理即為一例 (證明從略):假設 T:\mathcal{M}_{n\times n}\to\mathcal{M}_{n\times n} 是可逆變換,對於任一可逆矩陣 X\in\mathcal{M}_{n\times n},唯有下列變換使 T(X) 是可逆矩陣:

T(X)=UXVT(X)=UX^TV

其中 \det(UV)\neq 0,即 UV 皆可逆。

 
利用可逆性保持定理,我們可以推導行列式保持算子 T,即 \det T(X)=\det X,的成立條件。首先證明行列式保持算子是一個可逆變換。使用反證法。假設存在 X\neq 0 使得 T(X)=0。因為 T 保持行列式,\det X=\det T(X)=\det 0=0,可知 X 不可逆。令 Y 是一個不可逆矩陣使 X+Y 可逆 (滿足此條件的 Y 必定存在,見附註)。因此,

\det(X+Y)=\det T(X+Y)=\det(T(X)+T(Y))=\det T(Y)=\det Y=0

得到一個矛盾,因此證明 T 是可逆變換。接下來我們論稱行列式保持算子 T 也保持可逆性,因為當 \det X\neq 0,立得 \det T(X)=\det X\neq 0。利用可逆性保持定理,行列式保持算子 T 也具有以下形式:T(X)=UXVT(X)=UX^TV,其中 \det(UV)\neq 0。引用限制條件

\det X=\det T(X)=\det(UXV)=(\det U)(\det X)(\det V)=\det(UV)(\det X)

\det X=\det T(X)=\det(UX^TV)=(\det U)(\det X^T)(\det V)=\det(UV)(\det X^T)

推知 \det UV=1。於是得到行列式保持定理:假設 T:\mathcal{M}_{n\times n}\to\mathcal{M}_{n\times n} 為線性變換,對於任一 X\in\mathcal{M}_{n\times n},唯有下列變換使得 \det T(X)=\det X

T(X)=UXVT(X)=UX^TV

其中 \det(UV)=1

 
最後討論特徵值保持算子,即 T(X)X 有相同的特徵值集合。行列式等於特徵值的乘積,故特徵值保持算子必為行列式保持算子,即有 T(X)=UXVT(X)=UX^TV,其中 \det(UV)=1。另外,跡數等於特徵值的和,特徵值保持算子也保持跡數。對於任一 X=[x_{ij}]\in\mathcal{M}_{n\times n},利用跡數循環不變性 (見“跡數的性質與應用”),

\hbox{trace}X=\hbox{trace}T(X)=\hbox{trace}(UXV)=\hbox{trace}(VUX)

則有

\displaystyle  \hbox{trace}((I-VU)X)=\sum_{i=1}^n((I-VU)X)_{ii}=\sum_{i=1}^n\sum_{j=1}^n(I-VU)_{ij}x_{ji}=0

因為 x_{ji} 是任何數,可知 (I-VU)_{ij}=0i,j=1,\ldots,n,也就是 VU=I,故得 V=U^{-1}。同樣地,T(X)=UX^TV 亦可獲致相同結果。從以上討論可得特徵值保持定理:若線性變換 T:\mathcal{M}_{n\times n}\to\mathcal{M}_{n\times n} 使得 T(X)X 有相同的特徵值集合,則 T 必具有下列形式:

T(X)=UXU^{-1}T(X)=UX^TU^{-1}

換句話說,除了 AA^T 的相似變換 (實際上,X^T 相似於 X,證明見“矩陣與其轉置的相似性”),不存在其他形式的特徵值保持算子。

 
回到我們的問題:對於任一 n\times n 階矩陣 A,基本列運算可表示成線性變換 T(A)=EA,其中 E 是可逆矩陣。根據特徵值保持定理,除非 E=I,即 T(A)=IAI^{-1}=A,否則 EA 不保 A 的特徵值和特徵向量。

 
註解
X 為一個 n\times n 階不可逆矩陣,且 \hbox{rank}A=r<n。寫出等價標準型 X=U\begin{bmatrix}  I_r&0\\  0&0  \end{bmatrix}V,其中 UV 是可逆矩陣。令 Y=U\begin{bmatrix}  0&0\\  0&I_{n-r}  \end{bmatrix}V。因此,X+Y=UIV=UV 是可逆的。

廣告
本篇發表於 特徵分析, 答讀者問 並標籤為 , , , , , , , 。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s