答鄧勇──關於λ-矩陣的伴隨矩陣關係式

網友鄧勇留言:

老师:您好!如何证明λ-矩阵和其伴随矩阵的关系式 (\mathrm{adj}A)A=(\det A)I 呢?我百思不得其解,是否这个关系式根本就不成立?我已经看了“伴随矩阵”,内容都懂。我疑惑的是您在“Cayley-Hamilton 定理的一个代数证明方法”一文中,设 B=A-tI 后,矩阵 B 则不是数字矩阵了,那么后面证明中要用到的主要关系式 (\mathrm{adj}B)B=(\det B)I 对非数字矩阵依然成立吗?如果不成立,那么后面就得不到定理证明;如果主要关系式是正确的,又应该如何证明呢?显然它的证明与数字矩阵的证明是不一样的,对于它的证明,我试了很多方法,仍然证不出来,烦请老师给指点迷津。谢谢!

 
答曰:

開始討論之前先補充解釋這個問題。λ-矩陣 B=[b_{ij}] 是指 b_{ij}\lambda 的多項式,也稱多項式矩陣 (但 A^2-2A-3I 稱為矩陣多項式)。例如,計算 n\times n 階矩陣 A 的特徵多項式 p(\lambda)=\det(A-\lambda I) 所使用的 B=A-\lambda I 即為一λ-矩陣,如下:

B=A-\lambda I=\begin{bmatrix}  a_{11}-\lambda&a_{12}&\cdots&a_{1n}\\  a_{21}&a_{22}-\lambda&\cdots&a_{2n}\\  \vdots&\vdots&\ddots&\vdots\\  a_{n1}&a_{n2}&\cdots&a_{nn}-\lambda  \end{bmatrix}

我們的問題是:B 不是數字矩陣 (其中主對角元是 \lambda 的一次多項式),那麼伴隨矩陣 \mathrm{adj}B 的主要關係式 (\mathrm{adj}B)B=(\det B)I 對非數字矩陣依然成立嗎?如果成立,又該如何證明?

 
所謂恆等式是指式中不論其變數如何取值,等號兩邊必定相等的數學式。譬如,不論 ab 為何數,平方差公式 a^2-b^2=(a+b)(a-b) 放諸天下而皆準。變數 ab 甚至可為任意函數,如 a=f(x)b=g(x),則 f^2(x)-g^2(x)=(f(x)+g(x))(f(x)-g(x))。因為這個緣故我們可以用它來推導形式較特殊或複雜的等式,舉例來說,令 a=\cos\thetab=i\sin\theta,其中 i=\sqrt{-1}。平方差公式等號左邊是 (\cos\theta)^2-(i\sin\theta)^2=\cos^2\theta+\sin^2\theta,等號右邊則是 (\cos\theta+i\sin\theta)(\cos\theta-i\sin\theta)=1,原因在於 \cos\theta+i\sin\theta 表示複數平面的單位圓上旋轉 \theta 角 (見“歐拉恆等式──最優美的數學定理”),而 \cos\theta-i\sin\theta=\cos(-\theta)+i\sin(-\theta) 表示旋轉 -\theta 角,故兩相抵銷。感謝平方差公式,不使用畢氏定理我們也能輕鬆證明著名的三角學等式 \cos^2\theta+\sin^2\theta=1。同樣道理,(\mathrm{adj}A)A=(\det A)I 既然是一個恆等式,便適用於任何矩陣 A,當然也包括λ-矩陣 B=A-\lambda I

 
不過,基於人類與生俱來的好奇心,我們還是想知道如何證明

(\mathrm{adj}(A-\lambda I))(A- \lambda I)=(\det(A-\lambda I))I

先考慮 2\times 2 階矩陣,令 A=\begin{bmatrix}  a&b\\  c&d  \end{bmatrix},立得

\mathrm{adj}(A-\lambda I)=\begin{bmatrix}  d-\lambda&-b\\  -c&a-\lambda  \end{bmatrix}=\mathrm{adj}A-\lambda I

使用上式計算,過程如下:

\begin{aligned}  (\mathrm{adj}(A-\lambda I))(A-\lambda I)&=(\mathrm{adj}A-\lambda I)(A-\lambda I)\\  &=\lambda^2I-(\mathrm{adj}A+A)\lambda+(\mathrm{adj}A)A\\  &=\lambda^2I-(\mathrm{trace}A)\lambda I+(\det A)I\\  &=\left(\lambda^2-(\mathrm{trace}A)\lambda+\det A\right)I\\  &=(\det(A-\lambda I))I.\end{aligned}

最後一個步驟使用了特徵多項式 \det(A-\lambda I)=\lambda^2-(\mathrm{trace}A)\lambda+\det A (見“特徵多項式蘊藏的訊息”)。對於 3\times 3 階或更高階矩陣 A\mathrm{adj}(A-\lambda I) 的表達式將變得非常複雜,迫不得已我們只好尋求其他解決途徑,但該從何處著手呢?

 
無計可施時,逆向思考有時會有「一旦豁然貫通焉」的作用。當初因為要證明 Cayley-Hamilton 定理才生出λ-矩陣 B=A-\lambda I,現在何不反過來利用 Cayley-Hamilton 定理證明 (\mathrm{adj}B)B=(\det B)I?(為避免邏輯謬誤,請讀者先以其他方法證明 Cayley-Hamilton 定理,譬如“利用連續論證法證明 Cayley-Hamilton 定理”。) 以下令 AB=A-\lambda In\times n 階矩陣,\lambda 是任一數。為了不與已經使用的 \lambda 符號混淆,我們設 t 為特徵多項式的變數。令 AB 的特徵多項式分別為

p(t)=\det(A-tI)=p_nt^n+\cdots+p_1t+p_0

q(t)=\det(B-tI)=q_nt^n+\cdots+q_1t+q_0

其中 q_i\lambda 的函數,i=0,1,\ldots,n。特徵多項式的常數項有重要的涵義:p_0=p(0)=\det(A-0I)=\det Aq_0=\det B=\det(A-\lambda I)。Cayley-Hamilton 定理指出 Ap(t) 消滅,就有

p(A)=p_nA^n+\cdots+p_1A+p_0I=0

將上式改寫為

\left(-p_nA^{n-1}-\cdots-p_2A-p_1I\right)A=(\det A)I

因為 (\mathrm{adj}A)A=(\det A)I,即得到以 A^{n-1},\ldots,A,I 組合而成的 \mathrm{adj}A 展開式:

\mathrm{adj}A=-\left(p_nA^{n-1}+\cdots+p_2A+p_1I\right)

同樣道理,\mathrm{adj}B 也有下列表達式:

\mathrm{adj}B=-\left(q_nB^{n-1}+\cdots+q_2B+q_1I\right)

也就是說,

\mathrm{adj}(A-\lambda I)=-\left(q_n(A-\lambda I)^{n-1}+\cdots+q_2(A-\lambda I)+q_1I\right)

最後,我們必須設法聯繫 p(t)q(t) 的關係,如下:

\begin{aligned}  p(t)&=\det(A-tI)=\det(B+\lambda I-tI)\\  &=\det(B-(t-\lambda)I)=q(t-\lambda).  \end{aligned}

將多項式替換為矩陣多項式,就有 q(A-\lambda I)=p(A)=0。 (繞了一圈,其實還是 Cayley-Hamilton 定理 q(B)=0。) 使用以上結果,可推導出

\begin{aligned}  (\mathrm{adj}(A-\lambda I))(A-\lambda I)&=-\left(q_n(A-\lambda I)^{n-1}+\cdots+q_2(A-\lambda I)+q_1I\right)(A-\lambda I)\\  &=-\left(q_n(A-\lambda I)^n+\cdots+q_1(A-\lambda I)+q_0I\right)+q_0I\\  &=-q(A-\lambda I)+(\det(A-\lambda I))I\\  &=(\det(A-\lambda I))I,  \end{aligned}

因此得證。

Advertisements
本篇發表於 答讀者問, 行列式 並標籤為 , , , , , 。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s