Cayley-Hamilton 定理的一個代數證明方法

本文的閱讀等級:初級

Cayley-Hamilton 定理是線性代數理論中的一個重要定理。設 p(\lambda)n\times n 階矩陣 A 的特徵多項式,同樣形式的矩陣多項式滿足 p(A)=0,即 p(A) 為零矩陣。“Cayley-Hamilton 定理”一文曾經以矩陣三角化程序證明此定理,這篇短文介紹一個簡潔的矩陣代數證明方法,主要關鍵在於引入伴隨 (adjugate) 矩陣並發揮矩陣運算技巧。

 
t 取代常用的特徵值符號 \lambda (有一些書本使用符號 t,這麼做的原因是為了強調 t 是多項式的變數,而 \lambda 則是多項式的根),設 B=A-tI,矩陣 A 的特徵多項式為

p(t)=\det(A-tI)=\det B

注意,n\times n 階矩陣的特徵多項式其最高階數為 n,故可設

p(t)=a_0+a_1t+a_2t^2+\cdots+a_{n}t^n

證明的第一步是引用矩陣 B 與其伴隨矩陣 \mathrm{adj}B 的重要性質:

(\mathrm{adj}B)B=(\det B)I

上式也可以表示為

(\mathrm{adj}B)B=p(t)I

我們稱上式為主要關係式。

 
第二個步驟是解析伴隨矩陣,\mathrm{adj}B(i,j) 元定義為

(\mathrm{adj}B)_{ij}=(-1)^{i+j}\det\tilde{B}_{ji}

上式中 \tilde{B}_{ji} 表示移除 B 的第 j 列與第 i 行後得到的 (n-1)\times(n-1) 階子陣 (submatrix),故 \mathrm{adj}B 的每個元皆為 t 的多項式,最高階至多為 n-1。因此我們可將 \mathrm{adj}B 表示為 t 的多項式,如下:

\mathrm{adj}B=C_0+C_1t+\cdots+C_{n-1}t^{t-1}

其中係數矩陣 C_ii=0,1,\ldots,n-1,都是常數。

 
整理前述主要關係式,等號左邊是

(\mathrm{adj}B)B=(C_0+C_1t+\cdots+C_{n-1}t^{t-1})(A-tI)

等號右邊是

p(t)I=(a_0+a_1t+a_2t^2+\cdots+a_{n}t^n)I

分別乘開,比較等號兩邊相同項次的係數矩陣,可得

\begin{aligned}  C_0A&=a_0I\\    C_1A-C_0&=a_1I\\    C_2A-C_1&=a_2I\\    &\vdots\\    C_{n-1}A-C_{n-2}&=a_{n-1}I\\    -C_{n-1}&=a_nI\end{aligned}

接下來是最精采的部份,將第 2 式右乘 A,第 3 式右乘 A^2,以此類推,最末式右乘 A^{n},再分別加總等號兩端,不難檢查等號左邊矩陣和為零,等號右邊和為

a_0I+a_1A+a_2A^2+\cdots+a_nA^n

因此證明了 Cayley-Hamilton 定理 p(A)=0

 
這個採用直接計算的代數證明宛如曲折離奇的電影情節,讓人嘆為觀止。在證出定理的前一秒鐘,邁向終點的路線被一扇封印的門所阻,而開啟此門的秘密鑰其實就烙在我們要證明的 Cayley-Hamilton 定理中。

Advertisement
This entry was posted in 特徵分析, 線性代數專欄 and tagged , , , , . Bookmark the permalink.

6 Responses to Cayley-Hamilton 定理的一個代數證明方法

  1. 凤来 says:

    这个证明真是叹为观止。我想里面最重要的思想,也许是他利用了伴随矩阵和矩阵之间的关系,关键也许在于t的次数的变化。所以,最后并不关心系数C的具体表达。

  2. ccjou says:

    确实如你所说,这个证明精巧之处在於 adjB*B=(t的n-1次矩阵多项式)*(A-tI) 乘开後t^{k}的系数浮现出模式 C_{k}A-C_{k-1},至於C为何物就不是我们需要关心的了。在我印象中,高中生的数学竞赛也常出现类似的证明手法。

  3. 張晏誠 says:

    這在近世代數有更好的證法 而且他貫穿相關主題 可惜的是 需要有module theory的背景知識

  4. Justin says:

    其实p(t)=Det(A-t*I)=(A-t*I)*adj(A-t*I) 这个表达式说明了Det(A-t*I)含有A-t*I因子(虽然是个矩阵),所以当t=A代入,这个因子就成为0矩阵,所以p(A)=0.

    • Justin says:

      写错了,应该是p(t)*I = Det(A-t*I)*I=(A-t*I)*adj(A-t*I), 而p(A)*I = p(A)

      • Justin says:

        矩阵变量相对于普通scalar变量而言,至少缺失了乘法交换律。如果只有一个矩阵变量,运算只含有加法,数乘,幂次,那么乘法交换律的缺失就毫无影响了,这也是为什么多项式里的变量可以代入一个矩阵。

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s