特徵多項式蘊藏的訊息

本文的閱讀等級:中級

n\times n 階矩陣 A 的特徵值 \lambda,對應的特徵向量 \mathbf{x} 滿足特徵方程式 A\mathbf{x}=\lambda\mathbf{x}。基礎線性代數主張的求解步驟是將特徵方程式寫為

(A-\lambda I)\mathbf{x}=\mathbf{0}

我們要求特徵向量 \mathbf{x} 不得為零向量,意指 A-\lambda I 是不可逆的,因此

\det(A-\lambda I)=0

特徵值 \lambda 即為上式的解。定義矩陣 A 的特徵多項式為

p(t)=\det(A-tI)

我們以 t 取代 \lambda 的原因是強調 t 是多項式的變數,而特徵值 \lambda 則為 p(t) 的根。有些教科書定義特徵多項式為 \mathrm{det}(tI-A),如此一來,p(t) 的領先項 t^n 的係數為 1。針對給定的 n\times n 階矩陣 Ap(t)=\mathrm{det}(A-tI) 可展開為 (-t)n 次多項式,如下:

p(t)=(-t)^n+a_{n-1}(-t)^{n-1}+\cdots+a_1(-t)+a_0

特徵多項式 p(t) 的係數 a_{i}i=0,1,\ldots,n-1, 和矩陣 A 有什麼關係?它們又與 A 的特徵值 \lambda_1,\ldots,\lambda_n 有何關聯?本文將回答這兩個問題。

 
我們估計經由推算 3\times 3 階矩陣的特徵多項式便足以觀察出一般形式。考慮

A=\begin{bmatrix}  a_{11}&a_{12}&a_{13}\\  a_{21}&a_{22}&a_{23}\\  a_{31}&a_{32}&a_{33}  \end{bmatrix}

其特徵多項式為

p(t)=\begin{vmatrix}  a_{11}-t&a_{12}&a_{13}\\  a_{21}&a_{22}-t&a_{23}\\  a_{31}&a_{32}&a_{33}-t  \end{vmatrix}

行列式對於各列 (或行) 是線性的,利用這個性質可將第一列分解:

p(t)=\begin{vmatrix}  -t&0&0\\  a_{21}&a_{22}-t&a_{23}\\  a_{31}&a_{32}&a_{33}-t  \end{vmatrix}+\begin{vmatrix}  a_{11}&a_{12}&a_{13}\\  a_{21}&a_{22}-t&a_{23}\\  a_{31}&a_{32}&a_{33}-t  \end{vmatrix}

分別對上面兩個行列式的第二列分解,就有

p(t)=\begin{vmatrix}  -t&0&0\\  0&-t&0\\  a_{31}&a_{32}&a_{33}-t  \end{vmatrix}+\begin{vmatrix}  -t&0&0\\  a_{21}&a_{22}&a_{23}\\  a_{31}&a_{32}&a_{33}-t  \end{vmatrix}+\begin{vmatrix}  a_{11}&a_{12}&a_{13}\\  0&-t&0\\  a_{31}&a_{32}&a_{33}-t  \end{vmatrix}+\begin{vmatrix}  a_{11}&a_{12}&a_{13}\\  a_{21}&a_{22}&a_{23}\\  a_{31}&a_{32}&a_{33}-t  \end{vmatrix}

繼續再對這四個行列式的第三列分解便得到 2^3=8 個行列式:

\begin{aligned} p(t)&=\begin{vmatrix}  -t&0&0\\  0&-t&0\\  0&0&-t  \end{vmatrix}+\begin{vmatrix}  -t&0&0\\  0&-t&0\\  a_{31}&a_{32}&a_{33}  \end{vmatrix}+\begin{vmatrix}  -t&0&0\\  a_{21}&a_{22}&a_{23}\\  0&0&-t  \end{vmatrix}+\begin{vmatrix}  -t&0&0\\  a_{21}&a_{22}&a_{23}\\  a_{31}&a_{32}&a_{33}  \end{vmatrix}\\  &+\begin{vmatrix}  a_{11}&a_{12}&a_{13}\\  0&-t&0\\  0&0&-t  \end{vmatrix}+\begin{vmatrix}  a_{11}&a_{12}&a_{13}\\  0&-t&0\\  a_{31}&a_{32}&a_{33}  \end{vmatrix}+\begin{vmatrix}  a_{11}&a_{12}&a_{13}\\  a_{21}&a_{22}&a_{23}\\  0&0&-t  \end{vmatrix}+\begin{vmatrix}  a_{11}&a_{12}&a_{13}\\  a_{21}&a_{22}&a_{23}\\  a_{31}&a_{32}&a_{33}  \end{vmatrix}\end{aligned}

以餘因子展開計算,整理項次後得到

\begin{aligned} p(t)=(-t)^3&+(-t)^2(a_{11}+a_{22}+a_{33})+(-t)\left(\begin{vmatrix}  a_{11}&a_{12}\\  a_{21}&a_{22}  \end{vmatrix}+\begin{vmatrix}  a_{11}&a_{13}\\  a_{31}&a_{33}  \end{vmatrix}+\begin{vmatrix}  a_{22}&a_{23}\\  a_{32}&a_{33}  \end{vmatrix}\right)\\ &+\begin{vmatrix}  a_{11}&a_{12}&a_{13}\\  a_{21}&a_{22}&a_{23}\\  a_{31}&a_{32}&a_{33}  \end{vmatrix}\end{aligned}

 
上面推導出的特徵多項式係數浮現一種模式,此模式與 A 的主子陣 (principal submatrix) 之行列式相關。保留 Ak 個相同的列指標與行指標可得到一個 k\times k 階主子陣,而此主子陣的行列式稱為 k 階主餘子式 (principal minor)。對於 n 階方陣 A=[a_{ij}],總計有 \binom{n}{k}k 階主餘子,令 E_k(A) 表示這些 k 階主餘子之和,其中比較特別的是

E_1(A)=a_{11}+a_{22}+\cdots+a_{nn}=\mathrm{trace}A

E_n(A)=\mathrm{det}A。利用主餘子記號,特徵多項式可表示為

p(t)=(-t)^n+E_1(A)(-t)^{n-1}+E_2(A)(-t)^{n-2}+\cdots+E_{n-1}(-t)+E_n(A)

A 為不可逆矩陣,\mathrm{det}A=0,特徵多項式的常數項 E_n(A) 為零。

 
繼續研究第二個問題:特徵多項式的係數與其根,也就是特徵值,有什麼關係?使用初等代數便能夠完整的回答此問題。設 An 個特徵值為 \lambda_1,\ldots,\lambda_n,它們可能重複或為共軛複數。由代數基本定理,特徵多項式必可分解為

p(t)=(\lambda_1-t)(\lambda_2-t)\cdots(\lambda_n-t)

如果一時看不出展開模式,不妨乘開 3 次特徵多項式:

\begin{aligned} p(t)&=(\lambda_1-t)(\lambda_2-t)(\lambda_3-t)\\  &=(-t)^3+(\lambda_1+\lambda_2+\lambda_3)(-t)^2+(\lambda_1\lambda_2+\lambda_1\lambda_3+\lambda_2\lambda_3)(-t)+\lambda_1\lambda_2\lambda_3\end{aligned}

 
觀察係數的變化關係不難歸納出下面這個定義:集合 L=\{\lambda_1,\lambda_2,\ldots,\lambda_n\}k 次,k\le n,基本對稱函數 (elementary symmetric function) 設為

S_k(L)=\displaystyle\sum_{1\le i_1<i_2<\cdots<i_k\le n}\prod_{j=1}^k \lambda_{i_j}

例如,S_1(L)=\lambda_1+\cdots+\lambda_n,而 S_n(L)=\lambda_1\cdots\lambda_n。使用基本對稱函數,特徵多項式可表示為

p(t)=(-t)^n+S_1(L)(-t)^{n-1}+S_2(L)(-t)^{n-2}+\cdots+S_{n-1}(L)(-t)+S_n(L)

 
比較由基本對稱函數和主餘子構成的兩種特徵多項式形式,立即得知

E_i(A)=S_i(L),~~i=1,2,\ldots,n

i=1 時,E_1(A)=S_1(L) 就是

\mathrm{trace}A=\lambda_1+\cdots+\lambda_n

i=nE_n(A)=S_n(L) 也就是

\det A=\lambda_1\cdots\lambda_n

證得矩陣跡數等於其特徵值之和,行列式等於其特徵值之積。

Advertisement
This entry was posted in 特徵分析, 線性代數專欄 and tagged , , , , . Bookmark the permalink.

6 Responses to 特徵多項式蘊藏的訊息

  1. Chenlogy says:

    我以為我是第一個用上述方式拆解~特徵值行列式的人,昨天高興了一下…OTZ 現在我想… 果然是我太膚淺了, 高老師! ~ 再補上三次方程式公式解 就更好了 一路殺到特徵值,只能用爽快形容!

  2. r2123b says:

    老師:
    請問線代的特徵多項式P_{A}(x)
    跟求解遞迴方程式\left\{\begin{matrix} a_{n} = a_{n-1} + a_{n-2} \\ a_{1}=1, a_{2}=2 \end{matrix}\right. a_{n} 時所用的特徵多項式有什麼關聯嗎?

    為什麼都叫特徵多項式??

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s