利用牛頓恆等式聯繫特徵多項式係數與冪矩陣跡數

本文的閱讀等級:中級

A 為一 n\times n 階矩陣。定義 A 的特徵多項式為

\displaystyle  p(t)=\det(tI-A)=t^n+a_1t^{n-1}+\cdots+a_{n-1}t+a_n=\sum_{k=0}^na_kt^{n-k}

其中領先係數 a_0=1,稱為首一多項式 (monic polynomial)。有時候我們也定義特徵多項式為 \det(A-tI)=(-1)^n\det(tI-A),這兩種定義的差異僅在於乘入常數 (-1)^n。以 n=3 為例,p(t)=t^3+a_1t^2+a_2t+a_3。令 \lambda_1,\lambda_2,\lambda_3 代表 A 的特徵值,即 p(t) 的三個根,所以 p(t) 亦可表示為

\begin{aligned}  p(t)&=(t-\lambda_1)(t-\lambda_2)(t-\lambda_3)\\  &=t^3-(\lambda_1+\lambda_2+\lambda_3)t^2+(\lambda_1\lambda_2+\lambda_1\lambda_3+\lambda_2\lambda_3)t-\lambda_1\lambda_2\lambda_3.  \end{aligned}

比較 p(t) 的兩種表達式,可得係數與根關係:

\begin{aligned}  a_1&=-(\lambda_1+\lambda_2+\lambda_3)=-s_1(\lambda_1,\lambda_2,\lambda_3)\\  a_2&=\lambda_1\lambda_2+\lambda_1\lambda_3+\lambda_2\lambda_3=s_2(\lambda_1,\lambda_2,\lambda_3)\\  a_3&=-\lambda_1\lambda_2\lambda_3=-s_3(\lambda_1,\lambda_2,\lambda_3).  \end{aligned}

上式等號右邊 (不含負號) s_k(\lambda_1,\lambda_2,\lambda_3)k=1,2,3,稱為基本對稱函數 (見“特徵多項式蘊藏的訊息”)。

 
特徵多項式的係數除了表示成特徵值構成的基本對稱函數,也和特徵值的冪和相關。令 t_k=\lambda_1^k+\lambda_2^k+\lambda_3^kk=1,2,3,不難驗證

\begin{aligned}  t_1&=\lambda_1+\lambda_2+\lambda_3=-a_1\\  t_2&=\lambda_1^2+\lambda_2^2+\lambda_3^2=(\lambda_1+\lambda_2+\lambda_3)^2-2(\lambda_1\lambda_2+\lambda_1\lambda_3+\lambda_2\lambda_3)=-t_1a_1-2a_2\\  t_3&=\lambda_1^3+\lambda_2^3+\lambda_3^3=(\lambda_1+\lambda_2+\lambda_3)(\lambda_1^2+\lambda_2^2+\lambda_3^2-\lambda_1\lambda_2-\lambda_1\lambda_3-\lambda_2\lambda_3)+3\lambda_1\lambda_2\lambda_3\\  &=-t_2a_1-t_1a_2-3a_3,  \end{aligned}

或改寫為

\begin{aligned}  a_1&=-t_1\\  2a_2&=-t_1a_1-t_2\\  3a_3&=-t_2a_1-t_1a_2-t_3.  \end{aligned}

推廣至一般情況,令 \lambda_1,\ldots,\lambda_n 代表 n\times n 階矩陣 A 的特徵值 (即 p(t)n 個根),且 t_j(\lambda_1,\ldots,\lambda_n)=\lambda_1^j+\cdots+\lambda_n^j。下列遞歸方程稱為牛頓恆等式 (Newton’s identities):

\displaystyle\begin{aligned}  ka_k&=-\sum_{j=1}^kt_j(\lambda_1,\ldots,\lambda_n)a_{k-j},~~~k=1,\ldots,n,\\  0&=\sum_{j=k-n}^kt_j(\lambda_1,\ldots,\lambda_n)a_{k-j},~~~k>n.\end{aligned}

對於任何正整數 j,冪矩陣 A^j 的特徵值為 \lambda_1^j,\ldots,\lambda_n^j,且矩陣跡數等於特徵值和 (見“跡數的性質與應用”),可知 t_j(\lambda_1,\ldots,\lambda_n)=\mathrm{trace}(A^j)。下面我們先證明牛頓恆等式,然後用它來聯繫 A 的特徵多項式係數 a_k 和冪矩陣跡數 \mathrm{trace}(A^j)

 
牛頓恆等式的推導方法甚多[1,2],這裡介紹一個簡短的代數證法。同時考慮特徵多項式的兩種表達式

\displaystyle  p(t)=\sum_{k=0}^na_kt^{n-k}=\prod_{i=1}^n(t-\lambda_i)

t=1/x 代入上式,等號兩邊同乘以 x^n,則有

\displaystyle  \sum_{k=0}^na_kx^k=\prod_{i=1}^n\left(1-\lambda_ix\right)

求等號兩邊對 x 的導數,為了便於比較,接著乘以 x;繼續化簡等號右邊,中間過程使用無窮等比級數並套用上式,可得

\displaystyle\begin{aligned}  \sum_{k=0}^nka_kx^k&=x\sum_{i=1}^n\left((-\lambda_i)\prod_{j\neq i}\left(1-\lambda_jx\right)\right)\\  &=-\left(\sum_{i=1}^n\frac{\lambda_ix}{1-\lambda_ix}\right)\prod_{j=1}^n\left(1-\lambda_jx\right)\\  &=-\left(\sum_{i=1}^n\sum_{j=1}^{\infty}(\lambda_ix)^j\right)\left(\sum_{l=0}^na_lx^l\right)\\  &=-\left(\sum_{j=1}^{\infty}\left(\sum_{i=1}^n\lambda_i^j\right)x^j\right)\left(\sum_{l=0}^na_lx^l\right)\\  &=-\left(\sum_{j=1}^{\infty}t_j(\lambda_1,\ldots,\lambda_n)x^j\right)\left(\sum_{l=0}^na_lx^l\right).  \end{aligned}

我們並不在意有理函數 \lambda_ix/(1-\lambda_ix) 的收斂性,讀者如果對無窮等比級數感到不安,大可設想 x 限定滿足 -1<\lambda_ix<1。比較等號兩邊 x^k 的係數,固定等號右邊指標 j,則 l=k-j,即得

\displaystyle\begin{aligned}  ka_k&=-\sum_{j=1}^kt_j(\lambda_1,\ldots,\lambda_n)a_{k-j},~~~k=1,\ldots,n,\\  0&=\sum_{j=k-n}^kt_j(\lambda_1,\ldots,\lambda_n)a_{k-j},~~~k>n,\end{aligned}

其中第二式使用了 a_k=0,若 k>n

 
以下採用簡寫符號 t_j=t_j(\lambda_1,\ldots,\lambda_n)。將對應 k=1,\ldots,n 的牛頓恆等式表示為

\begin{aligned}  a_1&=-t_1\\  t_1a_1+2a_2&=-t_2\\  t_2a_1+t_1a_2+3a_3&=-t_3\\  &\vdots\\  t_{n-1}a_1+t_{n-2}a_2+\cdots+t_1a_{n-1}+na_n&=-t_n.  \end{aligned}

領先的 k (1\le k\le n) 個牛頓恆等式構成一 k 階線性方程組

\begin{bmatrix}  1&0&0&\cdots&0&0\\  t_1&2&0&\cdots&0&0\\  t_2&t_1&3&\cdots&0&0\\  \vdots&\vdots&\vdots&\ddots&\vdots&\vdots\\  t_{k-2}&t_{k-3}&t_{k-4}&\cdots&k-1&0\\  t_{k-1}&t_{k-2}&t_{k-3}&\cdots&t_1&k  \end{bmatrix}\begin{bmatrix}  a_1\\  a_2\\  a_3\\  \vdots\\  a_{k-1}\\  a_k  \end{bmatrix}=\begin{bmatrix}  -t_1\\  -t_2\\  -t_3\\  \vdots\\  -t_{k-1}\\  -t_k  \end{bmatrix}

其中 k\times k 階下三角係數矩陣的主對角元不等於零,故為可逆矩陣。利用克拉瑪公式解出 a_k 的表達行列式,如下:

\displaystyle  a_k=\frac{\begin{vmatrix}  1&0&\cdots&0&-t_1\\  t_1&2&\cdots&0&-t_2\\  \vdots&\vdots&\ddots&\vdots&\vdots\\  t_{k-2}&t_{k-3}&\cdots&k-1&-t_{k-1}\\  t_{k-1}&t_{k-2}&\cdots&t_1&-t_k  \end{vmatrix}}{\begin{vmatrix}  1&0&\cdots&0&0\\  t_1&2&\cdots&0&0\\  \vdots&\vdots&\ddots&\vdots&\vdots\\  t_{k-2}&t_{k-3}&\cdots&k-1&0\\  t_{k-1}&t_{k-2}&\cdots&t_1&k  \end{vmatrix}}=\frac{1}{k!}\begin{vmatrix}  1&0&\cdots&0&-t_1\\  t_1&2&\cdots&0&-t_2\\  \vdots&\vdots&\ddots&\vdots&\vdots\\  t_{k-2}&t_{k-3}&\cdots&k-1&-t_{k-1}\\  t_{k-1}&t_{k-2}&\cdots&t_1&-t_k  \end{vmatrix}

從最後一行提出 -1,再執行 k-1 次行置換以便將最末行移至第1行 (每次置換改變正負號),即得 A 的特徵多項式係數的冪矩陣跡數表達式:

\displaystyle  a_k=\frac{(-1)^k}{k!}\begin{vmatrix}  t_1&1&0&\cdots&0\\  t_2&t_1&2&\cdots&0\\  \vdots&\vdots&\vdots&\ddots&\vdots\\  t_{k-1}&t_{k-2}&t_{k-3}&\cdots&k-1\\  t_k&t_{k-1}&t_{k-2}&\cdots&t_1  \end{vmatrix},~~~k=1,\ldots,n

其中,若 k>2,行列式對應的特殊型態矩陣稱為下 Hessenberg 矩陣[3]。下面列舉 k=1,2,3 的例子:

\displaystyle  a_1=-t_1,~~a_2=\frac{1}{2!}\begin{vmatrix}  t_1&1\\  t_2&t_1  \end{vmatrix}=\frac{1}{2}\left(t_1^2-t_2\right),~~a_3=-\frac{1}{3!}\begin{vmatrix}  t_1&1&0\\  t_2&t_1&2\\  t_3&t_2&t_1  \end{vmatrix}=\frac{1}{6}\left(-t_1^3+3t_1t_2-2t_3\right)

k=n,則 a_n=(-1)^n\prod_{i=1}^n\lambda_i=(-1)^n\det A,即 \det A=(-1)^na_n。所以,\det A 可表示成 t_j=\mathrm{trace}(A^j) 構成的行列式:

\displaystyle  \det A=\frac{1}{n!}\begin{vmatrix}  t_1&1&0&\cdots&0\\  t_2&t_1&2&\cdots&0\\  \vdots&\vdots&\vdots&\ddots&\vdots\\  t_{n-1}&t_{n-2}&t_{n-3}&\cdots&n-1\\  t_n&t_{n-1}&t_{n-2}&\cdots&t_1  \end{vmatrix}

 
最後我們提供一個立即應用:若 \mathrm{trace}(A^k)=0k=1,\ldots,n,則 A 是冪零 (nilpotent) 矩陣。因為 t_k=0k=1,\ldots,n,係數 a_k 的表達行列式主對角元及底下的所有元都是零,因此 a_1=\cdots=a_n=0,即知 A 的特徵多項式是 p(t)=t^n,特徵值 0 的相重數是 n ,故 A 為冪零矩陣 (見“特殊矩陣 (1):冪零矩陣”)。

 
參考來源:
[1] 維基百科:Newton’s identities
[2] Dan Kalman, A matrix proof of Newton’s identities, Mathematics Magazine, 73, pp. 313-315, 2000.
[3] 維基百科:Hessenberg matrix

廣告
本篇發表於 特徵分析, 線性代數專欄 並標籤為 , , , , , 。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s