矩陣函數 (下)

本文的閱讀等級:高級

上文“矩陣函數 (上)”介紹了可對角化矩陣函數,簡述如下:設 An\times n 階可對角化矩陣,A=S\Lambda S^{-1},其中 \Lambda 為主對角特徵值矩陣 \Lambda=\mathrm{diag}(\lambda_1,\ldots,\lambda_n)S 為特徵向量矩陣。若對於所有特徵值 \lambda_i,函數 f(\lambda_i) 存在,我們定義矩陣函數 f(A) 如下:

f(A)=Sf(\Lambda)S^{-1}=S\begin{bmatrix}    f(\lambda_1)&~&~\\    ~&\ddots&~\\    ~&~&f(\lambda_n)    \end{bmatrix}S^{-1}

本文接續討論不可對角化矩陣函數。

 
A 是不可對角化時,我們考慮 A 的 Jordan 典型形式 A=MJM^{-1},其中 J 為 Jordan 矩陣 (見“Jordan 形式大解讀 (上)”)。設 Jm ~(m\le n) 個基本 Jordan 分塊 J_1,J_2,\ldots,J_m 直和所構成,各個基本 Jordan 分塊的主對角元皆為同一特徵值,具以下形式:

J_{\ast}=J_{\ast}(\lambda)=\begin{bmatrix}    \lambda&1&~&~\\    ~&\ddots&\ddots&~\\    ~&~&\ddots&1\\    ~&~&~&\lambda    \end{bmatrix}

下面給出一個 8\times 8 階 Jordan 矩陣的例子,

J=J_1(5)\oplus J_2(5)\oplus J_3(2)\oplus J_4(2)=\begin{bmatrix}    5&1&0&~&~&~&~&~\\    0&5&1&~&~&~&~&~\\    0&0&5&~&~&~&~&~\\    ~&~&~&5&1&~&~&~\\    ~&~&~&0&5&~&~&~\\    ~&~&~&~&~&2&1&~\\    ~&~&~&~&~&0&2&~\\    ~&~&~&~&~&~&~&2    \end{bmatrix}

 
仿造可對角化矩陣函數,我們也可以定義

f(A)\overset{\underset{\mathrm{def}}{}}{=}Mf(J)M^{-1}=M\begin{bmatrix}    f(J_1)&~&~\\    ~&\ddots&~\\    ~&~&f(J_m)    \end{bmatrix}M^{-1}

這個定義引伸出兩個問題:f(J) 不具有如同 f(\Lambda) 的主對角形式,因此有必要進一步釐清 f(J_{\ast}) 的結構;另外,我們還必須確定 Mf(J)M^{-1} 唯一存在。

 
\rho>0,若對於 \vert z-\lambda\vert<\rhof(z)\lambda 的泰勒展開式收斂:

\displaystyle  f(z)=f(\lambda)+f^{\prime}(\lambda)(z-\lambda)+\frac{f^{\prime\prime}(\lambda)}{2!}(z-\lambda)^2+\cdots

J_{\ast}(\lambda)k\times k 階基本 Jordan 分塊,以 J_{\ast}(\lambda) 取代 z,單位矩陣 I 取代常數 1,即得基本 Jordan 分塊函數,如下:

\begin{aligned}\displaystyle  f(J_{\ast}(\lambda))&=f(\lambda)I+ f^{\prime}(\lambda)(J_{\ast}(\lambda)-\lambda I)+\frac{f^{\prime\prime}(\lambda)}{2!}(J_{\ast}(\lambda)-\lambda I)^2+\cdots\\    &=f(\lambda)I+ f^{\prime}(\lambda)J_{\ast}(0)+\frac{f^{\prime\prime}(\lambda)}{2!}J_{\ast}(0)^2+\cdots\end{aligned}

不難驗證 J_{\ast}(0)=J_{\ast}(\lambda)-\lambda I,若 p\ge kJ_{\ast}(0)^p=0,故得

\displaystyle  f(J_{\ast}(\lambda))=f(\lambda)I+ f^{\prime}(\lambda)J_{\ast}(0)+\frac{f^{\prime\prime}(\lambda)}{2!}J_{\ast}(0)^2+\cdots+\frac{f^{(k-1)}(\lambda)}{(k-1)!}J_{\ast}(0)^{k-1}

也就是說,f(J_{\ast}(\lambda)) 可表示為 I,J_{\ast}(0),J_{\ast}(0)^2,\ldots,J_{\ast}(0)^{k-1} 的線性組合。以 k=4 為例,J_{\ast}(0)^pp=1, 2, 3,具有清晰的規則變化,

J_{\ast}(0)=\begin{bmatrix}    0&1&0&0\\    0&0&1&0\\    0&0&0&1\\    0&0&0&0    \end{bmatrix},~ J_{\ast}(0)^2=\begin{bmatrix}    0&0&1&0\\    0&0&0&1\\    0&0&0&0\\    0&0&0&0    \end{bmatrix},~ J_{\ast}(0)^3=\begin{bmatrix}    0&0&0&1\\    0&0&0&0\\    0&0&0&0\\    0&0&0&0    \end{bmatrix}

推廣至 k 階基本 Jordan 分塊,可導出

\begin{aligned}\displaystyle  f(J_{\ast}(\lambda))&=f\left(\begin{bmatrix}    \lambda&1&~&~\\    ~&\ddots&\ddots&~\\    ~&~&\ddots&1\\    ~&~&~&\lambda    \end{bmatrix}\right)\\    &=\begin{bmatrix}    f(\lambda)&f^{\prime}(\lambda)&\frac{f^{\prime\prime}(\lambda)}{2!}&\cdots&\frac{f^{(k-1)}(\lambda)}{(k-1)!}\\    ~&f(\lambda)&f^{\prime}(\lambda)&\ddots&\vdots\\    ~&~&\ddots&\ddots&\frac{f''(\lambda)}{2!}\\[0.3em]    ~&~&~&f(\lambda)&f^{\prime}(\lambda)\\    ~&~&~&~&f(\lambda)    \end{bmatrix}\end{aligned}

上式也給出了矩陣函數 f(A) 的定義要件:對於 A 的所有特徵值 \lambda,若其最大基本 Jordan 分塊階數 (稱作指標,index) 為 k,函數 f(\lambda) 及其導數 f^{(j)}(\lambda)j=1,\ldots,k-1,都必須存在。

 
以上述 8\times 8 階 Jordan 矩陣為例,若 f(5), f^{\prime}(5), f^{\prime\prime}(5), f(2), f^{\prime}(2) 存在,則矩陣函數 f(J) 即為

f(J)=\begin{bmatrix}    f(5)&f^{\prime}(5)&\frac{f^{\prime\prime}(5)}{2!}&~&~&~&~&~\\    0&f(5)&f^{\prime}(5)&~&~&~&~&~\\    0&0&f(5)&~&~&~&~&~\\    ~&~&~&f(5)&f^{\prime}(5)&~&~&~\\    ~&~&~&0&f(5)&~&~&~\\    ~&~&~&~&~&f(2)&f^{\prime}(2)&~\\    ~&~&~&~&~&0&f(2)&~\\    ~&~&~&~&~&~&~&f(2)    \end{bmatrix}

 
接下來我們證明縱使可逆矩陣 M 有許多種選擇,但 f(A)=Mf(J)M^{-1} 總是唯一的。因為 Jordan 矩陣 J 所含的主對角基本 Jordan 分塊可隨意排序,在不失一般性的情況下,考慮

A=MJM^{-1}=PJP^{-1}

上式給出兩個矩陣函數定義,f_1(A)=Mf(J)M^{-1}f_2(A)=Pf(J)P^{-1},而我們希望能證明 f_1(A)=f_2(A),亦即 f(J)=M^{-1}Pf(J)P^{-1}M,或 f(J)=Qf(J)Q^{-1},其中 Q=M^{-1}P。由上面 A 的兩個表達式可得 J=M^{-1}PJP^{-1}M 推知 J=QJQ^{-1},這意味 f(J)=f(QJQ^{-1})=Qf(J)Q^{-1},最後的等式來自矩陣函數定義,故證得 f_1(A)=f_2(A)

 
凡矩陣函數可由 f(A)=Mf(J)M^{-1} 定義者,稱為主要矩陣函數 (primary matrix function),但當 A 包含相重特徵值時,並非所有的函數都可由上述定義產生。非主要矩陣函數 (nonprimary matrix function) 發生於求解非線性矩陣方程 g(X)=A,最重要的兩個例子是 X^2=AXA 的平方根,和 e^{X}=AXA 的對數。例如,f(z)=\sqrt{z} 的一次導數 f'(z)\lambda=0 不存在。若 A 是可逆矩陣,則不含零特徵值,我們可以定義 f(A)=\sqrt{A}。若 A 不可逆,為了避免在 \lambda=0 計算 f'(z),特徵值 0 的指標必須為 1 方可定義 f(A)=\sqrt{A}

This entry was posted in 線性代數專欄, 典型形式 and tagged , , . Bookmark the permalink.

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s