本文的閱讀等級:中級
達文西說:「簡單是最終極的細緻。」(Simplicity is the ultimate sophistication.) 就數學而言,簡單不意味平庸,反而是優雅的體現。本文從一個簡單的問題開始,並致力於發展簡單的解法。令 ,求
。典型的問題通常有典型的解法,對角化 (diagonalization) 是目前最常用的冪矩陣算法。矩陣
有相異特徵值
和
,對應特徵向量
和
,故可對角化為
。
利用上式立得
。
不過,遺憾的是對角化並不適用於所有的矩陣。若 ,則
有兩個特徵值
,但其特徵空間僅含一線性獨立向量
,即知
不可對角化 (見“可對角化矩陣與缺陷矩陣的判定”)。針對不可對角化矩陣,典型的方法是分解出
的 Jordan 形式
,接著計算
(見“利用 Jordan form 解差分方程與微分方程”)。表面上,計算冪矩陣並不很困難,使用 Jordan 典型形式似乎有些「小題大作」。倘若不採用 Jordan 分解,那麼還有其他方法嗎?繼續閱讀前,建議讀者先花個幾分鐘想一想。
最簡單的辦法是修改 矩陣使之可對角化。我們可以在
的主對角元加入擾動量,譬如
,其中
是一極小的數。如此一來,
有相異特徵值
和
,因此可對角化為
。
按照先前方式計算冪矩陣,如下:
上式中 代表最小次為
的多項式。令
,則
。這個方法的主要缺點在於引入代數符號運算。當
的尺寸增大時,計算過程變得尤其複雜。例如,
,令
和
代表兩個相異極小數,不難想像
有相當繁瑣的對角化展開式。
除了對角化,還有別的方法嗎?欲跳脫思路的陷阱,我們應暫時遺忘可對角化與不可對角化之間的對立,並將注意力集中在問題本身──冪矩陣。仔細觀察後發現 滿足
。這個事實稱為 Cayley-Hamilton 定理,它指出:對於任一
階矩陣
,令
為
的特徵多項式 (或
亦可),則
,也就是說,矩陣
被其特徵多項式消滅 (見“Cayley-Hamilton 定理”)。此例
的特徵多項式是
,
就有 。利用恆等式
,我們可以計算更高次的冪矩陣:
重複此過程,任一冪矩陣 皆可以表示成
和
的線性組合。從另一個角度來看,設想
除以
的表達式:
,
其中 代表商,
和
是未定係數。因為
,可知
。接下來要解出
和
。考慮多項式除法:
。
為了從 的表達式得到兩個條件式 (因為有兩個未知係數),求上式等號兩邊的導數,即有
。
將 代入上面兩式可得
,
解出 ,
,所以
。
除了計算冪矩陣,Cayley-Hamilton 定理是否也可以用來計算一般的矩陣函數 ?(關於矩陣函數的定義,請見“矩陣函數 (上)”和“矩陣函數 (下)”。) 答案是肯定的。利用泰勒展開式和 Cayley-Hamilton 定理
,任何
階矩陣 (不論是否可對角化)
的良好定義函數
都可表示成矩陣多項式:
。
設 有相異特徵值
,且
為對應的相重數 (亦稱代數重數),則
的特徵多項式為
。
考慮
對於特徵值 ,我們可以使用
個限制條件:
。因為
,所以共有
個條件式可以用來決定係數
,以矩陣形式表示如下:
,
其中由特徵值構成的 階係數矩陣是可逆的,因此保證
唯一存在,也就有唯一的
。係數矩陣為可逆矩陣的理由如下:(一) 最上面分塊包含相異特徵值的
個列屬於 Vandermonde 矩陣
的一部分,因此是線性獨立的 (見“特殊矩陣 (8):Vandermonde 矩陣”);(二) 隨後的各分塊皆可表示為
,其中
是可逆對角矩陣,因此也是線性獨立的;(三) 各分塊的領先行位置相異,如第一分塊起始於第一行,第二分塊起始於第二行,故各分塊彼此獨立。
下面以一個例子展示計算步驟。考慮 ,求
。
(1) 求出特徵多項式 ,可知
有特徵值
。
(2) 令 。寫出函數
的多項式除法表達式:
。
求 的導數,
,
其中 是整理合併後的多項式。
(3) 將 和
代入
,並將
代入
,可得限制條件式:
或表示為矩陣形式:
。
由上式解出
,
也就得到
相較於對角化 或 Jordan 典型形式
,利用 Cayley-Hamilton 定理計算矩陣函數
有三個明顯的優點:(一) 不須計算特徵向量或廣義特徵向量;(二) 不須計算特徵向量矩陣
或
的逆矩陣;(三) 不須計算 Jordan 矩陣
,自然也就免除
的繁瑣算式 (見“矩陣函數 (下)”)。然而,此法必須使用一般矩陣乘法算出所有的冪矩陣
,
。提醒讀者,二個
階矩陣相乘需要
個乘法運算,因此乘法運算總量是
。換句話說,本文介紹的這個方法僅適用於小尺寸矩陣。
请问周老师良好定义函数是怎样的函数呢?