答matrices──關於矩陣二次方程的求解問題

網友matrices留言:

老師您好,當我們在解矩陣為係數的矩陣方程式時,譬如,Y^2-PY+Q=0,其中 YPQ 皆為矩陣且皆有反矩陣,是不是就整個卡住了?也就是說因為矩陣並非都具有交換律的關係,使得這個問題就在這個部分就此停住,還是說我仍然可以利用其他方法來求出 YPQ 的關係?(我目前的想法是把 PY 分成有交換律和沒有交換律兩者來討論。)

 
答曰:

的確,多數人初見矩陣二次方程的第一個直覺反應是「套用一元二次方程的求解方法」。按照這個思路,我們自然會想到配方法 (見“從推導一元二次方程的公式看個性”)。不過,矩陣代數畢竟不同於一般代數,尤其是矩陣代數不存在乘法交換律,也就是說,(Y-P/2)^2=Y^2-YP/2-PY/2+P^2/4 未必等於 Y^2-PY+P^2/4。使用配方法硬幹好比在《末日之戰》(World War Z) 拿著對付吸血鬼的穿心木棍抵抗殭屍,不難想像結果如何。與其抱殘守缺因循舊法,我們不如另覓其他真正有效的斷頭兵器。請讀者默想:線性代數中最強大的致命武器是甚麼?毫無疑問,答案是奇異值分解和 Jordan 典型形式,後者尤以理論推導見長。Jordan 典型形式真的管用嗎?實驗是檢驗真理的唯一標準。不試一下怎麼知道呢?抓緊武器,準備上陣吧。

 
Y, P, Qn\times n 階矩陣。將 Y^2-PY+Q=0 改寫為 PY-Q=Y^2。設 Y 的 Jordan 形式為 Y=SJS^{-1},其中 J 是 Jordan 矩陣 (見“Jordan 形式大解讀 (上)”)。將上式代入二次方程,可得 PSJS^{-1}-Q=SJ^2S^{-1},再右乘 S,就有

\displaystyle  PSJ-QS=SJ^2

不論問題如何難以應付,它總是有一個弱點,更妙的是,弱點往往隱藏在防禦看似最堅固的地方。上式的弱點即在冪矩陣 J^2。欲瓦解 J^2,將 SJ 從上式分離出來,可得下列方程組:

\displaystyle\begin{aligned}  PR-QS&=RJ\\  R&=SJ,  \end{aligned}

或以分塊矩陣乘法表示為

\displaystyle  \begin{bmatrix}  P&-Q\\  I&0  \end{bmatrix}\begin{bmatrix}  R\\  S  \end{bmatrix}=\begin{bmatrix}  R\\  S  \end{bmatrix}J

其中所有的矩陣都是 n\times n 階。我們的目標要解出 RS,由此立得 Y=RS^{-1}

 

\displaystyle  A=\begin{bmatrix}  P&-Q\\  I&0  \end{bmatrix}

為便利分析,假設 A 是可對角化矩陣 (這個假設符合大多數現實應用)。在此情況下,我們可以證明 J 也是對角矩陣,換句話說,Y 亦可對角化。令 \mathbf{u}_1,\ldots,\mathbf{u}_n\in\mathbb{C}^{2n}(2n)\times n 階矩陣 \begin{bmatrix}  R\\  S  \end{bmatrix} 的行向量 (column vector)。設 (2n)\times(2n) 階矩陣 A 的矩陣譜 (相異特徵值集合) 為 \sigma(A)=\{ \lambda_1,\ldots,\lambda_m\}m\le 2n。假定 J 不是對角矩陣,即有一個至少二階的基本 Jordan 分塊

\displaystyle   \begin{bmatrix}  \lambda_j&1&&\\  &\ddots&\ddots&\\  &&\ddots&1\\  &&&\lambda_j  \end{bmatrix}

故存在 k 使得

\displaystyle\begin{aligned}  (A-\lambda_j I)\mathbf{u}_k&=\mathbf{0}\\  (A-\lambda_j I)\mathbf{u}_{k+1}&=\mathbf{u}_k,\end{aligned}

其中 \mathbf{u}_k 是對應特徵值 \lambda_j 的特徵向量,\mathbf{u}_{k+1} 是廣義特徵向量 (見“Jordan 形式大解讀 (下)”)。因為 A 可對角化,最小多項式僅含一次因式 (見“最小多項式 (下)):

\displaystyle  m_A(t)=(t-\lambda_1)\cdots(t-\lambda_m)

最小多項式 m_A(t) 消滅 A 矩陣,即 m_A(A)=0,所以

\displaystyle\begin{aligned}  \mathbf{0}=m_A(A)\mathbf{u}_{k+1}&=(A-\lambda_1I)\cdots(A-\lambda_{j-1}I)(A-\lambda_{j+1}I)\cdots(A-\lambda_m I)(A-\lambda_j I)\mathbf{u}_{k+1}\\  &=(A-\lambda_1I)\cdots(A-\lambda_{j-1}I)(A-\lambda_{j+1}I)\cdots(A-\lambda_m I)\mathbf{u}_k\\  &=(A-\lambda_1I)\cdots(A-\lambda_{j-1}I)(A-\lambda_{j+1}I)\cdots(\lambda_j-\lambda_m)\mathbf{u}_k\\  &=\cdots\\  &=(\lambda_j-\lambda_1)\cdots(\lambda_j-\lambda_{j-1})(\lambda_j-\lambda_{j+1})\cdots(\lambda_j-\lambda_m)\mathbf{u}_k.\end{aligned}

因為 \lambda_j\neq \lambda_ii\neq j,可推論 \mathbf{u}_k=\mathbf{0}。這與特徵向量的性質矛盾,故證明 J 是一個對角矩陣。

 
J=\hbox{diag}(\mu_1,\ldots,\mu_n),其中每一 \mu_i\in\sigma(A)。因為 \begin{bmatrix}  R\\  S  \end{bmatrix}=\begin{bmatrix}  \mathbf{u}_1&\cdots&\mathbf{u}_n  \end{bmatrix},故

\displaystyle  A\begin{bmatrix}  \mathbf{u}_1&\cdots&\mathbf{u}_n  \end{bmatrix}=\begin{bmatrix}  \mathbf{u}_1&\cdots&\mathbf{u}_n  \end{bmatrix}\begin{bmatrix}  \mu_1&&\\  &\ddots&\\  &&\mu_n  \end{bmatrix}

即得

\displaystyle  \begin{bmatrix}  A\mathbf{u}_1&\cdots&A\mathbf{u}_n  \end{bmatrix}=\begin{bmatrix}  \mu_1\mathbf{u}_1&\cdots&\mu_n\mathbf{u}_n  \end{bmatrix}

上式表明 \mathbf{u}_1,\ldots,\mathbf{u}_n 分別是 A 對應特徵值 \mu_1,\ldots,\mu_n2n 維特徵向量。令

\displaystyle  \mathbf{u}_i=\begin{bmatrix}  \mathbf{v}_i\\  \mathbf{w}_i  \end{bmatrix},~~~i=1,\ldots,n

其中 \mathbf{v}_i,\mathbf{w}_i\in\mathbb{C}^n。所以,

\displaystyle  R=\begin{bmatrix}  \mathbf{v}_1&\cdots&\mathbf{v}_n  \end{bmatrix},~~~S=\begin{bmatrix}  \mathbf{w}_1&\cdots&\mathbf{w}_n  \end{bmatrix}

如果 \{\mathbf{w}_1,\ldots,\mathbf{w}_n\} 是線性獨立集,則 S 是可逆矩陣,即得一解

\displaystyle  Y=RS^{-1}=\begin{bmatrix}  \mathbf{v}_1&\cdots&\mathbf{v}_n  \end{bmatrix}\begin{bmatrix}  \mathbf{w}_1&\cdots&\mathbf{w}_n  \end{bmatrix}^{-1}

 
最後還有一個問題:矩陣二次方程 Y^2-PY+Q=0 是否總是有解?也就是說,至少可以找到一個可逆矩陣 S?根據假設,A 是可對角化矩陣,因此有 2n 個線性獨立的特徵向量 \mathbf{u}_i=\begin{bmatrix}  \mathbf{v}_i\\  \mathbf{w}_i  \end{bmatrix},這些特徵向量的擴張充滿整個 \mathbb{C}^{2n},故所有的 \mathbf{w}_i 可擴張出 \mathbb{C}^n,我們只須挑選其中線性獨立的 n 個向量即可獲得一解。

廣告
本篇發表於 答讀者問, 典型形式 並標籤為 , , 。將永久鏈結加入書籤。

2 Responses to 答matrices──關於矩陣二次方程的求解問題

  1. vincent 說道:

    太牛了,高屋建瓴! 老师不知能否给一个线性代数最牛的十大技巧或思路列表。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s