連續論證法

本文的閱讀等級:中級

ABn\times n 階矩陣,我們曾經在“AB 和 BA 有何關係?”一文運用分塊矩陣乘法證明 ABBA 有相同的特徵值。本文介紹另一個簡易的證明方法,稱作連續論證法。先假設 A 是可逆矩陣,就有

AB=A(BA)A^{-1}

得知 AB 相似於 BA,故 ABBA 有相同的特徵值。接著再看 A 是不可逆矩陣的情況,這時 A 有零特徵值。考慮 A+\epsilon I,設 A\mathbf{x}=\lambda\mathbf{x},由 (A+\epsilon I)\mathbf{x}=A\mathbf{x}+\epsilon\mathbf{x}=(\lambda+\epsilon)\mathbf{x} 可知 A+\epsilon I 的特徵值等於 \lambda+\epsilon。這表示存在一正數 \delta,對於任意 \epsilon0<\epsilon<\delta,使得 A+\epsilon I 是可逆的。根據上述結果,(A+\epsilon I)BB(A+\epsilon I) 也有相同的特徵值,亦即,對於 0<\epsilon<\delta

\det((A+\epsilon I)B-tI)=\det(B(A+\epsilon)-tI)

由於行列式為其各元的連續函數,上式等號兩邊同是連續函數。當 \epsilon\rightarrow 0ABBA 有相同的特徵多項式:

\det(AB-tI)=\det(BA-tI)

所以,不論 A 是否可逆,ABBA 有相同的特徵值。

 
再看一個例子。矩陣乘積 AB 的伴隨矩陣 (adjugate) 具有下列性質:

\mathrm{adj}(AB)=(\mathrm{adj}B)(\mathrm{adj}A)

回顧伴隨矩陣的主要關係式:

A(\mathrm{adj}A)=(\mathrm{adj}A)A=(\det A)I

A 是可逆時,\mathrm{adj}A=(\det A)A^{-1}。若 AB 都是可逆矩陣,可推得

\begin{aligned}  \mathrm{adj}(AB)&=\det(AB)(AB)^{-1}\\  &=(\det A)(\det B)(B^{-1}A^{-1})\\    &=(\det B)B^{-1}(\det A)A^{-1}\\  &=(\mathrm{adj}B)(\mathrm{adj}A)\end{aligned}

考慮不可逆的情況,將 A+\epsilon IB+\epsilon I 分別取代上式的 AB

\mathrm{adj}((A+\epsilon I)(B+\epsilon I))=\mathrm{adj}(B+\epsilon I)\mathrm{adj}(A+\epsilon I)

\epsilon\rightarrow 0,即證得所求。

 
從上面的例子可以歸納出連續論證法的三個推論步驟:

  1. 考慮可逆矩陣 A,設法證明命題成立。
  2. A 不可逆,將 A 替換為 A+\epsilon I
  3. 利用函數對 \epsilon 的連續性可獲致結論。

連續論證法常應用於與行列式有關的證明問題,下為一例。設 ABCDn 階方陣,若 CD=DC,則

\begin{vmatrix}    A&B\\    C&D    \end{vmatrix}=\det(AD-BC)

證明如下。先考慮可逆矩陣 D,設計分塊矩陣乘法:

\begin{bmatrix}    A&B\\    C&D    \end{bmatrix}\begin{bmatrix}    I&0\\    -D^{-1}C&I    \end{bmatrix}=\begin{bmatrix}    A-BD^{-1}C&B\\    0&D    \end{bmatrix}

上式等號兩邊取行列式,利用矩陣乘積的行列式可乘公式,即得

\begin{vmatrix}    A&B\\    C&D    \end{vmatrix}\cdot\begin{vmatrix}    I&0\\    -D^{-1}C&I    \end{vmatrix}=\begin{vmatrix}    A-BD^{-1}C&B\\    0&D    \end{vmatrix}

分塊矩陣 \begin{bmatrix}    I&0\\    -D^{-1}C&I    \end{bmatrix} 的特徵值全為 1,故其行列式等於 1。分塊上三角矩陣 \begin{bmatrix}    A-BD^{-1}C&B\\    0&D    \end{bmatrix} 的行列式即為主對角分塊行列式乘積,就有

\begin{aligned}  \begin{vmatrix}    A-BD^{-1}C&B\\    0&D    \end{vmatrix}&=\det(A-BD^{-1}C)\cdot(\det D)\\  &=\det(AD-BD^{-1}CD)\end{aligned}

使用已知條件 CD=DC,導出

\begin{vmatrix}    A&B\\    C&D    \end{vmatrix}=\det(AD-BD^{-1}CD)=\det(AD-BC)

D 不可逆時,考慮 D+\epsilon I,上述結果可表示為

\begin{vmatrix}    A&B\\    C&D+\epsilon    \end{vmatrix}=\det(A(D+\epsilon I)-BC)

最後,令 \epsilon\rightarrow 0,即得證。

 
再看一個的類似問題。若 CD^T+DC^T=0D 是可逆矩陣,則

\begin{vmatrix}    A&B\\    C&D    \end{vmatrix}=\det(AD^T+BC^T)

考慮下面的分塊矩陣乘法並代入已知條件,可得

\begin{bmatrix}    A&B\\    C&D    \end{bmatrix}\begin{bmatrix}    D^T&0\\    C^T&I    \end{bmatrix}=\begin{bmatrix}    AD^T+BC^T&B\\    0&D    \end{bmatrix}

等號兩邊取行列式,

\begin{vmatrix}    A&B\\    C&D    \end{vmatrix}\cdot\det D^T=\det(AD^T+BC^T)\cdot\det D

由於 D 是可逆的,\det D^T=\det D\neq 0,即證畢。若 D 為不可逆矩陣,則原命題不成立,例如,

A=\begin{bmatrix}    1&0\\    0&0    \end{bmatrix},~ B=\begin{bmatrix}    0&0\\    0&1    \end{bmatrix},~ C=\begin{bmatrix}    0&1\\    0&0    \end{bmatrix},~ D=\begin{bmatrix}    0&0\\    1&0    \end{bmatrix}

將數值代入計算得到

\begin{vmatrix}    A&B\\    C&D    \end{vmatrix}=\begin{vmatrix}    1&0&0&0\\    0&0&0&1\\    0&1&0&0\\    0&0&1&0    \end{vmatrix}=1

然而 \det(AD^T+BC^T)=\begin{vmatrix}    0&1\\    1&0    \end{vmatrix}=-1。讀者或許疑惑:把 D 替換為 D+\epsilon I 不就可以得到結果,為何這次當 D 是不可逆時,卻又不成立了呢?按照連續論證法的步驟二,將 DD+\epsilon I 替代之後,我們還必須小心檢查對於任意 \epsilon0<\epsilon<\delta,原來的命題條件是否依然成立。上例中,縱使 CD^T+DC^T=0,但對任意 0<\epsilon<\deltaC(D+\epsilon I)^T+(D+\epsilon I)C^T=\epsilon(C+C^T) 未必總是等於零矩陣。

 
除了摻雜擾動後的矩陣仍需滿足給定條件,連續論證法還要求推論過程所牽涉的函數必須是連續的。考慮 A=\begin{bmatrix}    \epsilon&0\\    1&0    \end{bmatrix}\epsilon>0,不難確認 A=MJM^{-1},其中 M=\begin{bmatrix}    0&\epsilon\\    1&1    \end{bmatrix},Jordan 形式為 J=\begin{bmatrix}    0&0\\    0&\epsilon    \end{bmatrix}。當 \epsilon\rightarrow 0A\rightarrow\begin{bmatrix}    0&0\\    1&0    \end{bmatrix}J\rightarrow\begin{bmatrix}    0&0\\    0&0    \end{bmatrix},但實際上,\begin{bmatrix}    0&0\\    1&0    \end{bmatrix} 的 Jordan 形式為 \begin{bmatrix}    0&1\\    0&0    \end{bmatrix}。連續論證法之所以失效是因為矩陣秩 \mathrm{rank}A 並非 A 各元的連續函數,例如,A=\begin{bmatrix}    1&0\\    0&\epsilon    \end{bmatrix},若 \epsilon\neq 0\mathrm{rank}A=2,但若 \epsilon=0,則 \mathrm{rank}A=1

 
本文參考
Fuzhen Zhang, Matrix Theory, Springer, 1999.

This entry was posted in 線性代數專欄, 行列式 and tagged , . Bookmark the permalink.

14 則回應給 連續論證法

  1. levinc 說:

    老師好,
    第二段我有個小小疑惑請教:
    A 是不可逆矩陣的情況,這時A有零特徵值。考慮A+\epsilon I ,設Ax=\lambda x ,則(A+\epsilon I)x = (\lambda + \epsilon)x
    可知(A+\epsilon I)的特徵值等於 \lambda + \epsilon……

    但,這邊不是違背在A不可逆的前提,\lamdba不是會變零(或 Ax=0)了嘛?
    這不是矛盾?

    總覺得那邊怪怪的…也許我理解錯誤

  2. levinc 說:

    在det(A B; C D)= det(AD-BC) 這個例子裡,當AC=CA, 也可以得出相同結果呢~^^

  3. ccjou 說:

    正是因為 A 有特徵值 \lambda=0,我們才故意將 A 替換為 A^{\prime}=A+\epsilon I,只要適當選擇夠小的 \epsilon 可使矩陣 A^{\prime} 的特徵值 \lambda+\epsilon=\epsilon 不為零。這麼一來,A^{\prime} 是可逆矩陣,原來的命題對 A^{\prime} 也就當然成立了。

    關於第二個迴響。當 AC=CA
    \begin{vmatrix} A&B\\ C&D \end{vmatrix}=\mathrm{det}(AD-CB)
    注意,這回不是 \mathrm{det}(AD-BC)

    其實還有另兩個相似結果: DB=BDAB=BA,你可以自己試一下。

  4. levinc 說:

    了解。
    這個方法蠻好用的
    我後來翻了一些matrix theory的書,大多也是使用這個論証法呢

  5. GSX 說:

    為什麼最後一個是 “因為rankA並非A各元的連續函數" 呢?

    照題目的話是 “因為A的Jordan form各元並非A各元的連續函數" 但這要怎麼看?

    還是說要怎麼用 “rankA非連續函數" 來直接說明這個問題呢@@?

  6. ccjou 說:

    上文確實沒講清楚。

    矩陣 A 的 Jordan 矩陣 J 未必是 A 各元的連續函數,原因是 J 的 Jordan 分塊結構由 \mathrm{rank}(A-\lambda_i I)^pp=1,2,\ldots 所決定,而 \mathrm{rank}(A-\lambda_i I) 並非 A 各元的連續函數。

  7. GSX 說:

    喔喔,原來如此!

    所以是因為那個例子中有lambda=0

    所以說 rank(A-lambda*I) = rank A 若非連續函數則Jordan form也就一定不是連續函數。

  8. ccjou 說:

    不僅如此而已,還有一件更悲慘的事情:求特徵多項式根,亦即特徵值,在本質上是一個病態問題,也就是說,特徵值很容易受到多項式係數的微小擾動(來自矩陣各元)而發生劇烈改變。

    換言之,不止 \mathrm{rank} 不是 A 各元的連續函數,連 \lambda_i 都很容易受 A 的元的小變化而亂亂跑。

  9. GSX 說:

    原來如此,不過那個例子中特徵根倒是不會有劇烈變化就是。

    但我還想問:特徵值是否為各元的連續函數?

    總覺得好像是?

    eigenvalue與矩陣element的關係讓我想到我有另一個問題想問,我把他問在討論區了~

  10. ccjou 說:

    嗯 腦袋停止運轉了 明天或後天再說囉 星期六晚上大家都應該休息一下

    聽聽 miles davis 吧

  11. GSX 說:

    哈哈,好

    來聽聽看XD

  12. ccjou 說:

    特徵值是矩陣各元的連續函數,只不過仰賴解特徵多項式的根不是很好的特徵值計算法。

  13. GSX 說:

    那我要怎麼證明他是連續函數呢?

    另外多項式係數與其根應該也是連續函數的關係?

    為什麼是連續函數卻會不好呢?

  14. ccjou 說:

    多項式係數與其根是連續函數的關係,沒錯。

    類似情況:線性方程式 Ax=b 的解也是 A 的各元的連續函數,使用 Cramer’s rule 將解表示為兩行列式的比值,由此可見。但是線性方程可能是良置或病態,特徵值也有同樣的遭遇,所以特徵值的敏感度分析也是數值線性代數中的一個重要主題。有些數值方法對計算誤差很敏感,因此不適合實際應用,直接解特徵多項式的根就是一例。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s