解讀複特徵值

本文的閱讀等級:初級

A 為一 n\times n 階實矩陣。若 A 的特徵值為複數,矩陣 A 所代表的線性變換有何作為?如果 A 是常微分方程的係數矩陣,微分方程 \frac{d\mathbf{u}}{dt}=A\mathbf{u}(t) 的解又有甚麼特性?複特徵值常出現在一些科學和工程應用中,通過探討此問題可以聯繫線性代數和微分方程之間的關係。

 
我們從一個具有特殊型態的二階方陣開始討論。考慮

A=\left[\!\!\begin{array}{cr}    a&-b\\    b&a    \end{array}\!\!\right]

其中 a,b\in\mathbb{R},且不全為零。由 A 的特徵多項式 p(t)=\det(tI-A)=(t-a)^2+b^2 可解出兩特徵值 \lambda=a\pm ib,其中 i=\sqrt{-1}。令 r=\vert\lambda\vert=\sqrt{a^2+b^2}\neq 0\theta=\mathrm{tan}^{-1}({b}/{a}),也就有 a=r\cos\thetab=r\sin\theta,故 A 可表示為

A=\begin{bmatrix}    r&0\\    0&r    \end{bmatrix}\left[\!\!\begin{array}{cr}    \cos\theta&-\sin\theta\\    \sin\theta&\cos\theta    \end{array}\!\!\right]

對於任意 \mathbf{x}=\begin{bmatrix}    x\\    y    \end{bmatrix}\in\mathbb{R}^2

A\mathbf{x}=r\begin{bmatrix}    \cos\theta\cdot x-\sin\theta\cdot y\\    \sin\theta\cdot x+\cos\theta\cdot y    \end{bmatrix}

上式指出線性變換 A 將向量 \mathbf{x} 旋轉 \theta 徑度 (弧度,radian),然後伸縮 r 倍 (執行順序可交換)。若將 \mathbb{R}^2 取代為複數空間 \mathbb{C},則線性變換 \mathbf{x}\rightarrow{A}\mathbf{x} 等同於複數乘法 w\rightarrow{zw},其中 z=re^{i\theta}w=x+iy。利用歐拉公式 e^{i\theta}=\cos\theta+i\sin\theta,計算確認

\begin{aligned}  zw&=r(\cos\theta+i\sin\theta)(x+iy)\\    &=r(\cos\theta\cdot x-\sin\theta\cdot y)+ir(\sin\theta\cdot x+\cos\theta\cdot y).\end{aligned}

 
見下例[1],二階方陣

A=\left[\!\!\begin{array}{rr}    -2&-2.5\\    10&-2    \end{array}\!\!\right]

有共軛特徵值 \lambda_1=-2+i5\lambda_2=-2-i5,對應的共軛特徵向量分別為 \mathbf{x}_1=\begin{bmatrix}    i\\    2    \end{bmatrix}\mathbf{x}_2=\left[\!\!\begin{array}{r}    -i\\    2    \end{array}\!\!\right]。考慮一般情況,令 A 為一 n\times n 階實矩陣,\lambda 為一複特徵值,\mathbf{x} 為對應的複特徵向量。因為 A 是實矩陣,\overline{A}=A。對特徵方程 A\mathbf{x}=\lambda\mathbf{x} 等號兩邊同時計算共軛,等號左邊是

\overline{A\mathbf{x}}=\overline{A}\overline{\mathbf{x}}=A\overline{\mathbf{x}}

等號右邊是

\overline{\lambda\mathbf{x}}=\overline{\lambda}\overline{\mathbf{x}}

所以,\overline{\lambda} 也是 A 的特徵值且 \overline{\mathbf{x}} 為對應的特徵向量。這說明了實方陣的複特徵值與特徵向量以成對的共軛方式出現。

 
下面我們從座標變換和微分方程兩種途徑解釋複特徵值的涵義。設 2\times 2 階實矩陣 A 有特徵值 \lambda=a-ibb\neq 0,對應的特徵向量為 \mathbf{x}。令 \mathrm{Re}(\mathbf{x}) 表示抽取複向量 \mathbf{x} 的實部,\mathrm{Im}(\mathbf{x}) 抽取 \mathbf{x} 的虛部,亦即 \mathbf{x}=\mathrm{Re}(\mathbf{x})+i\mathrm{Im}(\mathbf{x}),則 A\mathbf{x}=\lambda\mathbf{x} 可表示為

A\left(\mathrm{Re}(\mathbf{x})+i\mathrm{Im}(\mathbf{x})\right)=(a-ib)\left(\mathrm{Re}(\mathbf{x})+i\mathrm{Im}(\mathbf{x})\right)

將實部與虛部分離,

\begin{aligned}  A\mathrm{Re}(\mathbf{x})&=a\mathrm{Re}(\mathbf{x})+b\mathrm{Im}(\mathbf{x})\\    A\mathrm{Im}(\mathbf{x})&=-b\mathrm{Re}(\mathbf{x})+a\mathrm{Im}(\mathbf{x}).\end{aligned}

二維實向量 \mathrm{Re}(\mathbf{x})\mathrm{Im}(\mathbf{x}) 是線性獨立集,因為若 \mathrm{Im}(\mathbf{x})=k\mathrm{Re}(\mathbf{x}),則實部方程式可化簡為 A\mathrm{Re}(\mathbf{x})=(a+bk)\mathrm{Re}(\mathbf{x}),這指出 A 有實特徵值 a+bk,與原假設矛盾。將上面二式合併為矩陣形式:

A\begin{bmatrix}    \mathrm{Re}(\mathbf{x})&\mathrm{Im}(\mathbf{x})    \end{bmatrix}=\begin{bmatrix}    \mathrm{Re}(\mathbf{x})&\mathrm{Im}(\mathbf{x})    \end{bmatrix}\left[\!\!\begin{array}{cr}    a&-b\\    b&a    \end{array}\!\!\right]

\Lambda=\left[\!\!\begin{array}{cr}    a&-b\\    b&a    \end{array}\!\!\right]S=\begin{bmatrix}    \mathrm{Re}(\mathbf{x})&\mathrm{Im}(\mathbf{x})    \end{bmatrix}。因為 S 是可逆矩陣,就有

A=S\Lambda{S}^{-1}

換句話說,線性變換矩陣 A 參考以特徵向量組成的基底 \mathfrak{B}=\left\{\mathrm{Re}(\mathbf{x}),\mathrm{Im}(\mathbf{x})\right\} 的變換表示矩陣即為由特徵值 \lambda=a-ib 所決定的旋轉與伸縮複合變換:

[A]_{\mathfrak{B}}=\Lambda

[\mathbf{v}]_{\mathfrak{B}} 代表向量 \mathbf{v} 參考基底 \mathfrak{B} 的座標向量,則 A\mathbf{v} 可分解如下:

解讀複特徵值

 
接下來我們考慮微方方程 \frac{d\mathbf{u}}{dt}=A\mathbf{u}(t)。設 A 有共軛複特徵值 \lambda=a+ib\overline{\lambda}=a-ib,對應的特徵向量為 \mathbf{x}\overline{\mathbf{x}}。微分方程有兩個特解 (見“從不變子空間切入特徵值問題”):

\mathbf{u}(t)=e^{\lambda t}\mathbf{x},~~  \overline{\mathbf{u}(t)}=\overline{e^{\lambda t}}\overline{\mathbf{x}}

通解 \mathbf{y}(t) 即為 \mathbf{u}(t)\overline{\mathbf{u}(t)} 的線性組合:

\mathbf{y}(t)=\alpha_1\mathbf{u}(t)+\alpha_2\overline{\mathbf{u}(t)}

因為 \mathbf{y}(t) 是一實向量,\overline{\mathbf{y}(t)}=\mathbf{y}(t),推知 \alpha_1\alpha_2 是共軛複數。分別設 \alpha_1=\frac{1}{2},以及 \alpha_1=\frac{1}{2i},可得

\begin{aligned}  \mathrm{Re}(e^{\lambda t}\mathbf{x})&=\displaystyle\frac{1}{2}\left(\mathbf{u}(t)+\overline{\mathbf{u}(t)}\right)\\    \mathrm{Im}(e^{\lambda t}\mathbf{x})&=\frac{1}{2i}\left(\mathbf{u}(t)-\overline{\mathbf{u}(t)}\right),\end{aligned}

這說明 \mathbf{u}(t)=e^{\lambda t}\mathbf{x} 的實部與虛部也是特解。當 b\neq 0 時,\mathrm{Re}(\mathbf{x})\mathrm{Im}(\mathbf{x}) 構成一線性獨立集,故通解的解基 (解的基底) 為 \mathrm{Re}(e^{\lambda t}\mathbf{x})\mathrm{Im}(e^{\lambda t}\mathbf{x})。微分方程的解基和上述座標變換所使用的基底向量 \mathrm{Re}(\mathbf{x})\mathrm{Im}(\mathbf{x}) 具有明顯的對照關係。

 
上例中,

A=\left[\!\!\begin{array}{rr}    -2&-2.5\\    10&-2    \end{array}\!\!\right]=\left[\!\!\begin{array}{cr}    0&-1\\    2&0    \end{array}\!\!\right]\left[\!\!\begin{array}{rr}    -2&-5\\    5&-2    \end{array}\!\!\right]\left[\!\!\begin{array}{cr}    0&-1\\    2&0    \end{array}\!\!\right]^{-1}

故微分方程 \frac{d\mathbf{u}}{dt}=A\mathbf{u}(t) 有兩個 (複) 特解:

\mathbf{u}(t)=e^{(-2+i5)t}\begin{bmatrix}    i\\    2    \end{bmatrix},~\overline{\mathbf{u}}(t)=e^{(-2-i5)t}\left[\!\!\begin{array}{r}    -i\\    2    \end{array}\!\!\right]

使用歐拉公式將 \mathbf{u}(t) 展開,可得

\mathbf{u}(t)=e^{-2t}(\cos 5t+i\sin 5t)\begin{bmatrix}    i\\    2    \end{bmatrix}

其中實部和虛部分別為

\mathrm{Re}(\mathbf{u}(t))=e^{-2t}\left[\!\!\begin{array}{r}    -\sin 5t\\    2\cos 5t    \end{array}\!\!\right],~~  \mathrm{Im}(\mathbf{u}(t))=e^{-2t}\left[\!\!\begin{array}{r}    \cos 5t\\    2\sin 5t    \end{array}\!\!\right]

通解即為上面二式的線性組合,如下:

\mathbf{y}(t)=c_1e^{-2t}\left[\!\!\begin{array}{r}    -\sin 5t\\    2\cos 5t    \end{array}\!\!\right]+c_2e^{-2t}\left[\!\!\begin{array}{r}    \cos 5t\\    2\sin 5t    \end{array}\!\!\right]

上式中,未知實係數 c_1c_2 由給出的初始值決定。下圖顯示不同初始值產生的軌跡 \mathbf{y}(t)。旋轉效果來自於複特徵值產生的正弦和餘弦函數,乘數 e^{at} (此例為 a=-20,螺旋軌跡將遠離原點朝外部運動,又如果 a=0,軌跡為一環繞原點運動的橢圓。

具有複特徵值的動態系統軌跡

 
參考來源:
[1] 取自 David C. Lay 的 Linear Algebra and its Applications,第三版,2006。

延伸閱讀:
Advertisements
本篇發表於 特徵分析, 線性代數專欄 並標籤為 , , 。將永久鏈結加入書籤。

4 則回應給 解讀複特徵值

  1. 12345 說道:

    在此文舉出的例中,A=\left[\!\!\begin{array}{rr}    -2&-2.5\\    10&-2    \end{array}\!\!\right],兩複數特殊解似乎多了一個常數e

  2. ryan 說道:

    請問 複數特徵值所代表的意義為何?
    謝謝

    • ccjou 說道:

      上文提供了從座標變換和微分方程解釋方陣A的複特徵值。簡單講,如果存在複特徵值,參考某一基底,A可表示為伸縮與旋轉的複合變換。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s