二階方陣的平方根

本文的閱讀等級:中級

A 是一個 n\times n 階矩陣。若同階矩陣 B 使得 B^2=A,我們稱 BA 的一個平方根。對角化是矩陣平方根的標準算法。若 A 可對角化為 A=SDS^{-1},其中 S 是一個可逆矩陣,D=\hbox{diag}(\lambda_1,\ldots,\lambda_n) 的主對角元 \lambda_iA 的特徵值。若 CD 的一個平方根,C^2=D,則 B=SCS^{-1}A 的一個平方根。若 A 有兩兩相異的非零特徵值,則存在 2^n 個平方根 B=S\,\hbox{diag}(\pm\sqrt{\lambda_1},\ldots,\pm\sqrt{\lambda_n})\,S^{-1}。但如果 A 有相重特徵值或 \lambda_i=0,取決於 A 的 Jordan 典型形式,A 可能不存在平方根,存在少於 2^n 或無窮多個平方根。特別的,2\times 2 階矩陣的平方根公式相當簡單,原因在於其逆矩陣、特徵值與特徵向量都有容易處理的代數式。

 
考慮 2\times 2 階矩陣 A=\begin{bmatrix} a&b\\ c&d \end{bmatrix}B^2=A。根據 Cayley-Hamilton 定理 (見“三階逆矩陣公式”),

B^2-(\hbox{trace} B)B+(\det B)I_2=0

因為 \det(B^2)=(\det B)^2=\det A,將 \det B=\pm\sqrt{\det A} 代入上式,

(\hbox{trace}B) B=A\pm\sqrt{\det A}I_2

計算等號兩邊的跡數,左邊是 \hbox{trace}\left((\hbox{trace}B) B\right)=(\hbox{trace}B)^2,右邊是 \hbox{trace}\left(A\pm\sqrt{\det A}I_2\right)=\hbox{trace}A\pm 2\sqrt{\det A},合併可得

(\hbox{trace}B)^2=\hbox{trace}A\pm 2\sqrt{\det A}

為簡化符號,令 \tau=\hbox{trace}A=a+d\delta=\pm\sqrt{\det A}=\pm\sqrt{ad-bc}。因此,\hbox{trace}B=\pm\sqrt{\tau+2\delta},並得到平方根公式

\displaystyle B=\pm\frac{1}{\sqrt{\tau+2\delta}}(A+\delta I_2)=\pm\frac{1}{\sqrt{\tau+2\delta}}\begin{bmatrix} a+\delta&b\\ c&d+\delta \end{bmatrix}

舉一個例子,A=\begin{bmatrix} 1&2\\ 3&4 \end{bmatrix},則 \tau=5\delta=\pm\sqrt{-2}。將數值代入上式,

\displaystyle B=\pm\left(\frac{1}{\sqrt{5\pm 2\sqrt{-2}}}\begin{bmatrix} 1\pm\sqrt{-2}&2\\ 3&4\pm\sqrt{-2} \end{bmatrix}\right)

請注意,括弧內必須選擇相同的正負號。此例中,A 的 4 個平方根都是複矩陣。

 
接下來,我們討論 \delta\tau+2\delta 如何決定 A 的平方根數。寫出 A 的特徵多項式 p(t)=t^2-(\hbox{trace}A)t+\det A=t^2-\tau t+\delta^2,兩根即為 A 的特徵值:

\displaystyle \lambda_1=\frac{1}{2}\left(\tau+\sqrt{\tau^2-4\delta^2}\right), ~~~ \lambda_2=\frac{1}{2}\left(\tau-\sqrt{\tau^2-4\delta^2}\right)

上式指出 \tau^2=4\delta^2 等價於 \lambda_1=\lambda_2。底下根據 \tau^2-4\delta^2\delta 的數值分開四種情況討論:

  1. \tau^2\neq 4\delta^2\delta\neq 0:若 A 可逆且特徵值相異,即 A 相似於 \begin{bmatrix} \lambda_1&0\\ 0&\lambda_2 \end{bmatrix}\lambda_1\neq\lambda_2\lambda_1\lambda_2\neq 0,上述平方根公式成立,則 A 有 4 個平方根,如前例。
  2. \tau^2\neq 4\delta^2\delta=0:若 A 不可逆且特徵值相異,即 A 相似於 \begin{bmatrix} \lambda&0\\ 0&0 \end{bmatrix}\lambda\neq 0,平方根公式成立,但 A 僅有 2 個平方根。例如,\begin{bmatrix} 1&1\\ 1&1 \end{bmatrix} 的平方根為 \pm\frac{1}{\sqrt{2}}\begin{bmatrix} 1&1\\ 1&1 \end{bmatrix}
  3. \tau^2=4\delta^2\delta\neq 0:若 A 可逆並有相重特徵值,平方根公式僅於 \delta 使得 \tau+2\delta\neq 0 時方成立。這裡面又可以區分為兩種情況。如果 A 不可對角化,即 A 相似於 \begin{bmatrix} \lambda&1\\ 0&\lambda \end{bmatrix}\lambda\neq 0,則 A 有 2 個平方根。例如,\begin{bmatrix} 1&1\\ 0&1 \end{bmatrix} 的平方根為 \pm\begin{bmatrix} 1&\frac{1}{2}\\ 0&1 \end{bmatrix}。如果 A 可對角化,即 A=\begin{bmatrix} \lambda&0\\ 0&\lambda \end{bmatrix},上述公式給出 A 的 2 個平方根 \pm\begin{bmatrix} \sqrt{\lambda}&0\\ 0&\sqrt{\lambda} \end{bmatrix},但實際上,A 有無窮多個平方根。假設 B=\begin{bmatrix} p&q\\ r&s \end{bmatrix},則

    B^2=\begin{bmatrix} p^2+qr&q(p+s)\\ r(p+s)&s^2+qr \end{bmatrix}

    p+s=0p^2+qr=\lambda,則 s^2+qr=\lambda,使得 B^2=A。給定 \lambda\neq 0,滿足前述條件的 B 有無窮多個 (任意設 pq\neq 0,則 s=-pr=(\lambda-p^2)/q)。例如,\begin{bmatrix} 1&0\\ 0&1 \end{bmatrix} 的平方根有 \left[\!\!\begin{array}{cr} 1&0\\ 0&-1 \end{array}\!\!\right]\left[\!\!\begin{array}{cr} 1&1\\ 0&-1 \end{array}\!\!\right]\left[\!\!\begin{array}{cr} \frac{1}{2}&\frac{3}{4}\\ 1&-\frac{1}{2} \end{array}\!\!\right] 等。

  4. \tau=\delta=0:若 A 的特徵值皆為零,上述平方根公式完全失效,包含兩種可能:若 A\neq 0,即 A 相似於 \begin{bmatrix} 0&1\\ 0&0 \end{bmatrix},則 A 不存在平方根。證明於下:假設 B^2=A,則 (\hbox{trace}B)^2=\hbox{trace}A=0,即有 \hbox{trace}B=0。再者,A=(\hbox{trace}B)B\mp\sqrt{\det A}I_2=0,證畢。若 A=0,如 3 的討論,零矩陣有無窮多個平方根,例如,\begin{bmatrix} 0&1\\ 0&0 \end{bmatrix}\left[\!\!\begin{array}{cr} 1&-1\\ 1&-1 \end{array}\!\!\right]\left[\!\!\begin{array}{rr} 1&2\\ -\frac{1}{2}&-1 \end{array}\!\!\right] 等。
This entry was posted in 特徵分析, 線性代數專欄 and tagged , . Bookmark the permalink.

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s