線性變換觀點下的矩陣乘積

本文的閱讀等級:初級

A 是一 m\times m 階矩陣,B 是一 m\times n 階矩陣。矩陣乘積 AB 存在很多種解釋方式。例如,若 A 為基本矩陣,則 AB 表示對 B 執行列運算。另外,我們也可以視 A 為一線性變換,則 AB 代表 B 的行向量 \mathbf{b}_1,\ldots,\mathbf{b}_n 經變換矩陣 A 的映射結果:

\begin{aligned}  AB&=A\begin{bmatrix}    \mathbf{b}_1&\cdots&\mathbf{b}_n    \end{bmatrix}=\begin{bmatrix}    A\mathbf{b}_1&\cdots&A\mathbf{b}_n    \end{bmatrix}\end{aligned}

除了上述兩種觀點 (見“左乘還是右乘,這就是問題所在”),還有一種較不常見的解釋。令 M_{m\times n}(\mathbb{R}) 是所有 m\times n 階實矩陣所形成的向量空間,我們視 AB 為定義於 {M}_{m\times n}(\mathbb{R}) 之上的線性算子,表示為

T(B)=AB

上式中,矩陣 A 是線性算子 T 執行的變換程序,矩陣 B 則為 T 所處理的數學物件。本文藉由證明下面三個命題說明如何運用向量空間分析、特徵分析和線性變換的矩陣表達解析這種看似複雜的線性變換:(1) 若 T 可逆,則 A 也可逆,反之亦然;(2) TA 有相同的特徵值;(3) 若 T 可對角化,則 A 也可對角化,反之亦然(取自清大數研所2009年入學試題)。

 
第一個問題相對簡單。若 T 可逆,T 的零空間僅含零矩陣,因此 T(B)=AB=0 有唯一解 B=0,故 A 的零空間只包含零向量,證得 A 為可逆矩陣。明顯地,反向陳述也為真。

 
\lambdaT 的一特徵值,就有 T(X)=\lambda X,其中「特徵向量」 X\neq 0,所以 AX=\lambda X。令 \mathbf{x}X 的一非零行向量,則 A\mathbf{x}=\lambda\mathbf{x},推知 \lambda 也是 A 的特徵值。反過來說,設 A\mathbf{x}=\lambda\mathbf{x},令 X 的各行都為 \mathbf{x},可得

\begin{aligned}  T(X)&=A\begin{bmatrix}    \mathbf{x}&\cdots&\mathbf{x}    \end{bmatrix}=\begin{bmatrix}    A\mathbf{x}&\cdots&A\mathbf{x}    \end{bmatrix}=\lambda\begin{bmatrix}    \mathbf{x}&\cdots&\mathbf{x}    \end{bmatrix}=\lambda X\end{aligned}

故知 \lambda 也是 T 的特徵值。

 
要解決最後一個問題,我們先將線性算子 T 的矩陣表達式寫出。考慮向量空間 M_{m\times n}(\mathbb{R}) 的標準有序基底:

\mathfrak{B}=\{E_{11},E_{21},\ldots,E_{m1},E_{12},E_{22},\ldots,E_{m2},\ldots,E_{1n},E_{2n},\ldots,E_{mn}\}

其中 E_{ij} 除了 (i,j) 元為 1,其餘各元皆為 0。令 a_{ij} 表示 A(i,j) 元,不難驗證

T(E_{ij})=AE_{ij}=a_{1i}E_{1j}+a_{2i}E_{2j}+\cdots+a_{mi}E_{mj},~~i=1,\ldots,m,~j=1,\ldots,n

2\times 3 階矩陣為例,

\begin{aligned}  T(E_{11})&=a_{11}E_{11}+a_{21}E_{21}\\    T(E_{21})&=a_{12}E_{11}+a_{22}E_{21}\\    T(E_{12})&=a_{11}E_{12}+a_{21}E_{22}\\    T(E_{22})&=a_{12}E_{12}+a_{22}E_{22}\\    T(E_{13})&=a_{11}E_{13}+a_{21}E_{23}\\    T(E_{23})&=a_{12}E_{13}+a_{22}E_{23}\end{aligned}

所以 T 參考有序基底 \mathfrak{B} 的表示矩陣為(見“線性變換表示矩陣”)

\begin{aligned}  &[T]_{\mathfrak{B}}\\  &=\begin{bmatrix}    [T(E_{11})]_{\mathfrak{B}}&[T(E_{21})]_{\mathfrak{B}}&[T(E_{12})]_{\mathfrak{B}}&[T(E_{22})]_{\mathfrak{B}}&[T(E_{13})]_{\mathfrak{B}}&[T(E_{23})]_{\mathfrak{B}}    \end{bmatrix}\\    &=\begin{bmatrix}    a_{11}&a_{12}&0&0&0&0\\    a_{21}&a_{22}&0&0&0&0\\    0&0& a_{11}&a_{12}&0&0\\    0&0& a_{21}&a_{22}&0&0\\    0&0&0&0& a_{11}&a_{12}\\    0&0&0&0& a_{21}&a_{22}    \end{bmatrix}=\begin{bmatrix}    A&0&0\\    0&A&0\\    0&0&A    \end{bmatrix}\end{aligned}

推廣至 M_{m\times n}(\mathbb{R})[T]_{\mathfrak{B}} 即為包含 nm\times m 階主對角分塊 Amn\times mn 階矩陣:

[T]_{\mathfrak{B}}=\begin{bmatrix}    A&~&~\\    ~&\ddots&~\\    ~&~&A    \end{bmatrix}

由上式可知 T 的特徵多項式為

p_{T}(t)=\det([T]_{\mathfrak{B}}-tI)=(\det(A-tI_m))^n=(p_A(t))^n

A 可對角化為 A= S \Lambda S^{-1},則 T 也可對角化為

[T]_{\mathfrak{B}}=\begin{bmatrix}    S&~&~\\    ~&\ddots&~\\    ~&~&S    \end{bmatrix}\begin{bmatrix}    \Lambda&~&~\\    ~&\ddots&~\\    ~&~&\Lambda    \end{bmatrix}\begin{bmatrix}    S^{-1}&~&~\\    ~&\ddots&~\\    ~&~&S^{-1}    \end{bmatrix}

反之,若 T 可對角化,顯然相同的主對角分塊 A 也被可對角化。

 
以矩陣乘積表現的線性變換可以發展出許多變形,例如,T(X)=AXB,關於此變換的特徵分析請參閱“每週問題 December 14, 2009”。此外,如果將矩陣乘積 AB 看成複合線性變換,透過子空間分析能夠讓我們深入了解 AB 的實際作為,詳細討論請見“矩陣乘積的子空間分析”。

This entry was posted in 線性變換, 線性代數專欄 and tagged . Bookmark the permalink.

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s