轉置與共軛轉置

本文的閱讀等級:初級

矩陣具有加法和純量乘法運算。除了這兩個源自純量算術的運算,矩陣還有一個獨特的運算,稱為轉置 (transpose)。令 A=[a_{ij}] 為一個 m\times n 階矩陣。我們定義 A 的轉置,記作 A^T,為一個 n\times m 階矩陣,其中 (A^T)_{ij}=a_{ji}。換句話說,將 A 的列行對調即得轉置矩陣 A^T,如下例,

\begin{bmatrix} 1&4\\ 2&5\\ 3&6 \end{bmatrix}^T=\begin{bmatrix} 1&2&3\\ 4&5&6 \end{bmatrix}

明顯地,(A^T)^T=A。若 A 表示成分塊矩陣,則 A^T 不僅置換列行分塊,每一分塊也必須隨之轉置,例如,

\begin{bmatrix} A_{11}&A_{12}\\ A_{21}&A_{22} \end{bmatrix}^T=\begin{bmatrix} 1&\vline&4\\ 2&\vline&5\\ \hline 3&\vline&6 \end{bmatrix}^T=\begin{bmatrix} 1&2&\vline&3\\ \hline 4&5&\vline&6 \end{bmatrix}=\begin{bmatrix} A_{11}^T&A_{21}^T\\ A_{12}^T&A_{22}^T \end{bmatrix}

一般而言,轉置適用於實矩陣。在許多實際應用中,複矩陣的轉置常會附加共軛運算,稱為共軛轉置 (conjugate transpose)。複數 z=a+ib,其中 i=\sqrt{-1},的共軛定義為 \overline{z}=a-ib。類似複數的共軛運算,A=[a_{ij}] 的共軛矩陣為 \overline{A}=[\overline{a_{ij}}],共軛轉置則為 \overline{A}^T=\overline{A^T},或記作 A^{\ast}。例如,

\begin{bmatrix} 1+3i&4&i\\ -2i&0&2-i \end{bmatrix}^{\ast}=\begin{bmatrix} 1-3i&2i\\ 4&0\\ -i&2+i \end{bmatrix}

如同轉置運算,連續兩次共軛轉置不改變矩陣,(A^{\ast})^{\ast}=A。若 A 是一個實矩陣,共軛轉置退化成轉置,即 A^{\ast}=A^T。下面我們討論 (共軛) 轉置與其他矩陣運算的結合,並介紹一些由 (共軛) 轉置所界定的特殊矩陣。

 
A=[a_{ij}]B=[b_{ij}]m\times n 階矩陣,c 為純量 (實數或複數)。矩陣的 (共軛) 轉置是一個線性函數,即下列性質成立:

(A+B)^T=A^T+B^T,~~(A+B)^{\ast}=A^{\ast}+B^{\ast}

(cA)^T=cA^T,~~(cA)^{\ast}=\overline{c}A^{\ast}

證明於下:對於任一 ij

\left((A+B)^T\right)_{ij}=(A+B)_{ji}=a_{ji}+b_{ji}=(A^T)_{ij}+(B^T)_{ij}=(A^T+B^T)_{ij}

(A+B)^T=A^T+B^T;類似地,對於任一 ij

\left((cA)^T\right)_{ij}=(cA)_{ji}=ca_{ji}=c(A^T)_{ij}

(cA)^T=cA^T。共軛轉置的證明只要將 (\cdot)^T(\ast)^T 取代即可。

 
接著考慮矩陣乘法的轉置。令 A=[a_{ij}] 為一個 m\times n 階矩陣,B 為一個 n\times p 階矩陣,則

(AB)^T=B^TA^T,~~(AB)^{\ast}=B^{\ast}A^{\ast}

直接計算 (AB)^T(i,j) 元即可證明。下面介紹以「行」或「列」作為矩陣乘法運算單元的證法 (見“矩陣乘法的現代觀點 (一)”)。令 \mathbf{x}=[x_j] 為一個 n 維向量。將 A 以行向量表示為 A=\begin{bmatrix} \mathbf{a}_1&\cdots&\mathbf{a}_n \end{bmatrix},則

\begin{aligned} (A\mathbf{x})^T&=\left(x_1\mathbf{a}_1+\cdots+x_n\mathbf{a}_n\right)^T=x_1\mathbf{a}_1^T+\cdots+x_n\mathbf{a}_n^T\\ &=\begin{bmatrix} x_1&\cdots&x_n \end{bmatrix}\begin{bmatrix} \mathbf{a}_1^T\\ \vdots\\ \mathbf{a}_n^T \end{bmatrix}=\mathbf{x}^TA^T.\end{aligned}

B 以行向量表示,B=\begin{bmatrix} \mathbf{b}_1&\cdots&\mathbf{b}_p \end{bmatrix},利用上面結果,可得

\begin{aligned} (AB)^T&=\left(A\begin{bmatrix} \mathbf{b}_1&\cdots&\mathbf{b}_p \end{bmatrix}\right)^T=\begin{bmatrix} A\mathbf{b}_1&\cdots&A\mathbf{b}_p \end{bmatrix}^T\\ &=\begin{bmatrix} (A\mathbf{b}_1)^T\\ \vdots\\ (A\mathbf{b}_p)^T \end{bmatrix}=\begin{bmatrix} \mathbf{b}_1^TA^T\\ \vdots\\ \mathbf{b}_p^TA^T \end{bmatrix}=\begin{bmatrix} \mathbf{b}_1^T\\ \vdots\\ \mathbf{b}_p^T \end{bmatrix}A^T=B^TA^T.\end{aligned}

同樣地,共軛轉置的證明只要將轉置運算以共軛轉置運算取代即可。

 
A 是一個 n\times n 階可逆矩陣,(共軛) 轉置的逆矩陣等於逆矩陣的 (共軛) 轉置:

(A^T)^{-1}=(A^{-1})^T,~~(A^{\ast})^{-1}=(A^{-1})^{\ast}

給定 AA^{-1}=I,等號兩邊計算轉置,使用矩陣乘積的轉置公式,可得

(AA^{-1})^T=(A^{-1})^TA^T=I^T=I

因此證明 (A^T)^{-1}=(A^{-1})^T。共軛轉置的證明亦同。

 
某些矩陣的轉置不發生任何改變,譬如,

\begin{bmatrix} 1&2&3\\ 2&4&6\\ 3&6&9 \end{bmatrix},~~\begin{bmatrix} 1&0&0\\ 0&2&0\\ 0&0&3 \end{bmatrix}

A=[a_{ij}] 為一個 n\times n 階矩陣。若 A=A^T,即 a_{ij}=a_{ji},則 A 稱為對稱矩陣 (symmetric matrix)。若 A=A^{\ast},即 a_{ij}=\overline{a_{ji}},則 A 稱為共軛對稱矩陣,或 Hermitian 矩陣 (見“特殊矩陣 (9):Hermitian 矩陣”)。見下例,

A=\begin{bmatrix} 1&1+2i&-3i\\ 1-2i&2&4+i\\ 3i&4-i&3 \end{bmatrix},~~B=\begin{bmatrix} 1&1+2i&-3i\\ 1+2i&2i&4+i\\ -3i&4+i&3-2i \end{bmatrix}

目視可以確定 A 是 Hermitian 矩陣,但不是對稱矩陣。相反的,B 是對稱矩陣,但不是 Hermitian 矩陣。Hermitian 矩陣的主對角元必是實數,因為 a_{jj}=\overline{a_{jj}},但對稱矩陣的主對角元則未必是實數。給定矩陣 A,如何「製造」對稱矩陣和 Hermitian 矩陣?透過矩陣加法與乘法即可,如下:(1) A+A^T 是對稱矩陣,A+A^{\ast} 是 Hermitian 矩陣;(2) A^TAAA^T 是對稱矩陣,A^{\ast}AAA^\ast 是 Hermitian 矩陣。實對稱矩陣 (實矩陣且對稱) 與 Hermitian 矩陣可謂現今最具實用價值的特殊矩陣 (見“Hermitian 矩陣與實對稱矩陣的一些實例”),這是我們定義矩陣轉置與共軛轉置的主要動機。最後列舉轉置矩陣所界定的一些特殊矩陣:

  • 對稱矩陣:A^T=A
  • 反對稱矩陣:A^T=-A
  • Hermitian 矩陣:A^T=\overline{A} (或 A^\ast=A)
  • Skew-Hermitian 矩陣:A^T=-\overline{A} (或 A^\ast=-A)
  • 正交 (orthogonal) 矩陣:A^T=A^{-1}
  • 么正 (unitary) 矩陣:A^T=\overline{A}^{-1} (或 A^\ast=A^{-1})
延伸閱讀:
This entry was posted in 線性方程, 線性代數專欄 and tagged , , , , . Bookmark the permalink.

3 則回應給 轉置與共軛轉置

  1. Watt Lin 說:

    如果這篇文章提到「虛數」的 i ,採用特別字型符號,像是Mathematica軟體,用粗體鏤空小寫i表達虛數,閱讀的感覺會更好。
    (但是Mathematica輸入過程可用大寫 I 當作虛數單位,初學者或許會與單位矩陣 I 混淆。)
    我沒有混淆,但初學者看到老師這篇文章,i與j可代表row與column位置,i又當作虛數單位,會不會少數人在腦子裡有一種奇怪的感覺?
    也許不會,但是,以認知心理的觀點,虛數的 i,與足標的 i,在印刷時,若能作顯著之區分,整體感受會更好。
    我推測,大多數人看到老師這篇文章,不致於發生混淆,但仍想表達個人淺見。
    我看的書不多,不知國內外教科書,有沒有哪些已經注意到這種小細節?
    大概很少學生提這種問題,若是問了,老師可能會回答:「很容易判斷,哪個是虛數,哪個是足標,明顯可以區別。」
    未來的教科書,如果希望帶給讀者清晰的觀念,可能要認真考慮,同一篇文章裡,避免以完全相同形狀的符號去表達兩種不同的事物。
    或許不容易達到,若要提升教學品質,值得深思!
    假設教育部有通盤規劃,幫助學生在數學、物理、化學等科目,常用的符號,儘量代表單一含義,在跨科目之間也不混淆,那麼對於整體科學教育,應該能夠大幅改善。(我知道,短時間內,不易達成。)

    • ccjou 說:

      虛數符號確實容易產生混淆。目前多數書本採用小寫斜體 ij 來表示虛數,但首次出現時會立刻在後面補充 i=\sqrt{-1}。在我印象中,僅見過 Carl Meyer 的線代課本 (http://www.matrixanalysis.com/Chapter7.pdf, pp 556) 刻意採用羅馬字型 \mathrm{i} 來代表虛數,譬如,2+\mathrm{i}3。就增進符號的可讀性而言,近代的數學課本其實比過去好很多。在1960年代,很多作者用小寫斜體字母表示向量(如 x),所以讀到 \alpha x,讀者必須自行判斷 \alpha 是純量,x 是向量。甚至到今天,那些專為數學系學生寫的課本(如 Friedberg等三人的Linear Algebra, 4th edition)仍使用 Ax=b。不得不說,數學家們似乎不怎麼關心「友善易讀」這件事。

      • Watt Lin 說:

        排版過程,用不同字型,區分不同含義的符號,可看出編者用心為使用者設想。
        但是在網路寫部落格,好像仍然存在一些技術上的困難。
        如果找到方便而有效率的方法,達成改善,其他網站跟著改善,將會是學生之福。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 變更 )

Twitter picture

You are commenting using your Twitter account. Log Out / 變更 )

Facebook照片

You are commenting using your Facebook account. Log Out / 變更 )

Google+ photo

You are commenting using your Google+ account. Log Out / 變更 )

連結到 %s