線性變換的轉置

本文的閱讀等級:中級

A 為一個 m\times n 階矩陣且 \mathbf{x}\mathbf{y}n 維向量。通過矩陣乘法,矩陣 An 維向量 \mathbf{x} 映射至 m 維向量 A\mathbf{x}。矩陣 A 是一個從幾何向量空間 \mathbb{C}^n 映至 \mathbb{C}^m 的線性變換,因為矩陣乘法滿足 A(\mathbf{x}+\mathbf{y})=A\mathbf{x}+A\mathbf{y}A(c\mathbf{x})=cA\mathbf{x}c 是純量。類似地,n\times m 階轉置矩陣 (transpose) A^T 是一個從 \mathbb{C}^m 映至 \mathbb{C}^n 的線性變換 (見“轉置矩陣的意義”)。既然每一個矩陣都是線性變換,我們可以反過來問:對於線性變換 T:\mathcal{V}\to\mathcal{W},其中 \mathcal{V}\mathcal{W} 是有限維向量空間,如何定義線性變換 T 的轉置變換?1970年代以前出版的線性代數教本經常從線性變換的轉置來定義矩陣的轉置[1]。這套論述固然嚴謹扎實,但必須建立在線性泛函 (linear functional) 和對偶空間 (dual space) 的基礎上,對於非數學專業的讀者多少總會增加負擔,故現今大概只有專為數學系課程撰寫的教科書才會納入這個論點[2]。在開始討論之前,我們先回顧相關的線性泛函和對偶空間的預備知識 (詳見 “線性泛函與對偶空間”)。

 
\mathcal{V} 為一個向量空間。如果 f:\mathcal{V}\to\mathbb{C} 是一個線性變換,我們稱之為線性泛函。簡單講,所謂線性泛函就是到達域 (codomain) 為數值的線性變換。舉例來說,令 \mathcal{P}_2 代表二次多項式 p(t)=c_2t^2+c_1t+c_0 所形成的向量空間。積分是線性運算,可知

\displaystyle\begin{aligned}  f(p(t))&=\int_{0}^1p(t)dt=\int_0^1(c_2t^2+c_1t+c_0)dt=\frac{1}{3}c_2+\frac{1}{2}c_1+c_0\\  g(p(t))&=\int_{-1}^1p(t)dt=\int_{-1}^1(c_2t^2+c_1t+c_0)dt=\frac{2}{3}c_2+2c_0  \end{aligned}

是線性泛函。粗淺地說,我們可以將線性泛函 fg 分別看作數組 (\frac{1}{3},\frac{1}{2},1)(\frac{2}{3},0,2)。如同幾何向量加法和純量乘法運算,線性泛函也有加法和純量乘法運算,例如,

\displaystyle\begin{aligned}  (f+g)\left(p(t)\right)&=f\left(p(t)\right)+g\left(p(t)\right)\\  &=\left(\frac{1}{3}+\frac{2}{3}\right)c_2+\left(\frac{1}{2}+0\right)c_1+(1+2)c_0\\  &=c_2+\frac{1}{2}c_1+3c_0\end{aligned}

對應數組加法 (\frac{1}{3},\frac{1}{2},1)+(\frac{2}{3},0,2)=(1,\frac{1}{2},3),以及

\displaystyle\begin{aligned}  (2f)\left(p(t)\right)&=2f\left(p(t)\right)\\  &=2\left(\frac{1}{3}c_2+\frac{1}{2}c_1+c_0\right)\\  &=\frac{2}{3}c_2+c_1+2c_0  \end{aligned}

對應數組純量乘法 2(\frac{1}{3},\frac{1}{2},1)=(\frac{2}{3},1,2)。從以上結果可推斷線性泛函 f:\mathcal{V}\to\mathbb{C} 所形成的集合也是一個向量空間,稱為 \mathcal{V} 的對偶空間,記作

\displaystyle  \mathcal{V}^\ast=\{f\vert f:\mathcal{V}\to\mathbb{C}\}

對偶的意思是存在兩個互相對應的物件。上例中,線性泛函 f(p(t))=\frac{1}{3}c_2+\frac{1}{2}c_1+c_0 和二次多項式 q(t)=\frac{1}{3}t^2+\frac{1}{2}t+1 具有一對一的對應關係,縱使它們相互對應的意義並不明確,但至少說明了 \mathcal{P}_2 的對偶空間 \mathcal{P}_2^\ast 同構於 (isomorphic) \mathcal{P}_2 (見“同構的向量空間”)。一般情況同樣成立,對偶空間 \mathcal{V}^\ast 同構於 \mathcal{V},記為 \mathcal{V}^\ast\cong\mathcal{V},也就有 \dim \mathcal{V}^\ast=\dim \mathcal{V}

 
向量空間 \mathcal{V} 與對偶空間 \mathcal{V}^\ast 存在甚麼具體的關係呢?要清楚地回答這個問題必須從基底著手。令 \boldsymbol{\beta}=\{\mathbf{v}_1,\ldots,\mathbf{v}_n\}\mathcal{V} 的一組基底,n=\dim\mathcal{V}。對於 \mathbf{x}=c_1\mathbf{v}_1+\cdots+c_n\mathbf{v}_n,定義線性泛函 f_i(\mathbf{x})=c_i1\le i\le n,也就是說,f_i 傳回向量 \mathbf{x} 所含 \mathbf{v}_i 的成分大小。我們可以證明 \boldsymbol{\beta}^\ast=\{f_1,\ldots,f_n\}\mathcal{V}^\ast 的一組基底,稱為對偶基底。明顯地,f_i(\mathbf{v}_j)=\delta_{ij},其中 \delta_{ij}=1i=j\delta_{ij}=0i\neq j。考慮 f=a_1f_1+\cdots+a_nf_n,就有 f(\mathbf{v}_j)=\sum_{i=1}^na_if_i(\mathbf{v}_j)=a_j。若對於每一 jf(\mathbf{v}_j)=0,即得 a_j=0,表明 \{f_1,\ldots,f_n\} 是線性獨立集。但 n=\mathrm{dim}\mathcal{V}^{\ast},得知 \boldsymbol{\beta}^{\ast}=\{f_1,\ldots,f_n\}\mathcal{V}^{\ast} 的一組基底,從推導過程並確定 \boldsymbol{\beta} 的對偶基底 \boldsymbol{\beta}^{\ast} 唯一存在。所以,任一線性泛函 f\in\mathcal{V}^{\ast} 可表示為

\displaystyle  f=\displaystyle\sum_{i=1}^na_if_i=\displaystyle\sum_{i=1}^nf(\mathbf{v}_i)f_i

而且任一向量 \mathbf{x}\in\mathcal{V} 可表示為

\displaystyle  \mathbf{x}=\displaystyle\sum_{j=1}^nc_j\mathbf{v}_j=\sum_{j=1}^nf_j(\mathbf{x})\mathbf{v}_j

合併上面二式,每一線性泛函 f\in\mathcal{V}^\ast 都具有下列表達式:

\displaystyle f(\mathbf{x})=a_1f_1(\mathbf{x})+\cdots+a_nf_n(\mathbf{x})=a_1c_1+\cdots+a_nc_n

 
例一:對偶基底

考慮 \mathcal{P}_2 的一組基底 \boldsymbol{\beta}=\{t^2-1,t+1,t^2+2t+2\}。令 \boldsymbol{\beta}^\ast=\{f_1,f_2,f_3\}\boldsymbol{\beta} 的對偶基底。根據定義,

\displaystyle\begin{aligned}  1&=f_1(t^2-1)=f_1(t^2)-f_1(1)\\  0&=f_1(t+1)=f_1(t)+f_1(1)\\  0&=f_1(t^2+2t+2)=f_1(t^2)+2f_1(t)+2f_1(1),  \end{aligned}

由此解得 f_1(t^2)=0f_1(t)=1f_1(1)=-1,故

\displaystyle   f_1(c_2t^2+c_1t+c_0)=c_1-c_0

將上式等號左邊替換為 (0,1,0) 可解出 f_2,替換為 (0,0,1) 可解出 f_3,如下:

\displaystyle\begin{aligned}   f_2(c_2t^2+c_1t+c_0)&=-2c_2+3c_1-2c_0\\  f_3(c_2t^2+c_1t+c_0)&=c_2-c_1+c_0.  \end{aligned}

 
回到我們的主題:若 \mathcal{V}\mathcal{W} 是兩個向量空間,如何定義線性變換 T:\mathcal{V}\to\mathcal{W} 的轉置?考慮線性泛函 g\in\mathcal{W}^\ast,使得每一 \mathbf{x}\in\mathcal{V}

\displaystyle  f(\mathbf{x})=g\left(T(\mathbf{x})\right)

明顯地,f 是一個從 \mathcal{V}\mathbb{C} 的映射,即 T:\mathcal{V}\to\mathcal{W}g:\mathcal{W}\to\mathbb{C} 的複合映射。因為 Tg 都是線性映射,可知 f 是一個線性泛函,故 f\in\mathcal{V}^\ast,見下圖:

線性變換的轉置

考慮映射 T^T:\mathcal{W}^\ast\to\mathcal{V}^\ast 使得 f=T^T(g),其中 fg 如前定義,也就有 \left[T^T(g)\right](\mathbf{x})=g(T(\mathbf{x}))。下面證明 T^T 是一個線性變換。假設 g_1,g_2\in\mathcal{W}^\ast,則

\displaystyle\begin{aligned}  \left[T^T(g_1+g_2)\right](\mathbf{x})  &=(g_1+g_2)\left(T(\mathbf{x})\right)\\  &=g_1\left(T(\mathbf{x})\right)+g_2\left(T(\mathbf{x})\right)\\  &=\left[T^T(g_1)\right](\mathbf{x})+\left[T^T(g_2)\right](\mathbf{x}),  \end{aligned}

因此 T^T(g_1+g_2)=T^T(g_1)+T^T(g_2)。假設 c 是純量,則

\displaystyle\begin{aligned}  \left[T^T(cg_1)\right](\mathbf{x})  &=(cg_1)\left(T(\mathbf{x})\right)\\  &=cg_1\left(T(\mathbf{x})\right)\\  &=c\left[T^T(g_1)\right](\mathbf{x}),  \end{aligned}

因此 T^T(cg_1)=cT^T(g_1)。整理以上討論結果:對於一個線性變換 T:\mathcal{V}\to\mathcal{W},存在唯一的線性變換 T^T:\mathcal{W}^\ast\to\mathcal{V}^\ast 使得每一 \mathbf{x}\in\mathcal{V}

\displaystyle  \left[T^T(g)\right](\mathbf{x})=g\left(T(\mathbf{x})\right)

其中 T^T 稱為線性變換 T 的轉置,圖示如下:

線性變換的轉置2

請注意,如果 \mathcal{V}\mathcal{W} 是內積空間且任意 \mathbf{v}\in\mathcal{V}\mathbf{w}\in\mathcal{W} 滿足 \left\langle\mathbf{w},T(\mathbf{v})\right\rangle=\left\langle T^\ast(\mathbf{w}),\mathbf{v}\right\rangle,我們稱 T^\ast:\mathcal{W}\to\mathcal{V}T:\mathcal{V}\to\mathcal{W} 的伴隨 (adjoint,見“線性泛函與伴隨”)。線性變換 T 的轉置 T^T 和伴隨 T^\ast 是兩個不同的線性變換。

 
對於矩陣 A,我們知道行秩等於列秩,即 \text{rank}A=\text{rank}A^T (見“行秩=列秩”)。線性變換 T 與轉置變換 T^T 也有相同的秩,這個事實可以直接從 TT^T 的表示矩陣推演而得。設 \dim\mathcal{V}=n\dim\mathcal{W}=m。令 \boldsymbol{\beta}=\{\mathbf{v}_1,\ldots,\mathbf{v}_n\}\mathcal{V} 的一組有序基底,對偶基底為 \boldsymbol{\beta}^\ast=\{f_1,\ldots,f_n\},且 \boldsymbol{\gamma}=\{\mathbf{w}_1,\ldots,\mathbf{w}_m\}\mathcal{W} 的一組有序基底,對偶基底為 \boldsymbol{\gamma}^\ast=\{g_1,\ldots,g_m\}。提醒讀者,雖然 f_ig_j 未以粗體字母表示,但它們都是屬於對偶空間的基底向量。令 m\times n 階矩陣 A=[a_{ij}]T 參考基底 \boldsymbol{\beta}\boldsymbol{\gamma} 的表示矩陣,或記為 [T]_{\boldsymbol{\beta}}^{\boldsymbol{\gamma}}[T(\boldsymbol{\beta})]_{\boldsymbol{\gamma}},並令 n\times m 階矩陣 B=[b_{ij}]T^T 參考基底 \boldsymbol{\gamma}^\ast\boldsymbol{\beta}^\ast 的表示矩陣,或記為 [T^T]_{\boldsymbol{\gamma}^\ast}^{\boldsymbol{\beta}^\ast}[T^T(\boldsymbol{\gamma}^\ast)]_{\boldsymbol{\beta}^\ast}。下面證明 B=A^T。根據線性變換表示矩陣的定義 (見“線代膠囊──線性變換表示矩陣”),

\displaystyle\begin{aligned}  T(\mathbf{v}_j)&=a_{1j}\mathbf{w}_1+\cdots+a_{mj}\mathbf{w}_m,~~1\le j\le n\\  T^T(g_j)&=b_{1j}f_1+\cdots+b_{nj}f_n,~~1\le j\le m.  \end{aligned}

使用 TT^T 的關係式,以及對偶基底定義,

\displaystyle\begin{aligned}  \left[T^T(g_j)\right](\mathbf{v}_i)&=g_j\left(T(\mathbf{v}_i)\right)=g_j\left(\sum_{k=1}^m a_{ki}\mathbf{w}_k\right)\\  &=\sum_{k=1}^m a_{ki}g_j(\mathbf{w}_k)=\sum_{k=1}^m a_{ki}\delta_{jk}=a_{ji}.  \end{aligned}

另一方面,任一 f\in\mathcal{V}^\ast 可表示為

\displaystyle  f=\sum_{i=1}^n f(\mathbf{v}_i)f_i

f=T^T(g_j) 代入上式,

\displaystyle  T^T(g_j)=\sum_{i=1}^n [T^T(g_j)](\mathbf{v}_i)f_i=\sum_{i=1}^n a_{ji}f_i

比較 T^T(g_j) 的兩個表達式,證得 b_{ij}=a_{ji},即 B=A^T。所以,如果 T:\mathcal{V}\to\mathcal{W} 是一個線性變換,參考某基底對的表示矩陣為 A,則轉置變換 T^T:\mathcal{W}^\ast\to\mathcal{V}^\ast 參考對偶基底對的表示矩陣即為 A^T。因為 T\cong AT^T\cong A^T,推得 \text{rank}T=\text{rank}A=\text{rank}A^T=\text{rank}T^T

 
例二:線性轉置變換的表示矩陣

給定 T:\mathcal{P}_2\to\mathbb{R}^2,定義為 T(p(t))=\begin{bmatrix}  p(0)\\  p(2)  \end{bmatrix}。考慮 \mathcal{P}_2 的標準基底 \boldsymbol{\beta}=\{t^2,t,1\}\mathbb{R}^2 的標準基底 \boldsymbol{\gamma}=\left\{\begin{bmatrix}  1\\  0\end{bmatrix},\begin{bmatrix}  0\\  1  \end{bmatrix}\right\}。寫出 T 參考基底 \boldsymbol{\beta}\boldsymbol{\gamma} 的表示矩陣:

\displaystyle  [T]_{\boldsymbol{\beta}}^{\boldsymbol{\gamma}}=[T(\boldsymbol{\beta})]_{\boldsymbol{\gamma}}=\begin{bmatrix}  [T(t^2)]_{\boldsymbol{\gamma}}&[T(t)]_{\boldsymbol{\gamma}}&[T(1)]_{\boldsymbol{\gamma}}  \end{bmatrix}=\begin{bmatrix}  0&0&1\\  4&2&1  \end{bmatrix}

\boldsymbol{\beta}\boldsymbol{\gamma} 的對偶基底分別為 \boldsymbol{\beta}^\ast=\{f_1,f_2,f_3\}\boldsymbol{\gamma}^\ast=\{g_1,g_2\}。線性轉置變換 T^T 參考基底 \boldsymbol{\gamma}^\ast\boldsymbol{\beta}^\ast 的表示矩陣為

\displaystyle  [T^T]_{\boldsymbol{\gamma}^\ast}^{\boldsymbol{\beta}^\ast}=[T^T(\boldsymbol{\gamma^\ast})]_{\boldsymbol{\beta}^\ast}=\begin{bmatrix}  [T^T(g_1)]_{\boldsymbol{\beta}^\ast}&[T^T(g_2)]_{\boldsymbol{\beta}^\ast}  \end{bmatrix}=\begin{bmatrix}  b_{11}&b_{12}\\  b_{21}&b_{22}\\  b_{31}&b_{32}  \end{bmatrix}

上式表明 T^T(g_1)=b_{11}f_1+b_{21}f_2+b_{31}f_3,因此

\displaystyle\begin{aligned}  \begin{bmatrix}  T^T(g_1)  \end{bmatrix}(t^2)&=[b_{11}f_1+b_{21}f_2+b_{31}f_3](t^2)\\  &=b_{11}f_1(t^2)+b_{21}f_2(t^2)+b_{31}f_3(t^2)\\  &=b_{11}\delta_{11}+b_{21}\delta_{21}+b_{31}\delta_{31}=b_{11}.  \end{aligned}

另一方面,線性轉置變換滿足

\displaystyle\begin{aligned}  \begin{bmatrix}  T^T(g_1)  \end{bmatrix}(t^2)&=g_1\left(T(t^2)\right)=g_1\left(\begin{bmatrix}  0\\  4  \end{bmatrix}\right)\\  &=4g_1\left(\begin{bmatrix}  0\\  1  \end{bmatrix}\right)=4\delta_{12}=0,\end{aligned}

b_{11}=0 。按照同樣方法,可得 b_{12}=4b_{21}=0b_{22}=2b_{31}=1b_{32}=1,得到與前述推論相同結果:

\displaystyle  [T^T]_{\boldsymbol{\gamma}^\ast}^{\boldsymbol{\beta}^\ast}=\begin{bmatrix}  0&4\\  0&2\\  1&1  \end{bmatrix}=\left([T]_{\boldsymbol{\beta}}^{\boldsymbol{\gamma}}\right)^T

 
引用來源:
[1] Kenneth Hoffman and Ray Kunze, Linear Algebra, 2nd ed., Prentice Hall, 1971, pp 111-115.
[2] Stephen H. Friedberg, Arnold J. Insel, and Lawrence E. Spence, Linear Algebra, 4th ed., Prentice Hall, 2003, pp 121-122.

Advertisement
This entry was posted in 線性變換, 線性代數專欄 and tagged , , , , , . Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s