線性泛函與伴隨

本文的閱讀等級:高級

線性泛函 (linear functional) 為一從向量空間 \mathcal{V} 映射至純量 \mathbb{C} 的線性變換 (見“線性泛函與對偶空間”),如下例,

f(x_1,x_2,x_3)=2x_1-3x_2+x_3

是一個定義於 \mathbb{R}^3 的線性泛函。我們經常將 f 視為向量 (2,-3,1)(x_1,x_2,x_3) 的內積,也就是說,對於 \mathbf{x}=(x_1,x_2,x_3)^T\in\mathbb{R}^3,線性泛函 f 可寫成 f(\mathbf{x})=\mathbf{a}^T\mathbf{x},其中 \mathbf{a}=(2,-3,1)^T。根據這個觀察,我們推想定義於內積空間 \mathcal{V} 的線性泛函 f,是否都可以表示為 f(\mathbf{x})=\left\langle\mathbf{a},\mathbf{x}\right\rangle?這裡 \left\langle\mathbf{a},\mathbf{x}\right\rangle 代表廣義內積運算 (見“內積的定義”)。再看另一個例子,令 \mathcal{P}_2(\mathbb{R}) 是所有二次實多項式形成的向量空間,其中多項式 f(t)g(t) 的內積定義為

\left\langle f,g\right\rangle\overset{\underset{\mathrm{def}}{}}{=}\displaystyle\int_0^1f(t)g(t)dt

對於 p(t)\in\mathcal{P}_2(\mathbb{R}),考慮以下函數

L(p)=\displaystyle\int_0^{1}p(t)(\cos\pi t)dt

因為積分是線性運算,可知 L(p) 是一個定義於 \mathcal{P}_2(\mathbb{R}) 的線性泛函。同樣的問題,線性泛函 L(p) 可否表示成

L(p)=\displaystyle\int_0^1a(t)p(t)dt

其中 a(t) 屬於 \mathcal{P}_2(\mathbb{R})?注意,\cos\pi t 不屬於 \mathcal{P}_2(\mathbb{R}),此例 a(t) 不像前一個例子那麼容易確定,因此更凸顯下面這個定理的威力──它不僅證明原先的猜想,同時也給出一個計算方法。

 
線性泛函的唯一內積表達定理

f 是一定義於有限維內積空間 \mathcal{V} 的線性泛函,則存在唯一向量 \mathbf{a}\in\mathcal{V} 使得

f(\mathbf{x})=\left\langle\mathbf{a},\mathbf{x}\right\rangle

其中 \mathbf{x}\mathcal{V} 中任意向量。

 
此定理的證明運用內積的半雙線性性質:

\begin{aligned} \left\langle\mathbf{x},\mathbf{y}+\mathbf{z}\right\rangle&=\left\langle\mathbf{x},\mathbf{y}\right\rangle+\left\langle\mathbf{x},\mathbf{z}\right\rangle\\    \left\langle\mathbf{x}+\mathbf{z},\mathbf{y}\right\rangle&=\left\langle\mathbf{x},\mathbf{y}\right\rangle+\left\langle\mathbf{z},\mathbf{y}\right\rangle\\    \left\langle\mathbf{x},c\mathbf{y}\right\rangle&=c\left\langle\mathbf{x},\mathbf{y}\right\rangle\\    \left\langle c\mathbf{x},\mathbf{y}\right\rangle&=\overline{c}\left\langle\mathbf{x},\mathbf{y}\right\rangle\end{aligned}

我們先證明存在一 \mathbf{a}\in\mathcal{V} 使得 f(\mathbf{x})=\left\langle\mathbf{a},\mathbf{x}\right\rangle。令 \{\mathbf{q}_1,\ldots,\mathbf{q}_n\} 為向量空間 \mathcal{V} 的一組單範正交基底 (orthonormal basis),亦即若 i=j\left\langle\mathbf{q}_i,\mathbf{q}_j\right\rangle=1,若 i\neq j\left\langle\mathbf{q}_i,\mathbf{q}_j\right\rangle=0。任何 \mathbf{x}\in\mathcal{V} 可唯一表示為 \mathbf{q}_1,\ldots,\mathbf{q}_n 的線性組合:

\mathbf{x}=c_1\mathbf{q}_1+\cdots+c_n\mathbf{q}_n

利用單範正交基底性質,即得 \left\langle\mathbf{q}_i,\mathbf{x}\right\rangle=c_ii=1,\ldots,n\mathbf{x} 就有極簡表達式:

\mathbf{x}=\left\langle\mathbf{q}_1,\mathbf{x}\right\rangle\mathbf{q}_1+\cdots+\left\langle\mathbf{q}_n,\mathbf{x}\right\rangle\mathbf{q}_n

將上式代入 f(\mathbf{x}),充分發揮線性泛函和內積性質,可推導出以下結果:

\begin{aligned}  f(\mathbf{x})&=f\left(\left\langle\mathbf{q}_1,\mathbf{x}\right\rangle\mathbf{q}_1+\cdots+\left\langle\mathbf{q}_n,\mathbf{x}\right\rangle\mathbf{q}_n \right)\\    &=\left\langle\mathbf{q}_1,\mathbf{x}\right\rangle f(\mathbf{q}_1)+\cdots+\left\langle\mathbf{q}_n,\mathbf{x}\right\rangle f(\mathbf{q}_n)\\    &=\left\langle\overline{f(\mathbf{q}_1)}\mathbf{q}_1,\mathbf{x}\right\rangle +\cdots+\left\langle\overline{f(\mathbf{q}_n)}\mathbf{q}_n,\mathbf{x}\right\rangle\\    &=\left\langle\overline{f(\mathbf{q}_1)}\mathbf{q}_1+\cdots+\overline{f(\mathbf{q}_n)}\mathbf{q}_n,\mathbf{x}\right\rangle\end{aligned}

因此得到 f(\mathbf{x})=\left\langle\mathbf{a},\mathbf{x}\right\rangle,其中

\mathbf{a}=\overline{f(\mathbf{q}_1)}\mathbf{q}_1+\cdots+\overline{f(\mathbf{q}_n)}\mathbf{q}_n

接著證明僅有唯一 \mathbf{a}\in\mathcal{V} 符合所求。假設 \mathcal{V} 中向量 \mathbf{a}_1\mathbf{a}_2 使得 f(\mathbf{x})=\left\langle\mathbf{a}_1,\mathbf{x}\right\ranglef(\mathbf{x})=\left\langle\mathbf{a}_2,\mathbf{x}\right\rangle,將兩式相減,0=\left\langle\mathbf{a}_1,\mathbf{x}\right\rangle-\left\langle\mathbf{a}_2,\mathbf{x}\right\rangle=\left\langle\mathbf{a}_1-\mathbf{a}_2,\mathbf{x}\right\rangle,設 \mathbf{x}=\mathbf{a}_1-\mathbf{a}_2,立得 \mathbf{a}_1-\mathbf{a}_2=\mathbf{0},即 \mathbf{a}_1=\mathbf{a}_2,故證明 \mathbf{a} 唯一存在。

 
回到前面的例子,考慮 \mathcal{P}_2(\mathbb{R}) 的標準基底 \{p_1(t)=1,p_2(t)=t,p_3(t)=t^2\},執行 Gram-Schmidt 正交化可得到一組正交基底,步驟如下:

(1)

\begin{aligned}  u_1(t)&=p_1(t)=1\end{aligned}

(2)

\begin{aligned}  u_2(t)&=p_2(t)-\displaystyle\frac{\left\langle u_1,p_2\right\rangle}{\left\langle u_1,u_1\right\rangle}u_1(t)\\  &=t-\frac{1/2}{1}1=t-\frac{1}{2}\end{aligned}

(3)

\begin{aligned}  u_3(t)&=p_3(t)-\displaystyle\frac{\left\langle u_1,p_3\right\rangle}{\left\langle u_1,u_1\right\rangle}u_1(t) -\frac{\left\langle u_2,p_3\right\rangle}{\left\langle u_2,u_2\right\rangle}u_2(t)\\  &=t^2-\frac{1/3}{1}1-\frac{1/12}{1/12}\left(t-\frac{1}{2}\right)\\  &=t^2-t+\frac{1}{6}\end{aligned}

再將這些基底予以正規化,

\begin{aligned}  q_1(t)&=\displaystyle\frac{u_1(t)}{\Vert u_1\Vert}=1\\    q_2(t)&=\frac{u_2(t)}{\Vert u_2\Vert}=\sqrt{12}\left(t-\frac{1}{2}\right)\\    q_3(t)&=\frac{u_3(t)}{\Vert u_3\Vert}=\sqrt{180}\left(t^2-t+\frac{1}{6}\right)\end{aligned}

一旦有了單範正交基底,便可以套入公式:

a(t)=\overline{L(q_1)}q_1(t)+\overline{L(q_2)}q_2(t)+\overline{L(q_3)}q_3(t)

運用部分積分算出

\begin{aligned}  L(q_1)&=\displaystyle\int_0^11(\cos\pi t)dt=0\\  L(q_2)&=\int_0^1\sqrt{12}\left(t-\frac{1}{2}\right)(\cos\pi t)dt=-\frac{2\sqrt{12}}{\pi}\\  L(q_3)&=\int_0^1\sqrt{180}\left(t^2-t+\frac{1}{6}\right)(\cos\pi t)dt=2\sqrt{180}\left(\frac{1}{\pi}-\frac{1}{\pi^2}\right)\end{aligned}

整理以上結果得到

\begin{aligned}  a(t)&=\displaystyle-\frac{24}{\pi}\left(t-\frac{1}{2}\right)+360\left(\frac{1}{\pi}-\frac{1}{\pi^2}\right)\left(t^2-t+\frac{1}{6}\right)\\  &=360\left(\frac{1}{\pi}-\frac{1}{\pi^2}\right)t^2+\left(\frac{360}{\pi^2}-\frac{372}{\pi}\right)t+\frac{66}{\pi}-\frac{60}{\pi^2}\end{aligned}

 
L(\mathcal{V},\mathcal{W}) 代表所有從向量空間 \mathcal{V} 映至 \mathcal{W} 的線性變換組成的集合 (見“線性變換集合構成向量空間”)。若 T\in L(\mathcal{V},\mathcal{W}),線性泛函的唯一內積表達定理最主要的用處在於架構線性變換 T 的自然且唯一的反向變換 T^{\ast}:\mathcal{W}\to\mathcal{V},稱為 T 的伴隨 (adjoint)。選定 \mathbf{w}\in\mathcal{W},考慮下面這個定義於 \mathcal{V} 的線性泛函:對於 \mathbf{v}\in\mathcal{V}

f(\mathbf{v})=\left\langle \mathbf{w},T\mathbf{v}\right\rangle

唯一內積表達定理指出必定有唯一的 \mathbf{a}\in\mathcal{V} 使得 f(\mathbf{v})=\left\langle\mathbf{a},\mathbf{v}\right\rangle。令 T^{\ast} 為一從 \mathcal{W} 映至 \mathcal{V} 的變換,且滿足 \mathbf{a}=T^{\ast}\mathbf{w},即有

\left\langle\mathbf{w},T\mathbf{v}\right\rangle=\left\langle T^{\ast}\mathbf{w},\mathbf{v}\right\rangle

針對給定線性變換 T,對於任何 \mathbf{w}\in\mathcal{W},滿足上式的 T^{\ast}\mathbf{w} 唯一存在,也就證明 T 的伴隨 T^{\ast} 唯一存在。

 
下面以一個例子說明如何計算線性變換的伴隨。考慮 T:\mathbb{R}^3\to\mathbb{R}^2,定義如下:

T(x_1,x_2,x_3)=(x_1-x_2+3x_3,2x_1)

因此伴隨 T^{\ast}\mathbb{R}^2 映至 \mathbb{R}^3。對於 (y_1,y_2)\in\mathbb{R}^2,我們從 T^{\ast} 的定義開始,代入給定的線性變換 T,計算後再予以重組,過程如下:

\begin{aligned}  \left\langle T^{\ast}(y_1,y_2),(x_1,x_2,x_3)\right\rangle&=\left\langle(y_1,y_2),T(x_1,x_2,x_3)\right\rangle\\    &=\left\langle(y_1,y_2),(x_1-x_2+3x_3,2x_1)\right\rangle\\    &=y_1x_1-y_1x_2+3y_1x_3+2y_2x_1\\    &=\left\langle(y_1+2y_2,-y_1,3y_1),(x_1,x_2,x_3)\right\rangle\end{aligned}

比較首尾式子,即得

T^{\ast}(y_1,y_2)=(y_1+2y_2,-y_1,3y_1)

細心的讀者應該已注意到線性變換 T 與其伴隨 T^{\ast} 參考 \mathbb{R}^2\mathbb{R}^3 標準基底的表示矩陣分別是

A=\left[\!\!\begin{array}{crc}    1&-1&3\\    2&0&0    \end{array}\!\!\right],~A^T=\left[\!\!\begin{array}{rc}    1&2\\    -1&0\\    3&0    \end{array}\!\!\right]

換句話說,線性變換 T:\mathbb{R}^n\to\mathbb{R}^m 和伴隨 T^{\ast} 可類比於 m\times n 階表示矩陣 A 和轉置 A^T。但請讀者特別注意,若參考一組非單範正交基底,則 T^{\ast} 參考該基底的表示矩陣未必是 T 的表示矩陣的轉置,這一點將留待文末詳細說明。

 
上例中,T^{\ast}:\mathbb{R}^2\to\mathbb{R}^3 是一線性變換。事實上,任意線性變換的伴隨必定也是線性變換,因此若 T\in L(\mathcal{V},\mathcal{W}),則 T^{\ast}\in L(\mathcal{W},\mathcal{V})。運用線性變換和內積運算性質即可證明。先檢查可加性,考慮 \mathbf{w}_1,\mathbf{w}_2\in\mathcal{W},就有

\begin{aligned}  \left\langle T^{\ast}(\mathbf{w}_1+\mathbf{w}_2),\mathbf{v}\right\rangle&=\left\langle\mathbf{w}_1+\mathbf{w}_2,T\mathbf{v}\right\rangle\\  &=\left\langle\mathbf{w}_1,T\mathbf{v}\right\rangle+\left\langle\mathbf{w}_2,T\mathbf{v}\right\rangle\\    &=\left\langle T^{\ast}\mathbf{w}_1,\mathbf{v}\right\rangle+\left\langle T^{\ast}\mathbf{w}_2,\mathbf{v}\right\rangle\\  &=\left\langle T^{\ast}\mathbf{w}_1+T^{\ast}\mathbf{w}_2,\mathbf{v}\right\rangle\end{aligned}

由於 T^{\ast}(\mathbf{w}_1+\mathbf{w}_2) 是唯一的,故可斷定

T^{\ast}(\mathbf{w}_1+\mathbf{w}_2)=T^{\ast}\mathbf{w}_1+T^{\ast}\mathbf{w}_2

再檢查均勻性,若 c 為一純量,則

\begin{aligned}  \left\langle T^{\ast}(c\mathbf{w}),\mathbf{v}\right\rangle&=\left\langle c\mathbf{w},T\mathbf{v}\right\rangle=\overline{c}\left\langle\mathbf{w},T\mathbf{v}\right\rangle=\overline{c}\left\langle T^{\ast}\mathbf{w},\mathbf{v}\right\rangle=\left\langle cT^{\ast}\mathbf{w},\mathbf{v}\right\rangle\end{aligned}

同樣道理,因為 T^{\ast}(c\mathbf{w}) 是唯一的,必定有

T^{\ast}(c\mathbf{w})=cT^{\ast}\mathbf{w}

因此證明了 T^{\ast} 是一線性變換。

 
繼續往下討論前,我們先彙整一些伴隨的重要性質。若 T\in L(\mathcal{V},\mathcal{W}),則

(T^{\ast})^{\ast}=T

先對 T 使用定義並對調位置,再對 T^{\ast} 使用定義並對調位置,就有

\begin{aligned}  \left\langle\mathbf{y},T\mathbf{x}\right\rangle&=\left\langle T^{\ast}\mathbf{y},\mathbf{x}\right\rangle=\overline{\left\langle\mathbf{x},T^{\ast}\mathbf{y}\right\rangle}=\overline{\left\langle (T^{\ast})^{\ast}\mathbf{x},\mathbf{y}\right\rangle}=\left\langle\mathbf{y},(T^{\ast})^{\ast}\mathbf{x}\right\rangle\end{aligned}

T\in L(\mathcal{V},\mathcal{W})S\in L(\mathcal{W},\mathcal{U}),複合變換 ST 的伴隨為

(ST)^{\ast}=T^{\ast}S^{\ast}

ST 連續使用兩次定義,即得

\begin{aligned}  \left\langle (ST)^{\ast}\mathbf{y},\mathbf{x}\right\rangle&=\left\langle\mathbf{y},ST\mathbf{x}\right\rangle=\left\langle S^{\ast}\mathbf{y},T\mathbf{x}\right\rangle=\left\langle T^{\ast}S^{\ast}\mathbf{y},\mathbf{x}\right\rangle\end{aligned}

運用類似方式不難證明

\begin{aligned}  (S+T)^{\ast}&=S^{\ast}+T^{\ast}\\    (cT)^{\ast}&=\overline{c}T^{\ast}\end{aligned}

 
T:\mathcal{V}\to\mathcal{W} 是一線性變換,則 T^{\ast}:\mathcal{W}\to\mathcal{V} 滿足 \left\langle\mathbf{w},T\mathbf{v}\right\rangle=\left\langle T^{\ast}\mathbf{w},\mathbf{v}\right\rangle,此式的意思是向量空間 \mathcal{W}\mathbf{w}\mathbf{v}T 映射而得的像(T\mathbf{v})的內積等於向量空間 \mathcal{V}\mathbf{w}T^{\ast} 映射而得的像 (T^{\ast}\mathbf{w}) 和 \mathbf{v} 的內積,見下圖:

線性泛函與伴隨

 
接著我們想了解 TT^{\ast} 之間究竟有何關係?這個問題可透過解析主要子空間來回答。令 N(T)N(T^{\ast}) 分別代表 TT^{\ast} 的零空間 (或稱核),R(T)R(T^{\ast}) 分別代表 TT^{\ast} 的值域,以下正交補餘關係成立 (見“正交補餘與投影定理”):

\begin{aligned}  N(T^{\ast})&=R(T)^{\perp}\\    N(T)&=R(T^{\ast})^{\perp}\end{aligned}

證明於下。若 \mathbf{w}\in N(T^{\ast}),則 T^{\ast}\mathbf{w}=0,對於任何 \mathbf{v}\in\mathcal{V},就有 0=\left\langle T^{\ast}\mathbf{w},\mathbf{v}\right\rangle=\left\langle\mathbf{w},T\mathbf{v}\right\rangle,得知 \mathbf{w} 正交於 R(T),亦即 \mathbf{w}\in R(T)^{\perp},故 N(T^{\ast})\subseteq R(T)^{\perp}。上述每個推導步驟的反向推論都成立,也就有 R(T)^{\perp}\subseteq N(T^{\ast}),因此證明 N(T^{\ast})=R(T)^{\perp}。將 T 替換為 T^{\ast},使用 (T^{\ast})^{\ast}=T,重複以上過程即可證明 N(T)=R(T^{\ast})^{\perp}

 
最後我們解釋伴隨和共軛轉置矩陣的關係。設 A 為一 m\times n 階矩陣,A 的共軛轉置 (conjugate transpose) 定義為 A^{\ast}=\overline{A}^T。我們注意到矩陣的共軛轉置 A^{\ast} 和線性變換的伴隨 T^{\ast} 都以 \ast 表示,這並非符號混亂,下面我解釋背後的原因。設 T:\mathcal{V}\to\mathcal{W} 為一線性變換,令 \boldsymbol{\beta}=\{\mathbf{v}_1,\ldots,\mathbf{v}_n\}\mathcal{V} 的一組單範正交基底,\boldsymbol{\gamma}=\{\mathbf{w}_1,\ldots,\mathbf{w}_m\}\mathcal{W} 的一組單範正交基底。若 A=[a_{ij}]T 參考基底 \boldsymbol{\beta}\boldsymbol{\gamma} 的表示矩陣,則 A^{\ast}T^{\ast} 參考基底 \boldsymbol{\gamma}\boldsymbol{\beta} 的表示矩陣 (見“基底變換”),亦即

\begin{aligned}  A&=[T(\boldsymbol{\beta})]_{\boldsymbol{\gamma}}\\    A^{\ast}&=[T^{\ast}(\boldsymbol{\gamma})]_{\boldsymbol{\beta}}\end{aligned}

因為 T\mathbf{v}_j\in\mathcal{W},故可表示為

T\mathbf{v}_j=\left\langle\mathbf{w}_1,T\mathbf{v}_j\right\rangle\mathbf{w}_1+\cdots+\left\langle\mathbf{w}_m,T\mathbf{v}_j\right\rangle\mathbf{w}_m

矩陣 A 的第 j 個行向量即為 T\mathbf{v}_j 參考 \boldsymbol{\gamma} 的座標向量,也就是說,

a_{ij}=\left\langle \mathbf{w}_i,T\mathbf{v}_j\right\rangle

B=[b_{ij}] 代表 T^{\ast} 參考基底 \boldsymbol{\gamma}\boldsymbol{\beta} 的表示矩陣,將 T 替換為 T^{\ast},再交換基底 \boldsymbol{\beta}\boldsymbol{\gamma} 的角色,可得

\begin{aligned}  b_{ij}&=\left\langle\mathbf{v}_i, T^{\ast}\mathbf{w}_j\right\rangle=\left\langle T\mathbf{v}_i,\mathbf{w}_j\right\rangle=\overline{\left\langle\mathbf{w}_j,T\mathbf{v}_i\right\rangle}=\overline{a_{ji}}\end{aligned}

故證明 B=A^{\ast},此即所求。

 
線性變換之於伴隨,如同實矩陣之於轉置,複矩陣之於共軛轉置。所以如果問:線性泛函有什麼具體用處?答案即在通過線性泛函,我們可以定義線性變換的伴隨,從而清楚並完整地解釋 (共軛) 轉置矩陣的由來和意義。如果不理會線性泛函,透過矩陣的子空間映射和內積運算也能夠解釋轉置矩陣的幾何意涵,請參閱“轉置矩陣的意義”。

廣告
本篇發表於 線性代數專欄, 內積空間 並標籤為 , , 。將永久鏈結加入書籤。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s