行列式的幾何意義

本文的閱讀等級:中級

多數學者對於利用行列式求面積或體積並不陌生,高中數學曾經採用幾何方法證明了二階方陣 A 的行列式絕對值 \vert\det A\vert 即為其行 (column) 向量或列 (row) 向量所張開的平行四邊形面積 (見“行列式的運算公式與性質”),而三階方陣的行列式絕對值則為三維行 (列) 向量所張開的平行六面體體積。若 AB 是同階方陣,方陣乘積的行列式可乘公式

\det (AB)=(\det A)(\det B)

也有清楚的幾何意義。以二階方陣說明,\det B 表示 B 行向量所張的平行四邊形面積,\det(AB) 是該面積經過線性變換 A 之後的平行四邊形面積,被線性變換伸縮了 \det A 倍 (見“線性變換把面積伸縮了”)。

 
對於 m\times n 階實矩陣 A,大概只有少數人知道 \sqrt{\det (A^{T}A)} 等於 An 個行向量於 \mathbb{R}^{m} 空間所張開的平行多面體體積。注意,A^TA 是半正定矩陣 (見“正定矩陣的性質與判別方法”),因此 \det(A^TA)\ge 0。試舉一例,欲求三維空間兩個向量 (1,0,1)(-2,2,-1) 所張的平行四邊形面積,可設

A=\left[\!\!\begin{array}{cr}    1&-2\\    0&2\\    1&-1    \end{array}\!\!\right]

計算 A^TA=\left[\!\!\begin{array}{rr}    2&-3\\    -3&9    \end{array}\!\!\right],故面積為 \sqrt{\det(A^TA)}=\sqrt{9}=3。“Cauchy-Binet 公式”一文曾以 Cauchy-Binet 行列式計算公式說明這個事實,但推論過程涉及向量空間分析因此稍嫌曲折。本文介紹一個較富幾何直覺的證明,僅需要兩個基本知識:QR 分解和方陣乘積的行列式可乘公式。

 
我們先討論三維空間的問題。考慮 \mathbb{R}^3 的兩個不共線向量 (a_1,a_2,a_3)(b_1,b_2,b_3) 所張開的平行四邊形的面積計算問題。令 A=\begin{bmatrix}  \mathbf{a}&\mathbf{b}  \end{bmatrix}=\begin{bmatrix}  a_1&b_1\\  a_2&b_2\\  a_3&b_3  \end{bmatrix},其中 \mathbf{a}\mathbf{b} 是行向量。令 B=\begin{bmatrix}  \mathbf{a}&\mathbf{b}&\mathbf{c}  \end{bmatrix},其中 \mathbf{c}=\mathbf{a}\times\mathbf{b}/\Vert\mathbf{a}\times\mathbf{b}\Vert。因為 \mathbf{c}\perp\mathbf{a}\mathbf{c}\perp\mathbf{b}

B^TB=\begin{bmatrix}  \mathbf{a}^T\\  \mathbf{b}^T\\  \mathbf{c}^T  \end{bmatrix}\begin{bmatrix}  \mathbf{a}&\mathbf{b}&\mathbf{c}  \end{bmatrix}=\begin{bmatrix}  \mathbf{a}^T\mathbf{a}&\mathbf{a}^T\mathbf{b}&\mathbf{a}^T\mathbf{c}\\  \mathbf{b}^T\mathbf{a}&\mathbf{b}^T\mathbf{b}&\mathbf{b}^T\mathbf{c}\\  \mathbf{c}^T\mathbf{a}&\mathbf{c}^T\mathbf{b}&\mathbf{c}^T\mathbf{c}  \end{bmatrix}=\begin{bmatrix}  \mathbf{a}^T\mathbf{a}&\mathbf{a}^T\mathbf{b}&0\\  \mathbf{b}^T\mathbf{a}&\mathbf{b}^T\mathbf{b}&0\\  0&0&1  \end{bmatrix}=\begin{bmatrix}  A^TA&0\\  0&1  \end{bmatrix}

所以,\det(A^TA)=\det(B^TB)=(\det B^T)(\det B)=(\det B)^2。注意 \det B 等於 \mathbf{a},\mathbf{b},\mathbf{c} 所張的平行六面體的有號 (signed) 體積。因為 \mathbf{c}\mathbf{a}\mathbf{b} 所在平面遵守右手定則的單位法向量,\det B\ge 0,且 \det B=\sqrt{\det(A^TA)} 就是 \mathbf{a}\mathbf{b} 所張的平行四邊形面積 (平行六面體的高等於 1)。另外,使用行列式與外積的關係式可證明向量 \mathbf{a}\mathbf{b} 的外積長等於兩向量所張的平行四邊形面積 (見“內積與外積是怎麼來的?”):

\displaystyle  \begin{aligned}  \det B&=\det\begin{bmatrix}  \mathbf{a}&\mathbf{b}&\mathbf{c}  \end{bmatrix}=(\mathbf{a}\times\mathbf{b})\cdot\mathbf{c}\\  &=(\mathbf{a}\times\mathbf{b})\cdot\frac{\mathbf{a}\times\mathbf{b}}{\Vert\mathbf{a}\times\mathbf{b}\Vert}=\Vert\mathbf{a}\times\mathbf{b}\Vert.  \end{aligned}

 
接著推廣至高階矩陣。考慮 \mathbb{R}^m 空間中一個線性獨立向量集 \{\mathbf{a}_1,\ldots,\mathbf{a}_n\}。令 V_n 表示由 \mathbf{a}_1,\ldots,\mathbf{a}_nm\ge n>1,所張開的平行多面體體積。見圖一,向量 \mathbf{a}_1\mathbf{a}_2 所決定的平行四邊形面積等於虛線長方形面積,底 \mathbf{a}_1 的長度為 v_1=\Vert\mathbf{a}_1\Vert。設 P_1 代表投影至 \mathbf{a}_1 所擴張直線 \mathrm{span}\{\mathbf{a}_1\}m 階正交投影矩陣,I-P_1 則為映至正交補空間 \mathrm{span}\{\mathbf{a}_1\}^{\perp} 的正交投影矩陣。平行四邊形的高即為 v_2=\Vert(I-P_1)\mathbf{a}_2\Vert,故面積等於

\begin{aligned}  V_2&=v_1v_2=\Vert\mathbf{a}_1\Vert\cdot\Vert(I-P_1)\mathbf{a}_2\Vert\end{aligned}

圖一 兩向量所張的平行四邊形

 
同樣道理,平行六面體體積 V_3 等於底面積與高的乘積,底面積為 V_2,高則為 \mathbf{a}_3\mathrm{span}\{\mathbf{a}_1,\mathbf{a}_2\}^{\perp} 的投影分量長度 v_3=\Vert(I-P_{1,2})\mathbf{a}_3\VertP_{1,2} 表示至 \mathrm{span}\{\mathbf{a}_1,\mathbf{a}_2\} 的正交投影矩陣 (見圖二)。因此,向量集 \{\mathbf{a}_1,\mathbf{a}_2,\mathbf{a}_3\} 所張的平行六面體體積為

\begin{aligned}  V_3&=v_1v_2v_3=\Vert\mathbf{a}_1\Vert\cdot\Vert(I-P_1)\mathbf{a}_2\Vert\cdot\Vert(I-P_{1,2})\mathbf{a}_3\Vert\end{aligned}

圖二 三向量所張的平行六面體

 
繼續延伸可歸納出一般結果,向量集 \{\mathbf{a}_1,\ldots,\mathbf{a}_n\} 所張的平行多面體體積如下:

\begin{aligned}  V_n&=v_1v_2v_3\cdots v_n\\    &=\Vert\mathbf{a}_1\Vert\cdot\Vert(I-P_1)\mathbf{a}_2\Vert\cdot\Vert(I-P_{1,2})\mathbf{a}_3\Vert\cdots\Vert(I-P_{1,2,\ldots,n-1})\mathbf{a}_n\Vert,\end{aligned}

上式中 P_{1,2,\ldots,n-1} 表示映射至 \mathrm{span}\{\mathbf{a}_1,\ldots,\mathbf{a}_{n-1}\} 的正交投影矩陣。

 
下一個問題是實際如何計算平行多面體體積 V_n?考慮 v_1=\Vert\mathbf{a}_1\Vert,對於 k>1v_{k}=\Vert(I-P_{1,\ldots,k-1})\mathbf{a}_k\Vert。化簡正交投影矩陣的計算依賴 QR 分解 (詳見“Gram-Schmidt 正交化與 QR 分解”),設 m\times n 階矩陣 Q=\begin{bmatrix}    \mathbf{q}_1&\cdots\mathbf{q}_n    \end{bmatrix} 包含單範正交 (orthonormal) 行向量:\mathbf{q}_i^T\mathbf{q}_j=0i\neq j,對任意 i\mathbf{q}_i^T\mathbf{q}_i=1。因此 Q^{T}Q=I_n,而 R=[r_{ij}]n 階上三角矩陣。將 QR 分解展開:

\begin{aligned}  \mathbf{a}_1&=r_{11}\mathbf{q}_{1}\\    \mathbf{a}_2&=r_{12}\mathbf{q}_{1}+r_{22}\mathbf{q}_2\\    &\vdots\\    \mathbf{a}_n&=r_{1n}\mathbf{q}_1+r_{2n}\mathbf{q}_2+\cdots+r_{nn}\mathbf{q}_n.\end{aligned}

對於 j\ge i,計算 \mathbf{q}_i\mathbf{a}_j 的內積發現

\begin{aligned}  \mathbf{q}_i^T\mathbf{a}_j&=\mathbf{q}_i^T(r_{1j}\mathbf{q}_1+\cdots+r_{jj}\mathbf{q}_j)=r_{ij}\mathbf{q}_i^T\mathbf{q}_i=r_{ij}.\end{aligned}

另一方面,向量集 \{\mathbf{a}_1,\ldots,\mathbf{a}_k\}\{\mathbf{q}_1,\ldots,\mathbf{q}_k\} 擴張出相同的子空間,因此正交投影矩陣 P_{1,\ldots,k-1} 也可用 Q_{k-1}=\begin{bmatrix}    \mathbf{q}_1&\cdots&\mathbf{q}_{k-1}    \end{bmatrix} 表示為 (見“正交投影──威力強大的線代工具”)

P_{1,\ldots,k-1}=Q_{k-1}Q_{k-1}^{T}

計算投影量 (I-P_{1,\ldots,k-1})\mathbf{a}_k,如下:

\begin{aligned}  (I-P_{1,\ldots,k-1})\mathbf{a}_k&=\mathbf{a}_k-Q_{k-1}Q_{k-1}^{T}\mathbf{a}_k\\    &=\mathbf{a}_k-\begin{bmatrix}    \mathbf{q}_1&\cdots&\mathbf{q}_{k-1}    \end{bmatrix}\begin{bmatrix}    \mathbf{q}_1^T\mathbf{a}_k\\    \vdots\\    \mathbf{q}_{k-1}^{T}\mathbf{a}_k    \end{bmatrix}\\  &=\mathbf{a}_k-\begin{bmatrix}    \mathbf{q}_1&\cdots&\mathbf{q}_{k-1}    \end{bmatrix}\begin{bmatrix}    r_{1k}\\    \vdots\\    r_{k-1,k}    \end{bmatrix}\\    &=\mathbf{a}_k-r_{1k}\mathbf{q}_1-\cdots-r_{k-1,k}\mathbf{q}_{k-1}\\  &=r_{kk}\mathbf{q}_k,\end{aligned}

再計算向量長度可得

\begin{aligned}  v_k&=\Vert(I-P_{1,\ldots,k-1})\mathbf{a}_k\Vert=\Vert r_{kk}\mathbf{q}_k\Vert=\vert r_{kk}\vert\end{aligned}

因此,

\begin{aligned}  V_n&=v_1v_2\cdots v_n=\vert r_{11}r_{22}\cdots r_{nn}\vert=\vert\det R\vert\end{aligned}

矩陣 A 其行向量所張開的平行多面體體積等於 R 的行列式絕對值。

 
最後我們解釋 \det(A^TA) 的幾何意義。同樣利用 QR 分解結果 Q^{T}Q=I_n 以及矩陣乘積的行列式可乘公式 (參閱“利用分塊矩陣證明 det(AB)=det(A)det(B)”),可得

\begin{aligned}  \det(A^{T}A)&=\det(R^TQ^TQR)=\det(R^TR)=(\det R^T)(\det R)\\  &=(\det R)(\det R)=(\det R)^2\\  &=(r_{11}\cdots r_{nn})^2=V_n^2,\end{aligned}

\sqrt{\det(A^{T}A)}=\vert\det R\vert=V_n。若 m=nAn 階方陣,則

\begin{aligned}  \det(A^{T}A)&=(\det A^{T})(\det A)=(\det A)^2\end{aligned}

此即我們過去熟悉的結果:V_n=\vert\det A\vert

Advertisement
This entry was posted in 線性代數專欄, 行列式 and tagged , , , . Bookmark the permalink.

4 Responses to 行列式的幾何意義

  1. wOOL says:

    ‘A的n个行向量’于R^m空间所张开的平行多面体体积 -> 这里应该是’A的n个列向量’吧

  2. ccjou says:

    這是用語不同造成的誤會。在中國大陸,橫向稱為行,縱向稱為列;在台灣,橫向稱為列,縱向稱為行。

  3. suehang says:

    上述混淆问题的只有靠数学符号自身来解决了.

  4. hz11532263 says:

    對於 m\times n 階實矩陣 A,大概只有少數人知道 \sqrt{\det (A^{T}A)} 等於 A 的 n 個行向量於 \mathbb{R}^{m} 空間所張開的平行多面體體積。

    請問這裡是否應該加上 m > n 這一條件呢?

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s