行列式公式的推導

本文的閱讀等級:中級

一個 n\times n 階矩陣 A=[a_{ij}] 的行列式存在多種不同的定義方式,目前最被廣泛採用的定義當屬萊布尼茲 (Gottfried Wilhelm Leibniz) 公式[1]

\displaystyle  \det A=\sum_{p}\sigma(p)a_{p_11}a_{p_22}\cdots a_{p_nn}

其中 p=(p_1,p_2,\ldots,p_n) 是數組 (1,2,\ldots,n) 的排列 (permutation,或稱置換),總共有 n! 種可能。函數 \sigma(p) 是排列 p 的符號差 (sign) 或稱簽名 (signature)。任何一個排列 p 可以分解成換位 (transposition) 的複合運算,例如,p=(3,5,1,2,4) 的換位分解是 (1,3)\circ(2,4)\circ(2,5),排列 p 至自然排序 (1,2,3,4,5) 的換位過程如下 (見“特殊矩陣 (16):排列矩陣”):

\displaystyle  (3,5,1,2,4)\xrightarrow[]{(2,5)}(3,4,1,2,5)\xrightarrow[]{(2,4)}(3,2,1,4,5)\xrightarrow[]{(1,3)}(1,2,3,4,5)

我們定義 \sigma(p)=1p 包含偶數個換位,\sigma(p)=-1p 包含奇數個換位。本文從行列式的幾何定義出發,解說如何從三個設定的性質推導出萊布尼茲行列式公式 (二階行列式公式的推導請見“行列式的運算公式與性質”)。

 
n\times n 階矩陣 A 以行向量 (column vector) 表示為 A=\begin{bmatrix}  \mathbf{a}_1&\mathbf{a}_2&\cdots&\mathbf{a}_n  \end{bmatrix}。若 n=2,以平面上二維向量 \mathbf{a}_1\mathbf{a}_2 當作交於原點的兩邊可定義一個平行四邊形。若 n=3,以空間中三維向量 \mathbf{a}_1,\mathbf{a}_2,\mathbf{a}_3 當作交於原點的三邊可定義一個平行六面體。推廣至有限維空間 \mathbb{R}^n\mathbf{a}_1,\mathbf{a}_2,\ldots,\mathbf{a}_n 也定義了一個平行多面體,其體積記為 f(\mathbf{a}_1,\mathbf{a}_2,\ldots,\mathbf{a}_n)。如果 f(\mathbf{a}_1,\ldots,\mathbf{a}_n)=0,矩陣 A 對應的平行多面體稱為退化 (degenerate)。如果存在 n 個連續函數 \mathbf{a}_1(t),\ldots,\mathbf{a}_n(t) 使得每一 \mathbf{a}_i(0)=\mathbf{a}_i\mathbf{a}_i(1)=\mathbf{e}_i (這裡 \mathbf{e}_i 表示第 i 元等於 1,其餘元為 0 的單位向量),而且 f(\mathbf{a}_1(t),\ldots,\mathbf{a}_n(t))\neq 00\le t\le 1,我們說 A 是正向 (positively oriented),否則稱為負向 (negatively oriented)。換句話說,平行多面體的體積有正負號,f(\mathbf{a}_1,\ldots,\mathbf{a}_n)>0A 是正向,f(\mathbf{a}_1,\ldots,\mathbf{a}_n)<0A 是負向。

 
根據幾何學知識,我們有底下三個關於平行多面體體積的基本性質:

性質一f(\mathbf{e}_1,\mathbf{e}_2,\ldots,\mathbf{e}_n)=1

性質二f(\mathbf{a}_1,\mathbf{a}_2,\ldots,\mathbf{a}_n)=0 若存在 \mathbf{a}_i=\mathbf{a}_ji\neq j

性質三:對於任意 i=1,\ldots,n 和純量 k

\begin{aligned} f(\mathbf{a}_1,\ldots,\mathbf{a}_i+\mathbf{a}'_i,\ldots,\mathbf{a}_n)&=f(\mathbf{a}_1,\ldots,\mathbf{a}_i,\ldots,\mathbf{a}_n)+f(\mathbf{a}_1,\ldots,\mathbf{a}'_i,\ldots,\mathbf{a}_n)\\  f(\mathbf{a}_1,\ldots,k\mathbf{a}_i,\ldots,\mathbf{a}_n)&=kf(\mathbf{a}_1,\ldots,\mathbf{a}_i,\ldots,\mathbf{a}_n).\end{aligned}

性質一稱為歸一性 (normalization),無須進一步討論。性質二說明兩個相同的重合向量造成平行多面體退化。性質三表示 f 是一個多重線性 (multilinear) 函數,意思是當所有 \mathbf{a}_j 固定時,j\neq if\mathbf{a}_i 的線性函數。使用退化和多重線性函數性質可推演出性質四:f 是一個交替 (alternating) 函數。

性質四:對於任意 i\neq j,交換 \mathbf{a}_i\mathbf{a}_j 改變 f 的正負號,即

f(\mathbf{a}_1,\ldots,\mathbf{a}_i,\ldots,\mathbf{a}_j,\ldots,\mathbf{a}_n)=-f(\mathbf{a}_1,\ldots,\mathbf{a}_j,\ldots,\mathbf{a}_i,\ldots,\mathbf{a}_n)

證明於下。因為僅有第 ij 個指標改變,為了方便,我們採用簡寫 f(\mathbf{u},\mathbf{v})=f(\mathbf{a}_1,\ldots,\mathbf{a}_i,\ldots,\mathbf{a}_j,\ldots,\mathbf{a}_n),其中 \mathbf{u}=\mathbf{a}_i\mathbf{v}=\mathbf{a}_j。使用性質二和三,可得

\displaystyle\begin{aligned}  f(\mathbf{u},\mathbf{v})&=f(\mathbf{u},\mathbf{u})+f(\mathbf{u},\mathbf{v})\\  &=f(\mathbf{u},\mathbf{u}+\mathbf{v})\\  &=f(\mathbf{u},\mathbf{u}+\mathbf{v})-f(\mathbf{u}+\mathbf{v},\mathbf{u}+\mathbf{v})\\  &=f(-\mathbf{v},\mathbf{u}+\mathbf{v})\\  &=-f(\mathbf{v},\mathbf{u}+\mathbf{v})\\  &=-f(\mathbf{v},\mathbf{u})-f(\mathbf{v},\mathbf{v})\\  &=-f(\mathbf{v},\mathbf{u}).\end{aligned}

 
定義 \det A=f(\mathbf{a}_1,\ldots,\mathbf{a}_n),現在開始推導萊布尼茲公式。將行向量 \mathbf{a}_j 表示為標準基底向量 \{\mathbf{e}_1,\ldots,\mathbf{e}_n\} 的線性組合:

\displaystyle  \mathbf{a}_j=\begin{bmatrix}  a_{1j}\\  \vdots\\  a_{nj}  \end{bmatrix}=a_{1j}\mathbf{e}_1+\cdots+a_{nj}\mathbf{e}_n=\sum_{i=1}^na_{ij}\mathbf{e}_i,~~~j=1,\ldots,n

使用性質三,對於 j=1,寫出

\displaystyle  \begin{aligned}  f(\mathbf{a}_1,\mathbf{a}_2,\ldots,\mathbf{a}_n)&=f\left(\sum_{i=1}^na_{i1}\mathbf{e}_i,\mathbf{a}_2,\ldots,\mathbf{a}_n\right)\\  &=\sum_{i=1}^na_{i1}f(\mathbf{e}_i,\mathbf{a}_2,\ldots,\mathbf{a}_n).\end{aligned}

對於 j=2,繼續可得

\displaystyle  f(\mathbf{a}_1,\mathbf{a}_2,\ldots,\mathbf{a}_n)=\sum_{i=1}^n\sum_{k=1}^na_{i1}a_{k2}f(\mathbf{e}_i,\mathbf{e}_k,\ldots,\mathbf{a}_n)

重複此程序 n 次,結果如下:

\displaystyle  f(\mathbf{a}_1,\mathbf{a}_2,\ldots,\mathbf{a}_n)=\sum_{\rho}a_{\rho_11}a_{\rho_22}\cdots a_{\rho_nn}f(\mathbf{e}_{\rho_1},\mathbf{e}_{\rho_2},\ldots,\mathbf{e}_{\rho_n})

其中 \rho=(\rho_1,\ldots,\rho_n) 且每一 \rho_i\in\{1,2,\ldots,n\},因此共有 n^n 種組合。如果 \rho 不是一個排列,則存在 i\neq j 使得 \rho_i=\rho_j,那麼根據性質二,f(\mathbf{e}_{\rho_1},\mathbf{e}_{\rho_2},\ldots,\mathbf{e}_{\rho_n})=0。這表示我們僅需要針對所有可能的排列 p 加總即可:

\displaystyle  f(\mathbf{a}_1,\mathbf{a}_2,\ldots,\mathbf{a}_n)=\sum_{p}a_{p_11}a_{p_22}\cdots a_{p_nn}f(\mathbf{e}_{p_1},\mathbf{e}_{p_2},\ldots,\mathbf{e}_{p_n})

使用性質四,f 是一個交替函數。若排列 p 分解成 k 個換位,則 \sigma(p)=(-1)^k。所以,對於任一排列 p

f(\mathbf{e}_{p_1},\mathbf{e}_{p_2},\ldots,\mathbf{e}_{p_n})=\sigma(p)f(\mathbf{e}_{1},\mathbf{e}_{2},\ldots,\mathbf{e}_{n})

合併以上結果並使用性質一,便得到平行多面體體積算式:

\displaystyle  f(\mathbf{a}_1,\mathbf{a}_2,\ldots,\mathbf{a}_n)=\sum_{p}\sigma(p)a_{p_11}a_{p_22}\cdots a_{p_nn}

此即萊布尼茲行列式公式。

 
參考來源:
[1] 維基百科:Leibniz formula for determinants

This entry was posted in 線性代數專欄, 行列式 and tagged , , . Bookmark the permalink.

5 則回應給 行列式公式的推導

  1. 張盛東 說:

    老師,請教一下外積(cross product)與行列式的關系為何?為何兩個向量的外積與這兩個向量垂直并且可以通過行列式表達?我只記得外積的定義式但從未真正理解其本質,請老師指教。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s