線性方程組的幾何意義

本文的閱讀等級:初級

線性方程組是線性代數的一個啟蒙問題,與數學領域中許多令人困惑的問題比較,解線性方程組似乎不具挑戰性。中學數學曾經介紹包含二個以及三個變數的線性方程組,例如,著名的「雞兔同籠」問題:若干雞兔同籠,已知共有 10 個頭,26 隻腳,問雞和兔各有幾隻?由於解題過程僅牽涉基礎代數,現代讀者幾乎毫不費力立刻可以算出答案,不論問題本身或其解答都不令人感到驚異。表面上,線性方程組看似平淡無奇,背後其實隱藏了奇異的思維與豐富的理論,特別是線性方程組在近代自然科學與社會科學的重要性遠遠超過一般人的想像。因此,線性代數的學習旅程中,求解線性方程經常被列為第一個探索主題。本文從幾何觀點解說求解線性方程組的涵義。

 
考慮二元一次聯立方程組

\begin{aligned}  x+y&=4\\  2x-y&=5.  \end{aligned}

二元表示有兩個未知數 xy,一次方程即線性方程,因此上面二式也合稱為線性方程組。「線性」方程的名稱來自於 ax+by=c 之解所構成的集合為平面上的一條直線 (但請注意,ax+by+cz=d 的解集合為三維空間的一個平面)。如果你要用一個方程式來表示線性方程組,最直接的作法是將方程組等號左邊與右邊分別「包裝」成向量:

\begin{bmatrix}  x+y\\  2x-y  \end{bmatrix}=\begin{bmatrix}  4\\  5  \end{bmatrix}

使用向量加法與純量乘法運算,經過兩個步驟,上式等號左邊的向量可分解如下:

\begin{bmatrix}  x+y\\  2x-y  \end{bmatrix}=\left[\!\!\!\begin{array}{r}  x\\  2x  \end{array}\!\!\!\right]+\left[\!\!\!\begin{array}{r}  y\\  -y  \end{array}\!\!\!\right]=x\begin{bmatrix}  1\\  2  \end{bmatrix}+y\left[\!\!\!\begin{array}{r}  1\\  -1  \end{array}\!\!\!\right]

這樣就得到與線性方程組同義的向量方程式

x\begin{bmatrix}  1\\  2  \end{bmatrix}+y\left[\!\!\!\begin{array}{r}  1\\  -1  \end{array}\!\!\!\right]=\begin{bmatrix}  4\\  5  \end{bmatrix}

上式中,等號左邊稱為 \begin{bmatrix}  1\\  2  \end{bmatrix}\left[\!\!\!\begin{array}{r}  1\\  -1  \end{array}\!\!\!\right] 的線性組合 (linear combination),純量 xy 稱為組合權重 (weight) 或係數 (coefficient)。線性方程組由多個一次方程式組成,向量方程式的主體則是向量的線性組合。既然兩者的表述形式不同,解的幾何意義也因此不同。

 
所謂求解線性方程組是指找出同時滿足條件式 x+y=42x-y=5 的數組 (x,y)。我們知道滿足一次方程的數組形成的集合為平面上的一條直線,因此方程組的解即為平面上兩條直線的交點座標,上例為 (3,1)。圖1中,水平軸對應未知數 x,垂直軸對應未知數 y,每一條直線對應方程組的一個列 (row)。當線性方程組不存在唯一解時,可能發生以下兩種情況:(1) 兩條直線平行不交集,此時無解,例如,x+2y=42x+4y=5;(2) 兩條直線完全重合,此時存在無窮多組解,例如,x+2y=42x+4y=8。如果線性方程組存在至少一解 (唯一解或無窮多組解),我們稱此方程組是一致的 (consistent),否則稱之為不一致的。這個事實點出了關於線性方程組的兩個基本問題:線性方程組是否為一致的,亦即是否有解?如果方程組有解,那麼是否有唯一解?這兩個問題將不斷地以不同的面貌出現於線性代數的許多主題。

圖1 線性方程組的幾何意義

 
另一方面,求解向量方程式 x\begin{bmatrix}  1\\  2  \end{bmatrix}+y\left[\!\!\!\begin{array}{r}  1\\  -1  \end{array}\!\!\!\right]=\begin{bmatrix}  4\\  5  \end{bmatrix} 等於問:若目標向量 \begin{bmatrix}  4\\  5  \end{bmatrix} 可表示為 \begin{bmatrix}  1\\  2  \end{bmatrix}\left[\!\!\!\begin{array}{r}  1\\  -1  \end{array}\!\!\!\right] 的線性組合,則組合權重 xy 為何?此例答案是 3 倍的 \begin{bmatrix}  1\\  2  \end{bmatrix}1 倍的 \left[\!\!\!\begin{array}{r}  1\\  -1  \end{array}\!\!\!\right] 可得 \begin{bmatrix}  4\\  5  \end{bmatrix}。向量方程式所處理的數學物件稱為行向量 (column vector,形如柱子的直立向量),圖2座標系統的水平軸與垂直軸分別對應向量的第一個元與第二個元,而非未知數 xy。當向量方程式不存在唯一解時,也可能發生兩種情況:(1) 兩個組合向量的端點位於一條穿越原點直線上 (方向可相反),但目標向量的端點在該直線外,這時無解,例如,x\begin{bmatrix}  1\\  2  \end{bmatrix}+y\begin{bmatrix}  2\\  4  \end{bmatrix}=\begin{bmatrix}  4\\  5  \end{bmatrix};(2) 兩個組合向量與目標向量的端點位於同一條穿越原點的直線上,故而存在無窮多組解,例如,x\begin{bmatrix}  1\\  2  \end{bmatrix}+y\begin{bmatrix}  2\\  4  \end{bmatrix}=\begin{bmatrix}  4\\  8  \end{bmatrix}

圖2 向量方程式的幾何意義:以行作為繪圖物件

 
相較於線性方程組隱含解乃由多個方程式所限制,向量方程式則為一種建構機制,解代表線性組合的權重。那一種觀念比較適宜發展線性方程理論呢?考慮線性方程組

\begin{aligned}  x+y&=b_1\\  2x-y&=b_2\\  x-2y&=b_3,  \end{aligned}

常數 b_1,b_2,b_3 須滿足甚麼條件方使方程組有解?若三條直線未交於一點,則方程組不存在解 (見圖3);相反的,若三條直線交於一點,該交點的座標即為解。想像你先選定解 xy,漸次平行移動各直線,最終可使三條直線交於 (x,y),然而對應的數組 (b_1, b_2, b_3) 並不具備清晰的幾何意義。

圖3 線性方程組:無解的情況

 
如果從向量方程式來回答解的存在性問題,將線性方程組表示為

x\begin{bmatrix}  1\\  2\\  1  \end{bmatrix}+y\left[\!\!\!\begin{array}{r}  1\\  -1\\  -2  \end{array}\!\!\!\right]=\begin{bmatrix}  b_1\\  b_2\\  b_3  \end{bmatrix}

xy 為任意數。這個線性組合產生的所有向量正是使方程組有解的數組 (b_1,b_2,b_3) 形成的集合,其幾何意義是:若三維向量 \begin{bmatrix}  b_1\\  b_2\\  b_3  \end{bmatrix} 位於 \begin{bmatrix}  1\\  2\\  1  \end{bmatrix}\left[\!\!\!\begin{array}{r}  1\\  -1\\  -2  \end{array}\!\!\!\right] 所張開的平面上,則方程式有解;反之,方程式無解 (見圖4)。

圖4 向量方程式:無解的情況

 
向量方程式提供的幾何觀點不僅簡單明瞭,而且很容易推廣至更高維的情況。考慮包含 m 個方程式,n 個未知數的線性方程組

\begin{aligned}  a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n&=b_1\\  a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n&=b_2\\  \vdots\\  a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n&=b_m,  \end{aligned}

或寫成向量方程式

x_1\begin{bmatrix}  a_{11}\\  a_{21}\\  \vdots\\  a_{m1}  \end{bmatrix}+x_2\begin{bmatrix}  a_{12}\\  a_{22}\\  \vdots\\  a_{m2}  \end{bmatrix}+\cdots+x_n  \begin{bmatrix}  a_{1n}\\  a_{2n}\\  \vdots\\  a_{mn}  \end{bmatrix}=\begin{bmatrix}  b_1\\  b_2\\  \vdots\\  b_m  \end{bmatrix}

\mathbf{a}_j=(a_{1j},a_{2j},\ldots,a_{mj})^Tj=1,2,\ldots,n,且 \mathbf{b}=(b_1,b_2,\ldots,b_m)^T。線性方程組可以簡明地表示為

x_1\mathbf{a}_1+x_2\mathbf{a}_2+\cdots+x_n\mathbf{a}_n=\mathbf{b}

類似三維幾何空間,我們也可以想像在 \mathbb{R}^m 空間中,若向量 \mathbf{b} 屬於 \mathbf{a}_1,\mathbf{a}_2,\ldots,\mathbf{a}_n 「生成」(span) 出來的「子空間」(subspace),則方程式有解,否則不存在解。接下來的問題要定義何謂向量 \mathbf{a}_1,\ldots,\mathbf{a}_n 的「生成」,進而衍生出「子空間」的概念。大致上,這就是今天所見線性方程理論的發展脈絡。

Advertisements
本篇發表於 線性方程, 線性代數專欄 並標籤為 , 。將永久鏈結加入書籤。

6 則回應給 線性方程組的幾何意義

  1. jeck7y 說道:

    請教老師:
    上述中 1. 組合權重 x 和 y 是純量?
    2.若 x 和 y 是向量 則和聯立方程組係數矩陣關係與意義會是如何?求解方式又如何?
    謝謝老師

  2. suehang 說道:

    大陆有些名师(如李永乐)倒是经常指出线性方程组,向量的集合意义,但是对行列式的几何意义却鲜有人问津!

  3. yufenglyu 說道:

    非常形象的解釋!在 MIT教授 Giltbert Strang的Linear Algebra 公開課裡也看到過類似的講解。

  4. Glenn Chen 說道:

    周老師,我是1952的半老頭,一直從線代啟示錄學線代,也從諸多視頻節目看學,書也買一堆,但就是無法有完整概念,如今看到Essence of Linear Algebra(https://www.youtube.com/watch?v=kjBOesZCoqc&list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab&index=1)才感覺,喔!原來如此,我想周老師必然懂這些東西,只是我感覺這視頻教學透過您這深具影響力的網站,能嘉惠像我這樣的"笨學生".

    • ccjou 說道:

      謝謝您提供的資源,這套影片利用動畫解釋概念,說明地非常清晰。我已將鏈結加入網站右側的線代線上影音課程,期待可嘉惠許多學者。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s