答chang──關於線性代數的學習改進方法

網友chang留言:

在线代学习中会有这样一个疑问,就是不比数学分析之类的课程,线性代数似乎学了很容易忘?是不是学习上有什么方法可以改进吗?

 
答曰:

英國數學家哈代 (G. H. Hardy) 晚年時覺得他唯一還能為數學做些貢獻的事是寫一本探討數學的書,藉以表達自己對這門學科的看法,此書名為《一個數學家的辯白》(A Mathematician’s Apology),一開頭就說[1]

如果一個數學家發現自己在寫關於數學的東西,他會感到很憂傷的。因為數學家的工作是做實事,比如證明新定理,使數學有所發展,而不是談論自己或別的數學家幹了些甚麼。

政治家蔑視時事評論家;畫家蔑視藝術評論家;生理學家、物理學家或數學家一般都有類似的感覺。做事者對評論者的蔑視是最深刻的,總的來看也是最合理的。解釋、評論、鑑賞是次等工作。


或許在一流數學家眼中,解釋 (exposition)、評論 (criticism) 和鑑賞 (appreciation) 是次等工作,但是對於研習數學 (特別是線性代數) 的人來說,這些卻都是最重要的實事。

 
線性代數與其他數學科目,如微積分、微分方程、機率,的主要不同之處在於學習重心從計算程序轉移至消化並掌握計算程序底下的基本觀念。線性代數著重演譯邏輯 (deductive logic),我們經常以概念字彙取代量化關係,譬如,以「對稱矩陣」取代 a_{ji}=a_{ij},因此清楚理解這些概念是學好線性代數的第一步。緊接著,我們又創造出許多命題來聯繫概念之間的關係,譬如,「實對稱矩陣對應相異特徵值的特徵向量必定正交」。最後,我們還希望從不同或相反的角度來掌握問題,譬如,我們想知道「哪些矩陣其對應相異特徵值的特徵向量必定是正交的」?下面我針對上述幾項分別說明學習線性代數時必須特別注意的重點。

 
定義:甚麼是對稱矩陣?

教科書普遍採用的定義如下:A=[a_{ij}] 是一 n\times n 階矩陣,a_{ij}=a_{ji},或簡記為 A^{T}=A,其中 A^TA 的轉置矩陣,(A^T)_{ij}=a_{ji}。這個素樸的定義像是展示泡在藥水瓶裡的青蛙標本,我們看見了它的形體,卻不知道這隻青蛙活著時不僅在池塘中游泳,也會跑到陸地上活動。想要進一步理解對稱矩陣,唯有重新認識轉置矩陣一途。數學家的口袋裡其實還有另一個轉置矩陣的定義,稱為「伴隨」(adjoint):若 A 是一實矩陣,對於任意 \mathbf{x},\mathbf{y}\in\mathbb{R}^n,轉置矩陣 A^T 滿足

(A\mathbf{x})^T\mathbf{y}=\mathbf{x}^T(A^T\mathbf{y})

符合此性質的 A^T 是唯一存在的 (證明見“轉置矩陣的意義”)。(此處所指的伴隨與 \mathrm{adj}A 不同,請見“伴隨矩陣”。) 若採用此定義,實對稱矩陣 A^T=A 滿足下列等式:

(A\mathbf{x})^T\mathbf{y}=\mathbf{x}^T(A\mathbf{y})

這麼一來,對稱矩陣從標本變成了活的生物──線性變換,我們稱它為「對稱變換」或許更恰當些。讀者一時可能還看不出此定義的優點,但至少我們知道對稱矩陣可由向量內積界定。當上式等於零時,有這個結果:若 A\mathbf{x} 正交於 \mathbf{y},則 A\mathbf{y} 亦正交於 \mathbf{x}

 
命題:如何證明對於實對稱矩陣,對應相異特徵值的特徵向量必定正交?

最直接的作法是由左向右證明 (見“實對稱矩陣可正交對角化的證明”),如下:實對稱矩陣的特徵值為實數,可設 A\mathbf{x}=\lambda\mathbf{x}A\mathbf{y}=\mu\mathbf{y}\lambda,\mu\in\mathbb{R}\lambda\neq\mu,第二式左乘 \mathbf{x}^T,就有

\begin{aligned}  \mathbf{x}^TA\mathbf{y}&=\mathbf{x}^T\mu\mathbf{y}=\mu\mathbf{x}^T\mathbf{y}\end{aligned}

對第一式取轉置,\mathbf{x}^TA^T=\lambda\mathbf{x}^T,再右乘 \mathbf{y},即得

\mathbf{x}^TA^T\mathbf{y}=\lambda\mathbf{x}^T\mathbf{y}

因為 A^T=A,上面兩式等號左邊相同,兩式相減可得

(\mu-\lambda)\mathbf{x}^T\mathbf{y}=0

已知 \lambda\neq\mu,推論 \mathbf{x}^T\mathbf{y}=0,即 \mathbf{x}\perp\mathbf{y}。這個證法的主要缺點是它包含過多的代數運算,我們既使獲得證明也未必真的弄懂了。原因是當人們投入心力在計算時,往往不能同時推理,自然也就不會思考其中的意義。資訊一旦缺少了意義,便無法成為知識。可想而知,那些不被我們使用的資訊又如何能在腦中長存呢?遺忘所學是沒有慎思的必然結果。

 
如果採用實對稱矩陣的內積定義 (A\mathbf{x})^T\mathbf{y}=\mathbf{x}^T(A\mathbf{y}),代入特徵方程 A\mathbf{x}=\lambda\mathbf{x}A\mathbf{y}=\mu\mathbf{y},即得

\lambda\mathbf{x}^T\mathbf{y}=\mu\mathbf{x}^T\mathbf{y}

\lambda\neq\mu,立刻推知 \mathbf{x}^T\mathbf{y}=0。由於我們事先「活化」對稱矩陣的涵義,部分的推理步驟已納入擴大化的概念版圖,證明過程遂變得極為簡易,不須耗費一兵一卒即可攻城掠地。

 
推廣:還有哪些矩陣對應相異特徵值的特徵向量也是正交的?

猜想是提升洞察力、直覺和原創力的有效良方。或許實對稱矩陣的死對頭──反對稱矩陣 (anti-symmetric matrix) 也擁有此性質?我們稱 A 是反對稱矩陣,若 A^T=-A,亦即

(A\mathbf{x})^T\mathbf{y}=-\mathbf{x}^T(A\mathbf{y})

不過這回事情變得複雜,反對稱矩陣的特徵值必為零或純虛數 (見“特殊矩陣 (13):反對稱矩陣”),特徵向量可能是複向量,實向量內積 \mathbf{x}^T\mathbf{y} 因此必須改成 \mathbf{x}^{\ast}\mathbf{y},就有

(A\mathbf{x})^{\ast}\mathbf{y}=-\mathbf{x}^{\ast}(A\mathbf{y})

代入 A\mathbf{x}=(i\lambda)\mathbf{x}A\mathbf{y}=(i\mu)\mathbf{y},其中 \lambda,\mu\in\mathbb{R}i=\sqrt{-1},可得

-i\lambda\mathbf{x}^{\ast}\mathbf{y}=-i\mu\mathbf{x}^{\ast}\mathbf{y}

因為 \lambda\neq\mu,即得證。運用其他分析技巧,我們甚至可以證明只要 A 滿足 A^{\ast}A=AA^{\ast},稱為正規矩陣,不論其特徵值為何,A 總有完整的單範正交 (orthonormal) 特徵向量 (見“特殊矩陣 (2):正規矩陣”)。

 
結論:線性代數的學習改進方法包括以下幾點。

  1. 釐清概念的定義與涵義,盡可能列舉出概念的所有性質以延伸版圖。
  2. 推論證明時應儘量多使用「居先的」(a priori) 事實,也就是那些我們已經累積的經驗命題。居先的事實越完整,推理步驟便越簡短,如此也較容易在腦中形成綿密且強固的知識網路。
  3. 將既有的成功推論程序應用於其他問題上,以加速開疆闢土。倘若失敗,則表示我們需要使用新概念或另覓其他分析技巧。百尺竿頭,更進一步。這時我們應當為新障礙的出現而感到高興。

此外,我建議讀者多利用畫圖來闡述概念之間的聯繫。推論前務必取得足夠資訊。過程中跟緊前提,大膽猜測,並不時反向推理。結束後記錄研究結果,撰述評論,供日後個人或他人鑑賞之用。

 
行遠必自邇,登高必自卑。誰說解釋、評論、鑑賞是次等工作?

 
引用來源:
[1] 維基百科:一個數學家的辯白 原文如下:“It is a melancholy experience for a professional mathematician to find himself writing about mathematics. The function of a mathematician is to do something, to prove new theorems, to add to mathematics, and not to talk about what he or other mathematicians have done. Statesmen despise publicists, painters despise art-critics, and physiologists, physicists, or mathematicians have usually similar feelings; there is no scorn more profound, or on the whole more justifiable, than that of the men who make for the men who explain. Exposition, criticism, appreciation, is work for second-rate minds.”

廣告
本篇發表於 答讀者問, 內積空間 並標籤為 。將永久鏈結加入書籤。

6 Responses to 答chang──關於線性代數的學習改進方法

  1. chang 說道:

    我是大陆的一名大一学生,实在感谢老师专门写了一篇日志!随便请教下,我们对于某些概念或许定义不太一样,如“伴随”,在我们教材里伴随是这样的 http://zh.wikipedia.org/wiki/%E4%BC%B4%E9%9A%8F%E7%9F%A9%E9%98%B5 。或还是说两者其实共通呢?

    • ccjou 說道:

      不客氣。

      線性代數裡面確實有兩個伴隨,常常造成混淆。你給出的維基百科連結左邊欄目可點選英文版
      http://en.wikipedia.org/wiki/Adjugate_matrix

      開頭第一句話說:
      In linear algebra, the adjugate or classical adjoint of a square matrix is a matrix that plays a role similar to the inverse of a matrix; it can however be defined for any square matrix without the need to perform any divisions.
      這是你們教材裡說的伴隨(adjugate or classical adjoint),記為 adjA。

      The adjugate has sometimes been called the “adjoint", but that terminology is ambiguous. Today, “adjoint" of a matrix normally refers to its corresponding adjoint operator, which is its conjugate transpose.
      這是上文所稱的伴隨(adjoint),即共軛轉置 A*。
      http://en.wikipedia.org/wiki/Hermitian_adjoint

  2. jmbong 說道:

    周老师,有一个问题我苦想了两天,无果,实在想不出,特来向周老师求教:
    设:
    D1 D2 D3 D4 是4个已知的3×3矩阵,b1 b2 b3 b4是4个已知的3×1向量,T是未知3×3矩阵,x是未知3×1向量。 现在需要从这个方程组解出T和x
    T*D1*x = b1
    T*D2*x = b2
    T*D3*x = b3
    T*D4*x = b4
    周老师诲人不倦,若能得到周老师的赐教与指点,感激不尽!

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s