## 從不變子空間切入特徵值問題

$\displaystyle\frac{d\mathbf{u}}{dt}=A\mathbf{u}(t)$

$\lambda e^{\lambda t}\mathbf{x}=e^{\lambda t}A\mathbf{x}$

$A(\mathcal{X})=\{A\mathbf{x}\vert\mathbf{x}\in\mathcal{X}\}$

$A=\left[\!\!\begin{array}{rrr} 4&2&1\\ -3&-1&-2\\ 2&2&4 \end{array}\!\!\right]$

$\mathbf{x}_1=\left[\!\!\begin{array}{r} 1\\ -1\\ 0 \end{array}\!\!\right],~\mathbf{x}_2=\left[\!\!\begin{array}{r} -1\\ 2\\ -1 \end{array}\!\!\right],~\mathbf{x}_3=\left[\!\!\begin{array}{r} 1\\ 1\\ -1 \end{array}\!\!\right]$

$\mathcal{X}=\mathrm{span}\{\mathbf{x}_1,\mathbf{x}_2\}$$\mathcal{Y}=\mathrm{span}\{\mathbf{x}_3\}$。分別計算 $A\mathbf{x}_i$$i=1,2,3$，如下：

\begin{aligned} A\mathbf{x}_1&=\left[\!\!\begin{array}{r} 2\\ -2\\ 0 \end{array}\!\!\right]=2\mathbf{x}_1\in\mathcal{X}\\ A\mathbf{x}_2&=\left[\!\!\begin{array}{r} -1\\ 3\\ -2 \end{array}\!\!\right]=\mathbf{x}_1+2\mathbf{x}_2\in\mathcal{X}\\ A\mathbf{x}_3&=\left[\!\!\begin{array}{r} 5\\ -2\\ 0 \end{array}\!\!\right]=-\mathbf{x}_1-3\mathbf{x}_2+3\mathbf{x}_3\notin\mathcal{Y}.\end{aligned}

\begin{aligned} A\mathbf{x}&=A(c_1\mathbf{x}_1+c_2\mathbf{x}_2)=c_1A\mathbf{x}_1+c_2A\mathbf{x}_2\\ &=2c_1\mathbf{x}_1+c_2\mathbf{x}_1+2c_2\mathbf{x}_2=(2c_1+c_2)\mathbf{x}_1+2c_2\mathbf{x}_2.\end{aligned}

$A\begin{bmatrix} \mathbf{x}_1&\mathbf{x}_2&\mathbf{x}_3 \end{bmatrix}=\begin{bmatrix} \mathbf{x}_1&\mathbf{x}_2&\mathbf{x}_3 \end{bmatrix}\left[\!\!\begin{array}{ccr} 2&1&-1\\ 0&2&-3\\ 0&0&3 \end{array}\!\!\right]$

$[A]_{\boldsymbol{\beta}}=B^{-1}AB=\left[\!\!\begin{array}{ccr} 2&1&-1\\ 0&2&-3\\ 0&0&3 \end{array}\!\!\right]$

$A\mathbf{x}_3^{\prime}=\left[\!\!\begin{array}{r} 0\\ -3\\ 6 \end{array}\!\!\right]=3\mathbf{x}_3^{\prime}\in\mathcal{Y}^{\prime}$

$[A]_{\boldsymbol{\beta}^{\prime}}=\begin{bmatrix} 2&1&0\\ 0&2&0\\ 0&0&3 \end{bmatrix}$

$[A]_{\boldsymbol{\beta}}=B^{-1}AB=\begin{bmatrix} D_1&0&\cdots&0\\ 0&D_2&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&D_k \end{bmatrix}$

$[A]_{\boldsymbol{\beta}}=B^{-1}AB=\begin{bmatrix} d_1&~&~&~\\ ~&d_2&~&~\\ ~&~&\ddots&~\\ ~&~&~&d_n \end{bmatrix}$

This entry was posted in 特徵分析, 線性代數專欄 and tagged , , , . Bookmark the permalink.

### 16 則回應給 從不變子空間切入特徵值問題

1. Watt Lin 說：

請問老師：

最初為何數學家選用$\lambda$這個符號代表「特徵值」？
看老師的DVD，好像稍微有提到符號來源，我希望知道更詳細一些。

回想自己的求學歷程，第一次看到$\lambda$，應該是國三物理學，「波長」的代表符號，當年班上沒人問老師，老師也沒說，大家就寫這個符號。有升學壓力的情況下，能夠得分就好，大概沒人有時間去思考符號的來源。

經過二十多年，有一天，我突然想到$\lambda$相當於L，而「波長」(Wave Length)，$\lambda$可以聯想L代表Length。
能夠聯想的符號，可以幫助記憶。這是一項遲來的發現，假如國中老師有說明，當年寫這個符號，應該心裡會比較舒適。

我查維基百科，想瞭解Eigen，知道它來自德文，可翻譯為「自身的」，「特定於…的」，「有特徵的」或者「個體的」。但這與$\lambda$符號，如何聯想？仍未找到答案。

2. ccjou 說：

字首"eigen"是德文，意思是"proper"或"characteristic"，所以中文譯為"特徵"，也有些人說"固有"。早年美國使用proper value，今天全球都統稱eigenvalue。特徵的概念很早就出現在許多數學領域，例如微分方程，在線性代數中最早使用eigenvalue一詞的人可能是德國數學家David Hilbert。至於為何選用$\lambda$(lambda)來表示，這我就不清楚了。希臘字母常用於代表數學和科學領域的常數或變數，但字母本身其實並沒有什麼含意。

3. ccjou 說：

本來我想從一個功利的角度說明為何要研究特徵值和特徵向量：因為可以發大財賺大錢！

The \$25,000,000,000 eigenvector

4. Watt Lin 說：

有些時候，希臘字母的選擇，可以聯想其意義，用起來的感覺比較好。
例如微積分，在極限的章節，用了 $\delta$ $\epsilon$ 符號
$\delta$ 可以聯想 distance 或 difference
$\epsilon$ 可以聯想 error

假如完全不能聯想意義，好像到了陌生的新環境，東西用起來有怪怪的感覺。
無意義的符號，少量還可以，若是很多個符號皆很陌生，可能增加頭腦的負擔，讓學習出現障礙。當符號變成有意義時，大概學習會變得比較順利。
以上是個人推測，也許一般人感覺沒關係，符號不帶有意義，照樣可以學習，考試也能拿高分。

5. Watt Lin 說：

國中物理「波長」(Wave Length)，用$\lambda$符號，我尚未知道$\lambda$可以聯想 L (Length)，只會照書本抄寫符號。
唸高中，物理學「波長」仍使用$\lambda$，我開始自己發揮想像力，$\lambda$有點像中文字「人」，兩雙腳：一前一後，相當於走一步的距離。
而人走路的「速度」等於 (每分鐘走的步數) 乘以 (平均一步的長度)
這很像光速或音速的算法： (頻率) 乘以 (波長)
這樣的思考，讓我對$\lambda$符號感覺熟悉，熟悉之後，學習變得比較順利。

想到Length，竟然是在二十餘年之後。
我不知道，英語為母語的國家，學生會不會自己很容易聯想$\lambda$代表Length？

6. levinc 說：

如果每個不變子空間的維度都是 1，即r_j=1，就有[A]_B =B^{-1}AB diag(d1,…,dn), 其中 d_j 為一純量。主對角矩陣是我們所能得到最為簡約的形式，這時 A 稱為可對角化矩陣。

老師，請問B^{-1}AB後面是不是少個等號？
還有…這件事怎麼証明呢？
(Friedberg書也有類似習題 p327,4th, ex36)

7. ccjou 說：

哈，感謝告知，B^{-1}AB 後面是少了個等號，已訂正。

上文只有說明，但沒有證明，我再抽空看看 Friedberg 的習題。也許當作每週問題貼上吧。

8. ccjou 說：

Friedberg 的習題如下：
Let $T$ be a linear operator on a finite-dimensional vector space $V$. Prove that $T$ is diagonalizable if and only if $V$ is the direct sum of one-dimensional $T$-invariant subspaces.

$V=W_1\oplus\cdots\oplus W_n$，且 $\mathrm{dim}W_i=1$，對於任意 $\mathbf{x}_i\neq\mathbf{0}\in W_i$$T(\mathbf{x}_i)\in W_i$，因為 $W_i$ 的維度等於 1，可知 $T(\mathbf{x}_i)=\lambda_i\mathbf{x}_i$。因為 $W_i\cap W_j=\{0\}$$i\neq j$，故 $\{\mathbf{x}_1,\ldots,\mathbf{x}_n\}$ 可為 $V$ 的一組基底，$T$ 參考此基底的矩陣表達式為
$[T]=\mathrm{diag}(\lambda_1,\ldots,\lambda_n)$
即對角化矩陣。

為何 Friedberg 的課本不使用最直接的詞彙？例如 $T$$n$ 個線性獨立特徵向量，或每個特徵值的幾何重數等於代數重數，則 $T$ 是可對角化的。不講 $\mathrm{dim}V=n$，卻說它是有限維向量空間；不說特徵向量，而硬要說 1維不變子空間；不說存在 $n$ 個線性獨立特徵向量，卻要說 $V$ 是1維不變子空間的直和；不用矩陣，而非要使用線性變換，縱使可對角化最後還是用矩陣來表示。

有沒有人知道到底是為什麼？

• npes_87184 說：

我覺得因為是習題，要是寫的那麼直白，就大家都會了。

9. VtripleV 說：

是因為主要是要談空間分解嗎?
空間分解=>光譜定理
空間分解=>投影

10. ccjou 說：

譜定理可以直接利用投影矩陣和基礎子空間分析解釋

我的問題是：明明是很簡單的「可對角化」，為什麼非要繞一大圈耗費這多力氣來導引呢？這樣不是很不符合成本效益嗎？

11. GSX 說：

我覺得講linear operator是因為不需要談到"矩陣"吧，比較general(雖然最後還是用了矩陣是變得有點沒意義)

而說finite-dimensional vector space可能是強調出並非無限維空間，也就是無限維空間這個結論不會對..嗎@@?

一維不變子空間直和這就有點囉嗦了，如果寫這段話之前已有談過特徵向量，那好像就有點不必要，大概是他不想多一個符號 “n" 吧，或是附近才剛談到不變子空間，可以複習一下^^|||

或者是他覺得"一維不變子空間直和"和"可對角化"這兩件事可以直接感覺出關係吧，雖然我感覺不出來XD

12. ccjou 說：

TO GSX:

你詮釋的很中肯也很有趣。如果將 Friedberg 等人寫的 linear algebra 和另一本入門書 elementary linear algebra 拿來比較，幾乎感覺不出這兩本書是出自同樣的三位作者。我總好奇當作者寫作時，預想的讀者背景如何？寫作的目的究竟是傳遞訊息，自我表述（把自己知道的全記錄下來）抑或還有其他隱藏的意圖？回到可對角化問題，或許繞一大圈也不是壞事，總可以讓我們從多個角度來看同一件事情。

我這週末將外出，回來再想想你在討論區提的問題。

13. vtriplev 說：

推測因為線性變換T:V->V
T的主要處理主角是vector space,
所以與T對應的要說不變子空間,而不說特徵向量

14. ccjou 說：

既然各位對於不變子空間的迴響有如此高的興致，改日我試著寫一篇從線性變換角度看不變子空間，循環子空間 (cyclic subspaces)，向量空間分割（直和），與不變子空間基底（特徵向量和廣義特徵向量）的關係文好了。

或者大家還有更棒的建議亦可提出。

15. 雲耕子 說：

因為這樣寫看起來比較強比較專業，至於看書的人看得懂看不懂那顯然不是作者們考慮的