矩陣函數 (上)

$\cos\left[\!\!\begin{array}{rr} -2&-6\\ 1&3 \end{array}\!\!\right]=\begin{bmatrix} \cos(-2)&\cos(-6)\\ \cos 1&\cos 3 \end{bmatrix}$

$\displaystyle e^{x}=1+x+\frac{x^2}{2!}+\cdots$

$x$$A$ 取代，常數 $1$ 以單位矩陣 $I$ 取代 (因為 $x^0=1$，也就有 $A^0=I$)，便得到矩陣指數

$\displaystyle e^{A}=I+A+\frac{A^2}{2!}+\cdots$

$A=S\Lambda S^{-1}=S\begin{bmatrix} \lambda_1&~&~\\ ~&\ddots&~\\ ~&~&\lambda_n \end{bmatrix}S^{-1}$

\begin{aligned}\displaystyle e^{A}&=SIS^{-1}+S\Lambda S^{-1}+S\frac{\Lambda^k}{2!}S^{-1}+\cdots\\ &=S\left(I+\Lambda+\frac{\Lambda^2}{2!}+\cdots \right)S^{-1}\\ &=S\begin{bmatrix} e^{\lambda_1}&~&~\\ ~&\ddots&~\\ ~&~&e^{\lambda_n} \end{bmatrix}S^{-1}.\end{aligned}

$f(\Lambda) \overset{\underset{\mathrm{def}}{}}{=}\mathrm{diag}(f(\lambda_1),\ldots,f(\lambda_n))$

$f(A)=Sf(\Lambda)S^{-1}=S\begin{bmatrix} f(\lambda_1)&~&~\\ ~&\ddots&~\\ ~&~&f(\lambda_n) \end{bmatrix}S^{-1}$

$f(z)=\displaystyle\sum_{k=0}^{\infty}c_k(z-z_0)^k$

\begin{aligned} f(A)&=S\Lambda S^{-1}\\ &=\begin{bmatrix} X_1&\cdots&X_m \end{bmatrix}\begin{bmatrix} f(\lambda_1)I_{\beta_1}&~&~\\ ~&\ddots&~\\ ~&~&f(\lambda_m)I_{\beta_m} \end{bmatrix}\begin{bmatrix} Y_1^T\\ \vdots\\ Y_m^T \end{bmatrix}\\ &=f(\lambda_1)X_1Y_1^T+\cdots+f(\lambda_m)X_mY_m^T\\ &=f(\lambda_1)P_1+\cdots+f(\lambda_m)P_m,\end{aligned}

$A=\left[\!\!\begin{array}{rr} 3&-2\\ -1&1 \end{array}\!\!\right]\begin{bmatrix} 0&0\\ 0&1 \end{bmatrix}\left[\!\!\begin{array}{rr} 3&-2\\ -1&1 \end{array}\!\!\right]^{-1}$

\begin{aligned} \cos A&=\left[\!\!\begin{array}{rr} 3&-2\\ -1&1 \end{array}\!\!\right]\begin{bmatrix} \cos 0&0\\ 0&\cos 1 \end{bmatrix}\left[\!\!\begin{array}{rr} 3&-2\\ -1&1 \end{array}\!\!\right]^{-1}\\ &=\begin{bmatrix} 3-2\cos 1&6-6\cos 1\\ -1+\cos 1&-2+3\cos 1 \end{bmatrix}.\end{aligned}

$\displaystyle p(A)=\sum_{i=1}^mp(\lambda_i)P_i=\sum_{i=1}^mf(\lambda_i)P_i=f(A)$

$\displaystyle p(z)=f(\lambda_1)\prod_{j\neq 1}\left(\frac{z-\lambda_j}{\lambda_1-\lambda_j}\right)+\cdots+f(\lambda_m)\prod_{j\neq m}\left(\frac{z-\lambda_j}{\lambda_m-\lambda_j}\right)$

$\displaystyle f(A)=p(A)=f(\lambda_1)\prod_{j\neq 1}\left(\frac{A-\lambda_jI}{\lambda_1-\lambda_j}\right)+\cdots+f(\lambda_m)\prod_{j\neq m}\left(\frac{A-\lambda_jI}{\lambda_m-\lambda_j}\right)$

$g_i(z)=\left\{\begin{array}{ll} 1&\mbox{if~}z=\lambda_i\\ 0&\mbox{if~}z\neq \lambda_i \end{array}\right.$ 取代 $f(z)$，可得

$\displaystyle g_i(A)=P_i=\prod_{j\neq i}\left(\frac{A-\lambda_jI}{\lambda_i-\lambda_j}\right),~~1\le i\le m$

$\displaystyle P_1=\frac{A-1I}{0-1}=\left[\!\!\begin{array}{rr} 3&6\\ -1&-2 \end{array}\!\!\right],~~P_2=\frac{A-0I}{1-0}=\left[\!\!\begin{array}{rr} -2&-6\\ 1&3 \end{array}\!\!\right]$

\displaystyle\begin{aligned} \cos A&=(\cos 0)\left[\!\!\begin{array}{rr} 3&6\\ -1&-2 \end{array}\!\!\right]+(\cos 1)\left[\!\!\begin{array}{rr} -2&-6\\ 1&3 \end{array}\!\!\right]\\ &=\begin{bmatrix} 3-2\cos 1&6-6\cos 1\\ -1+\cos 1&-2+3\cos 1 \end{bmatrix}.\end{aligned}

[1] Gene H. Golub and Charles F. Van Loan, Matrix Computations, 2nd ed., 1989, pp. 540.

This entry was posted in 特徵分析, 線性代數專欄 and tagged , , , , , . Bookmark the permalink.

13 則回應給 矩陣函數 (上)

1. Watt Lin 說：

請問有沒有一種性質存在：
det( exp(A) ) = exp( det(A) )
det( cos(A) ) = cos( det(A) )
det( sin(A) ) = sin( det(A) )

抱歉，我沒正式修線性代數，只是看過一遍老師的光碟，當作業餘進修。
問這個題目，可能很幼稚。
如果 exp, cos, sin 不具有這種性質，
可否請老師舉些例子，說明某些矩陣可以先計算行列式值再代入函數，恰好與先求函數再算行列式值，其結果相等。

對角矩陣用在exp函數，這項性質應該成立吧！其他的我不清楚。

我好像曾經看過其他類似的東西，但記憶模糊，請老師指導。

2. Watt Lin 說：

自己簡單驗證：
對角矩陣先求exp再作det，與先求det再作exp，是不同的。

3. ccjou 說：

你寫的性質都不存在，不過卻有
$\mathrm{det}(e^{A})=e^{\lambda_1}\cdots e^{\lambda_n}=e^{\mathrm{trace}A}$

又因為 $\mathrm{cos}A=S(\mathrm{cos}\Lambda)S^{-1}$，所以
$\mathrm{det}(\mathrm{cos}A)=(\mathrm{det}S)(\mathrm{det}(\mathrm{cos}\Lambda))(\mathrm{det}S^{-1})$
$=(\mathrm{cos}\lambda_1)\cdots(\mathrm{cos}\lambda_n)$
但上式並不等於 $\mathrm{cos}(\mathrm{det}A)=\mathrm{cos}(\lambda_1\cdots\lambda_n)$

4. ccjou 說：

oops, 不小心按到submit
$A$ 可對角化，一般情況即為
$\mathrm{det}(f(A))=\mathrm{det}(Sf(\Lambda)S^{-1})$
$=\mathrm{det}(f(\Lambda))=f(\lambda_1)\cdots f(\lambda_n)$

5. Watt Lin 說：

感謝老師說明，我的觀念清楚了！

6. 阿蟲 說：

√A這類的呢,還有A^(1/3)
沒有馬克勞林級數可以展(還是有我不知道,我也搞不懂)
那它要怎麼解?

7. ccjou 說：

按上文所述方式同樣可以定義 $\sqrt{A}$$(A)^{1/3}$，但通常我們僅針對半正定矩陣定義其平方根（因為它具有實際用途）。對於所有實數 $x\ge 0$，我們定義 $f(x)=\sqrt{x}$$x$ 的正平方根。若 $A$ 是半正定矩陣，則 $A$ 的所有特徵值都是非負數，故 $\sqrt{A}$ 也是半正定，而且可以證明它唯一存在，因此也為良好定義。

另外你當然也可以利用 Taylor 展開計算 $\sqrt{A}$，在 $x=1$ 展開 $f(x)=\sqrt{x}$ 可得
$\sqrt{x}=1+\frac{1}{2}(x-1)-\frac{1}{4(2!)}(x-1)^2+\frac{1\cdot 3}{8(3!)}(x-1)^3+\cdots$
$=1+\frac{1}{2}(x-1)+\sum_{n=2}^{\infty}(-1)^{n+1}\frac{(2n-3)!}{2^{2n-2}(n!)(n-2)!}(x-1)^n$
$x$ 替換為 $A$$1$ 替換為 $I$ (單位矩陣) 即可。

8. ccjou 說：

補充說明：矩陣函數 $\sqrt{A}$ 是一個很複雜的問題，由以下數個事實可略窺一二。
1) 若 $A$ 可對角化，則 $\sqrt{A}$ 可如上文所述方式計算。
2) 某些 $A$ 可能存在無窮多種可能的 $\sqrt{A}$，例如，$X^2=I$$X=S\begin{bmatrix} 1&0\\ 0&-1 \end{bmatrix}S^{-1}$$S$ 為任意可逆矩陣。
3) 某些 $A$ 沒有 $\sqrt{A}$，例如，
$A=\begin{bmatrix} 0&1\\ 0&0 \end{bmatrix}$
4) $A=\begin{bmatrix} 0&1&0&0\\ 0&0&0&0\\ 0&0&0&1\\ 0&0&0&0 \end{bmatrix}$ 不可對角化，但 $\sqrt{A}$ 可以為
$\sqrt{A}=\begin{bmatrix} 0&0&1&0\\ 0&0&0&1\\ 0&1&0&0\\ 0&0&0&0 \end{bmatrix}$

9. 阿蟲 說：

非常謝謝老師的解說

10. 張盛東 說：

老師，請教一條關於矩陣函數收斂的問題。
For an arbitrary $A\in C^{m\times m}$ and norm $\latex ||\cdot||$, prove using Theorem “Every square matrix A has a Schur factorization".
(a) $\latex lim_{n\rightarrow \infty}||A^n||=1 \Leftrightarrow \rho(A) < 1$, where $\latex \rho$ is the spectral radius.
(b) $\latex lim_{t\rightarrow \infty}||e^{tA}||=0 \Leftrightarrow \alpha(A) < 0$, where $\latex \alpha$ is the spectral abscissa.

11. 張盛東 說：

不好意思，多加了斜杠。
For an arbitrary and norm $||\cdot||$, prove using Theorem “Every square matrix A has a Schur factorization".
(a) $lim_{n\rightarrow \infty}||A^n||=1 \Leftrightarrow \rho(A) < 1$, where $\rho$ is the spectral radius.
(b) $lim_{t\rightarrow \infty}||e^{tA}||=0 \Leftrightarrow \alpha(A) < 0$, where $\alpha$ is the spectral abscissa.

• ccjou 說：

(1) Schur factorization: 設 $A$$m\times m$$A=UTU^\ast=U(D+N)U^\ast$，其中 $UU^\ast=I$$D=\mathrm{diag}(\lambda_1,\ldots,\lambda_m)$，上三角形矩陣$N$ 的主對角元為零，$N$ 是nilpotent matrix，即 $N^k=0$$k\ge m$

(2) $A^n=U(D+N)^nU^\ast$$\Vert A^n\Vert\le\Vert U\Vert\cdot\Vert(D+N)^n\Vert\cdot\Vert U^\ast\Vert=\Vert(D+N)^n\Vert$。見

(3) 使用二項式定理，見
https://ccjou.wordpress.com/2012/07/04/%E5%BB%A3%E7%BE%A9%E6%94%B6%E6%96%82%E7%9F%A9%E9%99%A3/

https://ccjou.wordpress.com/2010/12/08/%E6%94%B6%E6%96%82%E7%9F%A9%E9%99%A3/
可證明 $\lim_{n\to\infty}(D+N)^n=0$$\lim_{n\to\infty}\Vert A^n\Vert=0$ iff $\rho(A)<1$。你寫出的命題有誤。第二個問題用類似方法亦可得證。

• 張盛東 說：

是的。第一問應該是$lim_{n\rightarrow \infty} ||A^n||=0$。謝謝老師解答。