Tag Archives: Hessian 矩陣

Krylov 子空間法──線性方程的數值解法 (一)：Arnoldi 與 Lanczos 算法

Posted on 11/26/2015 by ccjou

本文的閱讀等級：高級令為一階複矩陣，為一非零向量。向量序列稱為 Krylov 序列，此序列所生成的子空間稱為 Krylov 子空間 (見“Krylov 子空間法”)，記為。因為是有限維空間的一個子空間，當不斷增大時，Krylov 序列最終會是一個線性相關集。設為最小的正整數使得，也就是說為一個線性獨立集且。因此，存在唯一數組滿足。定義次多項式。因為，我們稱為相對於的最小 (消滅) 多項式 (minimal polynomial)。以下考慮為可逆矩陣。我們可以斷定，否則有，即存在次數小於 … Continue reading →

Posted in 線性代數專欄, 數值線性代數 | Tagged Arnoldi 算法, Gram-Schmidt 正交化, Hessenberg 矩陣, Hessian 矩陣, Krylov 子空間法, Lanczos 算法, 單範正交基底, 最小多項式, 三對角矩陣 | 3 Comments

邏輯斯回歸

Posted on 03/26/2014 by ccjou

本文的閱讀等級：中級假設我們有一筆維數等於，樣本大小為，包含個類別的數據。數據點散布在空間，以標記類別或代表類別的指標集，例如，表示來自 (歸屬) 第類。我們的問題是利用給定的樣本，設計一個分類器 (classifier)；具體地說，給定一個數據點，判定它應歸於何類。貝氏定理 (Bayes’ theorem) 提供了分類問題的理論基礎 (見“貝氏定理──量化思考的利器”)：，其中是類別出現的機率，稱為先驗機率 (priori probability)；是條件密度函數，即給定類別，數據點的機率密度函數，也稱為似然 (likelihood)；是數據點的機率密度函數，稱為證據 (evidence)，算式為；是指在給定數據點的情況下，該點屬於的機率，稱為後驗機率 (posterior probability)。 … Continue reading →

Posted in 機器學習 | Tagged 牛頓法, 線性判別分析, 邏輯斯回歸, Hessian 矩陣, Softmax 函數, S型函數, 常態分布, 最大似然估計, 梯度下降法 | 4 Comments

答張盛東──關於 Hessian 矩陣與多變量函數的泰勒展開式

Posted on 09/09/2013 by ccjou

網友張盛東留言：老師，其實能否將 Hessian 矩陣看作 gradient 算子與自身的外積 (outer product)[1] 再乘以函數？如果可以，是否可能將多變數函數的 Taylor 展開式前兩項之後的項都像這樣表示成 gradient 算子與自身的外積？

Posted in 特別主題, 答讀者問 | Tagged Hessian 矩陣, Jacobian 矩陣, 梯度, 泰勒展開式 | 2 Comments

凸函數

Posted on 08/27/2013 by ccjou

本文的閱讀等級：中級令為一個非空凸集，也就是說，給定任意兩點和，點屬於 (見“凸組合、凸包與凸集”)。凸函數 (convex function) 是一個實函數滿足下列性質：對於任意且，。若定義式等號僅發生於和，我們稱是一個嚴格凸函數。相反的，若是一個 (嚴格) 凸函數，則稱為 (嚴格) 凹函數。圖一顯示一個單變量凸函數，任一弦 (連結點和的紅色線段) 必位於函數 (藍色曲線) 的上方。下面列舉一些單變量凸函數：，，和。對於，仿射函數和向量 -範數，，都是凸函數 (見“向量範數”)。本文將討論凸函數的一些性質和判別方法。

Posted in 線性代數專欄, 仿射幾何 | Tagged Hessian 矩陣, Jensen 不等式, 凸組合, 凸集, 凸函數, 水平集, 上境圖 | 2 Comments

矩陣導數

Posted on 05/31/2013 by ccjou

本文的閱讀等級：中級令為一個多變量可導函數，或記為，其中。我們定義的梯度 (gradient) 為底下的維向量：，其中的第元是對變數的一階偏導數。如果給定個多變量函數，則有個梯度。將所有梯度合併成一個矩陣，再取轉置，可得階矩陣，稱為 Jacobian 矩陣。另一方面，如果是二階可導函數，我們可以計算的每一元的梯度，如此可得，稱為 Hessian 矩陣。請注意，梯度的 Jacobian 矩陣即為函數的 Hessian 矩陣 (見“Jacobian … Continue reading →

Posted in 特別主題 | Tagged 矩陣導數, 矩陣指數, Hessian 矩陣, Jacobian 矩陣, 最小平方法, 梯度 | 31 Comments

Jacobian 矩陣與行列式

Posted on 11/26/2012 by ccjou

本文的閱讀等級：中級令為一個向量函數。對於維實向量，具有下列形式：，其中，是的定義域。例如，極座標至卡氏座標的轉換是一個向量函數：，其中，。如果向量函數的數學形式相當複雜，線性化是一個常用的簡化方法。針對單變量函數，在附近我們可用直線近似。推廣至多變量函數，令為一個仿射 (affine) 變換 (見“仿射變換”)，表示如下：，其中是一個階實矩陣，。下面解釋如何以仿射變換近似向量函數，由此衍生的導數矩陣，稱為 Jacobian 矩陣 (或簡稱 Jacobian)，隨後介紹 Jacobian 行列式與其應用，以及 Jocabian 矩陣與 Hessian 矩陣的關係。

Posted in 線性代數專欄, 應用之道 | Tagged Hessian 矩陣, Jacobian 矩陣, Jacobian 行列式, 向量函數, 導數, 換元積分法, 梯度, 極座標, 仿射變換 | 14 Comments

Hermitian 矩陣與實對稱矩陣的一些實例

Posted on 11/08/2012 by ccjou

本文的閱讀等級：初級令為一個階矩陣。若，其中，即，我們稱為 Hermitian 矩陣 (見“特殊矩陣 (9)：Hermitian 矩陣”)。若所有都是實數，則，實 Hermitian 矩陣即為實對稱矩陣。Hermitian 矩陣和實對稱矩陣是目前應用最廣的特殊矩陣，原因有二：它們具備許多美好的特徵分析性質 (見“實對稱矩陣可正交對角化的證明”，“Hermitian 矩陣特徵值的變化界定”)，以及它們「天生地」出現在多樣應用場合。下面列舉一些實例，包括 Hessian 矩陣、共變異數矩陣、鄰接矩陣、二次型和雙線性形式。

Posted in 線性代數專欄, 二次型 | Tagged 鄰接矩陣, 雙線性形式, Hermitian 矩陣, Hessian 矩陣, 共變異數矩陣, 實對稱矩陣, 期望值, 泰勒展開式, 二次型 | Leave a comment

Lagrange 乘數法

Posted on 05/30/2012 by ccjou

本文的閱讀等級：中級約束最佳化 (constrained optimization) 是指在一個或多個束縛條件下，尋找一個多變數函數的極值 (極大值或極小值)。舉例來說，我們希望得到的極小值，但前提是與必須滿足束縛條件。最直截了當的作法是解出束縛條件，如此可表示為的函數，譬如。將上式代入可得單變數無約束目標函數，求導並設為零即得極值的必要條件。這個方法的主要缺點在於束縛條件未必存在代數解，也就是說無法寫成的函數。此外，當變數的數量增多或有多個束縛條件時，縱使能夠得到代數解，無約束目標函數的表達式也可能相當複雜。與上述作法比較，拉格朗日乘數法 (method of Lagrange multipliers) 或稱未定乘數法 (undetermined multipliers) 不須解出束縛條件，因而保留了變數之間的對稱性。由於兼具簡單與典雅兩個優點，Lagrange 乘數法是目前最常被使用於約束最佳化問題的方法。令 Lagrangian 函數為，其中稱為 Lagrange 乘數。計算對所有變數的偏導數並設為零：，這個方程組即為最佳解的必要條件。本文採用較富直覺的幾何觀點解說 Lagrange 乘數法的基本原理，預備知識包括正交補餘和正交投影 (見“正交補餘與投影定理”)。

Posted in 特別主題 | Tagged Hessian 矩陣, Lagrange 乘數法, 梯度, 正交投影, 泰勒展開式, 仿射投影 | 9 Comments

最佳化理論與正定矩陣

Posted on 10/06/2009 by ccjou

本文的閱讀等級：中級最佳化理論 (優化理論，optimization theory) 提供許多應用於社會、自然與工程科學的數值算法。給定一個目標函數或稱成本函數，無約束優化 (unconstrained optimization) 是指找到使得有最小值，表示如下：。在一些應用場合，如果我們希望找到最大值，只要改變目標函數的正負號即可。對一般的目標函數，這是一個很困難的問題，通常我們願意接受局部最小值 (稍後詳述)，意思是在某個範圍內的最小值。底下我們先考慮單變數的目標函數，隨後再推廣至多變數函數。本文的主旨在介紹無約束優化的一些基本概念並解釋正定矩陣於判定極值 (最大或最小) 存在性的用途。

Posted in 線性代數專欄, 二次型 | Tagged Hessian 矩陣, 最佳化, 梯度, 梯度下降法, 正定矩陣, 泰勒展開式 | 5 Comments

	jianglong on Strassen 演算法──分治矩陣乘法
	jianglong on Strassen 演算法──分治矩陣乘法
	xmj on 內積的定義
	Ning ChingSan on 線性代數的第一堂課──矩陣乘法的定義
	momo on 兩岸線性代數用詞參照
	訪客 on 克拉瑪公式的簡易幾何證明

Tag Archives: Hessian 矩陣

Krylov 子空間法──線性方程的數值解法 (一)：Arnoldi 與 Lanczos 算法

邏輯斯回歸

答張盛東──關於 Hessian 矩陣與多變量函數的泰勒展開式

凸函數

矩陣導數

Jacobian 矩陣與行列式

Hermitian 矩陣與實對稱矩陣的一些實例

Lagrange 乘數法

最佳化理論與正定矩陣

搜尋(繁體中文或英文)

訊息看板

近期文章

線性代數專欄

其他主題專欄

每週問題

數據充分性問題

其他分類

Recent Comments

近期最多人點閱

分類

Archives

標籤雲

線代線上影音課程

線代學習網站

線代電子書

矩陣計算器

LaTeX

Blogroll

訂閱

閱讀導引

學習資源

專題探究

急救查詢

其他分頁

Meta

網路狀態

Blog Stats