答張盛東──關於三個半正定矩陣積的二次型為零的問題

網友張盛東留言:

老師,請教一個問題。已知 A, B, C 為實對稱半正定 (positive semidefinite) 矩陣,證明:對任意實向量 \mathbf{x},如果二次型 \mathbf{x}^T(ABC)\mathbf{x}=\mathbf{0},則 ABC=0。這題我想很久都找不到思緒,希望老師指點一下。

 
答曰:

首先說明本文採用的定義與記號。令 A 為一個 n\times n 階實對稱矩陣。若每一 n 維實向量 \mathbf{x} 使得 \mathbf{x}^TA\mathbf{x}\ge 0,則 A 稱為半正定矩陣,記作 A\succcurlyeq 0。若每一 \mathbf{x} 使得 \mathbf{x}^TA\mathbf{x}>0,則 A 稱為正定矩陣,記作 A\succ 0。對於 A\succcurlyeq 0B\succcurlyeq 0AB 未必對稱且半正定,例如,A=\begin{bmatrix} 1&1\\ 1&1 \end{bmatrix}B=\begin{bmatrix} 1&0\\ 0&0 \end{bmatrix}。二次型理論建立在實對稱矩陣上,但兩個半正定矩陣之積不保對稱性造成實對稱矩陣最美好的性質──正交對角化──變得無用武之地,因此我們勢必要尋找其他可行的解題切入點。下面介紹幾個有用的半正定與正定矩陣性質。

 
定理一:若 A\succcurlyeq 0,則有唯一 B\succcurlyeq 0 使得 A=B^2,我們稱 BA 的平方根,記作 \sqrt{A}

證明見“半正定矩陣的偏序關係”,定理四。定理一外表看似平凡,其實非常管用,原因在於 \sqrt{A}^T=\sqrt{A}。下列定理全數仰賴這個關鍵式:A=\sqrt{A}\sqrt{A}

 
定理二:若 A\succcurlyeq 0\mathbf{x}^TA\mathbf{x}=0,則 A\mathbf{x}=\mathbf{0}

使用定理一,

\displaystyle 0=\mathbf{x}^TA\mathbf{x}=\mathbf{x}^T\sqrt{A}\sqrt{A}\mathbf{x}=\left(\sqrt{A}\mathbf{x}\right)^T\left(\sqrt{A}\mathbf{x}\right)=\left\|\sqrt{A}\mathbf{x}\right\|^2

即知 \sqrt{A}\mathbf{x}=\mathbf{0}。等號兩邊左乘 \sqrt{A},可得 A\mathbf{x}=\mathbf{0}

 
定理三:若 A\succcurlyeq 0B\succcurlyeq 0,則

  1. \sqrt{A}B\sqrt{A}\succcurlyeq 0
  2. AB 有非負的特徵值。

回顧半正定矩陣的判別法:若 X=Y^TY,其中 Y 是一 n\times n 階實矩陣,則 X\succcurlyeq 0 (見“半正定矩陣的判別方法”)。據此,

\displaystyle \sqrt{A}B\sqrt{A}=\sqrt{A}\sqrt{B}\sqrt{B}\sqrt{A}=\left(\sqrt{B}\sqrt{A}\right)^T\left(\sqrt{B}\sqrt{A}\right)\succcurlyeq 0

因為 AB=\sqrt{A}\left(\sqrt{A}B\right)\left(\sqrt{A}B\right)\sqrt{A} 有相同的特徵值 (見“AB 和 BA 有何關係?”) 且半正定矩陣的特徵值皆為非負數,由 \sqrt{A}B\sqrt{A}\succcurlyeq 0 可推論 AB 有非負的特徵值。

 
定理四:令 AB 是實對稱矩陣。若 A\succ 0B\succ 0,則 AB 可對角化。

A\succ 0。正定矩陣 A 的特徵值皆為正數,因此 A 是可逆的,即知 AB 相似於 \sqrt{A}^{-1}AB\sqrt{A}=\sqrt{A}B\sqrt{A}。後者是一個實對稱矩陣,故可正交對角化為 \sqrt{A}B\sqrt{A}=QDQ^T,其中 Q 是正交矩陣 (Q^T=Q^{-1}),D 是對角矩陣 (見“實對稱矩陣可正交對角化的證明”)。所以,AB 亦可對角化,如下:

\displaystyle AB=\sqrt{A}\left(\sqrt{A}B\sqrt{A}\right)\sqrt{A}^{-1}=\sqrt{A}QDQ^T\sqrt{A}^{-1}=\left(\sqrt{A}Q\right)D\left(\sqrt{A}Q\right)^{-1}

使用同樣的方法可證明當 B\succ 0AB 可對角化。

 
定理五:若 A\succcurlyeq 0B\succcurlyeq 0\text{trace}(AB)=0,則 AB=BA=0

使用跡數循環不變性和 Frobenius 範數定義 (見“矩陣範數”),

\displaystyle\begin{aligned} 0=\text{trace}(AB)&=\text{trace}\left(\sqrt{A}\sqrt{A}\sqrt{B}\sqrt{B}\right)=\text{trace}\left(\sqrt{B}\sqrt{A}\sqrt{A}\sqrt{B}\right)\\ &=\text{trace}\left(\left(\sqrt{A}\sqrt{B}\right)^T\left(\sqrt{A}\sqrt{B}\right)\right)=\left\| \sqrt{A}\sqrt{B}\right\|_F^2, \end{aligned}

因此 \sqrt{A}\sqrt{B}=0。等號兩邊左乘 \sqrt{A},右乘 \sqrt{B},可得 \sqrt{A}\left(\sqrt{A}\sqrt{B}\right)\sqrt{B}=AB=0,並有 BA=B^TA^T=(AB)^T=0

 
回到主題,我們要證明:給定 A\succcurlyeq 0B\succcurlyeq 0C\succcurlyeq 0,若每一 \mathbf{x}\in\mathbb{R}^n 皆使 \mathbf{x}^TABC\mathbf{x}=\mathbf{0},則 ABC=0。底下提供二個證明。

 
證明一:假設 C\succ 0 (稍後再考慮 C\succcurlyeq 0 的情況)。考慮 BC 的特徵方程 BC\mathbf{x}_i=\lambda_i\mathbf{x}_i1\le i\le n。定理三說明 \lambda_1,\ldots,\lambda_n 不為負數,定理四並保證 BC 可對角化,所以 \mathbf{x}_1,\ldots,\mathbf{x}_n 是線性獨立的實特徵向量。分開兩種情形討論。若 \lambda_i=0,則 BC\mathbf{x}_i=\mathbf{0},也就有 ABC\mathbf{x}_i=\mathbf{0}。若 \lambda_i>0,則

\displaystyle 0=\mathbf{x}_i^TABC\mathbf{x}_i=\mathbf{x}_i^TA(\lambda_i\mathbf{x}_i)=\lambda_i(\mathbf{x}_i^TA\mathbf{x}_i)

因此 \mathbf{x}_i^TA\mathbf{x}_i=\mathbf{0}。使用定理二,可得 A\mathbf{x}_i=\mathbf{0}。代入 \mathbf{x}_i=\frac{1}{\lambda_i}BC\mathbf{x}_i,則有 \frac{1}{\lambda_i}ABC\mathbf{x}_i=\mathbf{0},故 ABC\mathbf{x}_i=\mathbf{0}。對於任一 \mathbf{x}\in\mathbb{R}^n,存在唯一組合式 \mathbf{x}=\alpha_1\mathbf{x}_1+\cdots+\alpha_n\mathbf{x}_n。套用以上結果,ABC\mathbf{x}=\sum_{i=1}^n\alpha_iABC\mathbf{x}_i=\mathbf{0},即 \ker (ABC)=\mathbb{R}^n,證得 ABC=0

 
第二個證法使用下列性質:令 P=[p_{ij}] 為一個 n\times n 階矩陣。若每一 \mathbf{x}\in\mathbb{R}^n 使得 \mathbf{x}^TP\mathbf{x}=\mathbf{0},則 P 是反對稱 (anti-symmetric 或 skew-symmetric) 矩陣,即 P=-P^T (見“特殊矩陣 (13):反對稱矩陣”)。證明於下:令 \mathbf{e}_in 維標準單位向量,其中第 i 元是 1,其餘元是 0。計算

\displaystyle \mathbf{e}_i^TP\mathbf{e}_i=p_{ii}=0,~~1\le i\le n

\displaystyle (\mathbf{e}_i+\mathbf{e}_j)^TP(\mathbf{e}_i+\mathbf{e}_j)=p_{ij}+p_{ji}=0,~~ i\neq j

合併可得 p_{ij}=-p_{ji}1\le i,j\le n

 
證明二:假設 C\succ 0。利用上述性質,命題條件給出 ABC=-(ABC)^T=-CBA。等號兩邊左乘 C^{-1},可得 C^{-1}(AB)C=-BA,即知 AB 相似於 -BA,所以 AB-BA 有相同的特徵值。然而,定理三表明 ABBA 有 (相同的) 非負特徵值。合併以上結果,推論出 AB 的特徵值必定為零,因此 \text{trace}(AB)=0。使用定理五立得 AB=0,故 ABC=0

 
C 是不可逆矩陣時 (C\succcurlyeq 0,但 C\succ 0 不成立),我用盡了自己所知的各種方法仍無法直接證得所求,苦無他計,最後只好採用連續論證法 (見“連續論證法”)。設 \epsilon 為一正數,則 C+\epsilon I\succ 0 (因為 C+\epsilon I 的特徵值等於 C 的特徵值加上 \epsilon)。給定 A\succcurlyeq 0B\succcurlyeq 0,且 C+\epsilon I\succ 0,我們已經證明下列命題:

\displaystyle \mathbf{x}^TAB(C+\epsilon I)\mathbf{x}=0,~~\forall \mathbf{x}\in\mathbb{R}^n\Rightarrow AB(C+\epsilon I)=0

矩陣積是所乘矩陣的各個元之連續函數。對於 C\succcurlyeq 0\lim_{\epsilon\to 0^+}AB(C+\epsilon I)=ABC,故可推論 ABC=0

Advertisements
本篇發表於 答讀者問, 二次型 並標籤為 , , , , , 。將永久鏈結加入書籤。

5 則回應給 答張盛東──關於三個半正定矩陣積的二次型為零的問題

  1. 張盛東 說道:

    多謝老師解答。

  2. Lin 說道:

    周老師的證明好強大,我有另外一種理解,不知道對不對。。。
    (1) 因為對任意實向量 \mathbf{x},二次型 \mathbf{x}^T(ABC)\mathbf{x}=\mathbf{0},那麼可以推斷ABC是一個PSD矩陣。
    (2) 取ABC的特徵向量作為x,可得ABC的所有特徵值為0。
    根據(1-2),可得ABC=0。

    上述證明是否正確,懇請周老師指點迷津。。。

    • ccjou 說道:

      本文的半正定矩陣蘊含對稱性,但ABC不保證具有對稱性。你需要對稱性以便找齊特徵向量。

      • Lin 說道:

        非常感謝周老師回复哈!我確實忘記對稱性了。。。這個問題蠻有意思的,等有時間了再琢磨下下。

        • ccjou 說道:

          補充解釋:所有的 \mathbf{x} 使得 \mathbf{x}^TA\mathbf{x}=0 並非 A=0 的一個充分條件,例如,skew-symmetric A=\begin{bmatrix} 0&1\\ -1&0 \end{bmatrix}A 的特徵值為 \pm i

          你不妨先試試證明兩個矩陣的情況:若 AB 是實對稱半正定,且所有的 \mathbf{x} 使得 \mathbf{x}^TAB\mathbf{x}=0,則 AB=0

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s