海森堡不確定性原理的矩陣證明

本文的閱讀等級:高級

在量子力學裏,不確定性原理[1](uncertainty principle) 表明:粒子的位置與動量不可同時被確定,位置的不確定性 \Delta Q 與動量的不確定性 \Delta P 遵守不等式

\displaystyle  \Delta Q\cdot\Delta P\ge\frac{\hbar}{2}

其中 \hbar=h/(2\pi)h 是普朗克常數[2](Planck constant)。海森堡[3] (Werner Heisenberg) 在1927年發表的一篇論文裏,寫下

\Delta Q\cdot\Delta P\approx h

雖然他提到這公式可以從對易關係 (commutation relation,稍後將說明) 推導出來,但他並沒有寫出相關的數學論證,也沒有給予 \Delta Q\Delta P 確切的定義。同年,肯納德 (Earl Hesse Ke,nnard) 首先證明不確定關係不等式,1929年羅伯森 (Howard Percy Robertson) 又從對易關係推導出相同的結論[4]。本文使用現代讀者熟悉的矩陣分析方法證明不確定性原理。由於我對量子力學幾乎一無所知,在提到相關知識的時候均盡量列舉引用出處以方便讀者參照查詢。

 
物理學家費曼 (Richard P. Feynman) 說[5]

量子力學所描述的,概括一切物質行為的細節,尤其對那些發生在原子尺度的部分特別管用。非常微小東西的行為,跟我們的直接經驗完全不同,它們的行為既非波動性質,亦非粒子性質。也不完全像雲、撞球檯上的球、或彈簧上的砝碼。總而言之,完全不像我們日常看見過的任何東西。

隨後又補充解釋:

因為所有人生經歷、思維直覺,無不是從大尺度事物來的。我們的經驗會隨時提醒我們,大尺度事物會如何因應,但是微小尺度的事物所採取的因應方式迥然不同。所以我們學習它的時候,必須強迫自己用抽象或想像的方式,而絕不能到我們直接經驗中去尋找聯想。

 
既然我們無法從直接經驗去尋找聯想量子世界的運行方式,物理學家選擇何種假設或模型,在很大的程度上取決於個人的想像力與信念。1925年海森堡思考著量子力學的建立基礎,他憶起愛因斯坦曾說[6]:「你的理論決定了你所觀察到的。」這句話啟發他換一個角度看待問題,之後他建議[4]:只有在實驗裏能夠測量到的物理量,稱為可觀察量 (observable),才可以用理論描述其物理行為。當然,並不是所有的物理學家都抱持相同的看法。量子力學的另一位創建者薛丁格 (Erwin Schrödinger) 起初也不認同海森堡的想法 (但很快地,薛丁格於1926年證明波力學與矩陣力學是量子力學的兩種等價描述[6])。儘管未獲得眾多同行的支持,海森堡、玻恩 (Max Born) 與約當 (Pascual Jordan) 仍於1925年共同創立矩陣力學[7](matrix mechanics),大膽假設關於運動的古典概念不適用於量子層級。在原子裏的電子並不是運動於明確的軌道,而是模糊不清,無法觀察到的軌域。海森堡棄絕任何涉及粒子運動軌道的詳細計算,因為運動軌道是無法直接觀察到的。他選擇另一條道路:專注於研究電子躍遷時,所發射的光的離散頻率和強度。他計算出代表位置和動量的無限維矩陣 (即階數無限大的矩陣),這些矩陣能夠正確地預測電子躍遷所發射出光波的強度[4]

 
海森堡從電子轉移的現象歸納出矩陣力學的前提[7]:所有的可觀察物理量都可以用矩陣表示。矩陣的特徵值集合是該物理量可能出現的觀察值。對一般人來說,這絕對是一個聞所未聞的神秘主義。在經驗世界裏,我們頂多用一個隨機變數來表示可觀察量,譬如,投擲骰子可能出現的點數,可是觀察量本身怎麼會跟矩陣扯上關係?況且在工程科學中,矩陣不都是拿來表示線性系統嗎?但量子力學不同於過去的典範,物理學家總是各憑本事編造出許多奇怪的想法企圖描繪原子層次的行為。不論信與不信,我們暫且接受這個瘋狂的假設。因為實驗測量的結果是實數,Hermitian 矩陣的特徵值又都是實數 (A 是 Hermitian 若 A^\ast=A,見“特殊矩陣 (9):Hermitian 矩陣”),所以我們可以用 Hermitian 矩陣來代表可觀察量。例如,Hermitian 矩陣

A=\left[\!\!\begin{array}{rcc}  3&0&i\\  0&1&0\\  -i&0&3  \end{array}\!\!\right]

有特徵值 1, 2, 4,說明 A 所代表的物理量僅能觀察到這三個值。如果實驗結果是某一特徵值,那麼對應的特徵向量表示在實驗測量之後的一瞬間物理系統所處的特徵狀態。(所謂特徵狀態代表甚麼意思呢?稍後說明。) Hermitian 矩陣的特徵向量是複向量,上例為 (0,1,0)^T, (1,0,i)^T, (1,0,-i)^T。這些特徵向量位於向量空間 \mathbb{C}^3,但並不是必然如此,我們只是剛巧以 3\times 3 階矩陣 A 表示物理量而已。舉例來說,設想一個粒子在直線上自由運動,我們用矩陣 X 來代表它的位置。由於粒子可能在直線上的任何點,觀察值可以是 X 的無窮多個特徵值所成的集合其中任一元素 x。這麼說來,X 必定是一個無限維矩陣,此矩陣的行空間 (column space,特徵向量存在的空間) 也是一個無限維向量空間,它的正式名稱叫做希爾伯特 (Hilbert) 空間 (見 “從幾何向量空間到函數空間”)。在希爾伯特空間中,向量具有無限維數,無限維矩陣改稱為算子 (operator);我們仍然可以計算內積,因此向量長度與正交投影都有良好的定義。為方便解釋,底下考慮有限維座標空間 \mathbb{C}^n,除非特別註明,否則假定算式於 n\to\infty 仍然是有意義的 (即數值收斂)。

 
為了弄清楚海森堡的想法,我們必須知道 Hermitian 矩陣的一些基本性質。在一個量子系統中,令 n\times n 階 Hermitian 矩陣 A 代表一個可觀察量,其特徵值為 \lambda_i,對應特徵向量 \mathbf{x}_ii=1,\ldots,n。這些特徵向量構成一組單範正交基底 (orthonormal basis) \{\mathbf{x}_1,\ldots,\mathbf{x}_n\},也就是說,\mathbf{x}_i^\ast\mathbf{x}_j=\delta_{ij}i,j=1,\ldots,n,其中 \delta_{ij} 是 Kronecker 記號,\delta_{ij}=1i=j\delta_{ij}=0i\neq j (見“實對稱矩陣可正交對角化的證明”)。令 n 維複向量 \mathbf{x} 代表量子系統處在的狀態,稱為量子態[8](quantum state)。若量子系統處在某個特徵狀態,\mathbf{x}=\mathbf{x}_i,物理量 A 的觀察值即是特徵值 \lambda_i。但當量子系統不在特徵狀態時,\mathbf{x}\neq\mathbf{x}_ii=1,\ldots,n,量子態 \mathbf{x} 又具有甚麼意義呢?將量子態 \mathbf{x} 表示成

\mathbf{x}=c_1\mathbf{x}_1+\cdots+c_n\mathbf{x}_n

上式左乘 \mathbf{x}_i^\ast 可得 c_i=\mathbf{x}_i^\ast\mathbf{x},此即 \mathbf{x}\mathbf{x}_i 的正交投影值,或者說,c_i\mathbf{x}\mathbf{x}_i 的成分或權重。量子態 \mathbf{x} 的物理意義可以從組合權重 \{c_i\} 來解釋。量子力學稱複數 c_i 為機率幅[9](probability amplitude),原因是 \vert c_i\vert^2=\overline{c_i}c_i 即為觀察值 \lambda_i 出現的機率。據此,量子態 \mathbf{x} 的組合係數絕對值平方 \vert c_1\vert^2,\ldots,\vert c_n\vert^2 表示在該狀態下,量子系統所有可能出現的觀察值 \lambda_1,\ldots,\lambda_n 的機率分配,故有歸一性 \sum_{i=1}^n\vert c_i\vert^2=1。因為 \{\mathbf{x}_1,\ldots,\mathbf{x}_n\} 是一個單範正交集,

\displaystyle\begin{aligned}  \Vert\mathbf{x}\Vert^2&=\mathbf{x}^\ast\mathbf{x}=\left(\sum_{i=1}^nc_i\mathbf{x}_i\right)^\ast\left(\sum_{j=1}^nc_j\mathbf{x}_j\right)\\  &=\sum_{i=1}^n\sum_{j=1}^n\overline{c_i}c_j\mathbf{x}_i^\ast\mathbf{x}_j=\sum_{i=1}^n\sum_{j=1}^n\overline{c_i}c_j\delta_{ij}=\sum_{i=1}^n\vert c_i\vert^2,\end{aligned}

可知量子態 \mathbf{x} 也滿足歸一性 \Vert\mathbf{x}\Vert^2=1。當系統處在量子態 \mathbf{x},如何計算可觀察量 A 的期望值呢?出乎意料外,答案是二次型 \mathbf{x}^\ast A\mathbf{x}。使用特徵方程 A\mathbf{x}_j=\lambda_j\mathbf{x}_j,可得

\displaystyle\begin{aligned}  \mathbf{x}^\ast A\mathbf{x}&=\left(\sum_{i=1}^nc_i\mathbf{x}_i\right)^\ast A\left(\sum_{j=1}^nc_j\mathbf{x}_j\right)=\left(\sum_{i=1}^nc_i\mathbf{x}_i\right)^\ast\left(\sum_{j=1}^nc_jA\mathbf{x}_j\right)\\  &=\left(\sum_{i=1}^nc_i\mathbf{x}_i\right)^\ast\left(\sum_{j=1}^nc_j\lambda_j\mathbf{x}_j\right)=\sum_{i=1}^n\sum_{j=1}^n\overline{c_i}c_j\lambda_j\mathbf{x}_i^\ast\mathbf{x}_j\\  &=\sum_{i=1}^n\sum_{j=1}^n\overline{c_i}c_j\lambda_j\delta_{ij}=\sum_{i=1}^n\lambda_i\vert c_i\vert^2.\end{aligned}

為簡化符號,可觀察量 A 在量子態 \mathbf{x} 的期望值表示為

\left\langle A\right\rangle=\mathbf{x}^\ast A\mathbf{x}

類似機率學的標準差 \sigma=\sqrt{E[(x-\mu)^2]}=\sqrt{E[x^2-\mu^2]},其中 \mu=E[x] 是隨機變數 x 的期望值,我們定義可觀察量 A 在量子態 \mathbf{x} 的不確定性 (uncertainty) 如下:

\Delta A=\sqrt{\mathbf{x}^\ast(A^2-\left\langle A\right\rangle^2I)\mathbf{x}}

關於矩陣力學基礎知識的討論至此告一段落,不確定性原理的證明即將展開。

 
1925年,玻恩閱讀了海森堡的論文後,發現位置與動量無限維矩陣有一個很顯著的關係──它們不可交換 (或說不互相對易)[4,7]。不確定性原理是下列不互相對易關係的直接結果:

[Q,P]=i\hbar I

其中 Q 是位置矩陣,P 是動量矩陣,I 是單位矩陣,i=\sqrt{-1}。上式中,[Q,P] 稱為交換子 (commutator,或稱對易算符),定義為

[Q,P]=QP-PQ

請注意,上述不互相對易關係僅適用於無限維矩陣 (即量子力學的算符)。若 PQn\times n 階有限矩陣,使用跡數循環不變性 (見“跡數的性質與應用”),

\hbox{tr}(QP-PQ)=\hbox{tr}(QP)-\hbox{tr}(PQ)=\hbox{tr}(QP)-\hbox{tr}(QP)=0

\hbox{tr}(i\hbar I)=ni\hbar。在無限維向量空間,跡數未必定義完善,因為它不一定收斂。下面介紹的證法大致依循諾伊曼 (John von Neumann) 的推演方式[10]。第一個步驟設法創造一個引入交換子 [Q,P] 的數學式。諾伊曼選擇了 (Q\mathbf{x})^\ast(P\mathbf{x})。因為 QP 是 Hermitian 矩陣,Q^\ast=QP^\ast=P,可得

\begin{aligned}  (Q\mathbf{x})^{\ast}(P\mathbf{x})-(P\mathbf{x})^{\ast}(Q\mathbf{x})&=\mathbf{x}^{\ast}Q^{\ast}P\mathbf{x}-\mathbf{x}^{\ast}P^{\ast}Q\mathbf{x}\\  &=\mathbf{x}^\ast QP\mathbf{x}-\mathbf{x}^\ast PQ\mathbf{x}\\  &=\mathbf{x}^\ast(QP-PQ)\mathbf{x}\\  &=\mathbf{x}^\ast [Q,P]\mathbf{x}=\mathbf{x}^\ast i\hbar I\mathbf{x}\\  &=i\hbar\Vert\mathbf{x}\Vert^2=i\hbar,  \end{aligned}

其中最後一個等式係因量子態滿足歸一性 \Vert\mathbf{x}\Vert^2=1。根據內積性質 (P\mathbf{x})^\ast(Q\mathbf{x})=\overline{(Q\mathbf{x})^\ast(P\mathbf{x})} (見“內積的定義”),我們可以得到另一個表達式:

(Q\mathbf{x})^\ast(P\mathbf{x})-(P\mathbf{x})^\ast (Q\mathbf{x})=2i\mathrm{Im}\{(Q\mathbf{x})^\ast (P\mathbf{x})\}

其中 \mathrm{Im}\{z\} 代表複數 z 的虛部。比較上面兩式,即有

\displaystyle  \mathrm{Im}\{(Q\mathbf{x})^{\ast}(P\mathbf{x})\}=\frac{\hbar}{2}

為了產生不確定性關係,下一個步驟必須引進不等式。複數的絕對值大於或等於它的虛部,即 \vert z\vert\ge \mathrm{Im}\{z\},因此

\displaystyle  \left|(Q\mathbf{x})^{\ast}(P\mathbf{x})\right|\ge\frac{\hbar}{2}

接著分離不等式裡面的 QP。使用 Schwarz 不等式 (見“Schwarz 不等式”)

\Vert Q\mathbf{x}\Vert\cdot\Vert P\mathbf{x}\Vert\ge\left|(Q\mathbf{x})^{\ast}(P\mathbf{x})\right|

可得

\displaystyle  \Vert Q\mathbf{x}\Vert\cdot\Vert P\mathbf{x}\Vert\ge\frac{\hbar}{2}

現在我們已經抵達整個推導過程的中途休息站,眼前的不等式是對易關係 [Q,I]=i\hbar I 的必然結果。海森堡不確定關係不等式與這個不等式有完全相同的形式,暗示我們剩下的工作不過就是將不確定性套入其中。

 
定義一組新的位置矩陣和動量矩陣:

Q'=Q-\left\langle Q\right\rangle I,~~~P'=P-\left\langle P\right\rangle I

其中 \left\langle Q\right\rangle\left\langle P\right\rangle 分別代表在量子態 \mathbf{x},位置 Q 和動量 P 的期望值。明顯地,Q'P' 也是 Hermitian 矩陣。利用交換子運算法則 (見“交換子與可交換矩陣”):

  1. [A,I]=[I,A]=0
  2. \left[A+B,C+D\right]=[A,C]+[B,C]+[A,D]+[B,D]
  3. [kA,B]=[A,kB]=k[A,B]k 是一個純量,

可導出

\begin{aligned}  \left[Q',P'\right]&=[Q-\left\langle Q\right\rangle I,P-\left\langle P\right\rangle I]\\  &=[Q,P]-\left\langle Q\right\rangle[I,P]-\left\langle P\right\rangle[Q,I]+\left\langle Q\right\rangle\left\langle P\right\rangle[I,I]\\  &=[Q,P]=i\hbar I.\end{aligned}

我們發現 Q'P' 也遵守對易關係,以 Q' 取代 QP' 取代 P,即得

\displaystyle  \Vert Q'\mathbf{x}\Vert\cdot\Vert P'\mathbf{x}\Vert\ge\frac{\hbar}{2}

這個不等式其實就是不確定性原理。何以如此?代入 Q'\left\langle Q\right\rangle\Delta Q 的定義,

\begin{aligned}  \Vert Q'\mathbf{x}\Vert^2&=(Q'\mathbf{x})^\ast(Q'\mathbf{x})=\mathbf{x}^\ast (Q')^\ast Q'\mathbf{x}=\mathbf{x}^\ast (Q')^2\mathbf{x}\\  &=\mathbf{x}^\ast(Q-\left\langle Q\right\rangle I)^2\mathbf{x}=\mathbf{x}^\ast(Q^2-2\left\langle Q\right\rangle Q+\left\langle Q\right\rangle^2 I)\mathbf{x}\\  &=\mathbf{x}^\ast(Q^2-\left\langle Q\right\rangle^2 I)\mathbf{x}=(\Delta Q)^2.\end{aligned}

同樣地,\Vert P'\mathbf{x}\Vert^2=(\Delta P)^2。所以,

\displaystyle  \Delta Q\cdot\Delta P\ge\frac{\hbar}{2}

 
從以上推導我們知道不確定性原理並非源自實驗儀器的測量誤差,而是粒子內稟的量子性質,即位置與動量不互相對易關係。最後我引用維基百科關於不確定性原理「名稱」的一段論述當作本文的結語[1]

有很久一段時間,不確定性原理被稱為「測不準原理」,但事實上,不確定性原理是類波系統內秉的性質,與測量準確不準確並沒有關係 (請查閱本條目稍後觀察者效應一節),因此,該譯名並未正確表達出這原理的內涵。另外,英語稱此原理為「Uncertainty Principle」,直譯為「不確定性原理」,並沒有「測不準原理」這種說法,其他語言與英語的情況類似,除中文外,並無「測不準原理」一詞。現今,在中國大陸的教科書中,該原理的正式譯名也已改為「不确定性原理」。

 
註解
[1] 維基百科:不確定性原理,見「名稱」一節。
[2] 普朗克常數 h 是量子力學的註冊商標,出現在普朗克關係式 E=h\nu,其中 E 是粒子的能量,\nu 是電磁波的頻率。普朗克常數與光速 c 和萬有引力常數 G 並稱為大自然的三個基本常數。詳見維基百科:普朗克常數
[3] 關於海森堡 (Werner Heisenberg) 的生平介紹請見維基百科:維爾納‧海森堡
[4] 維基百科:不確定性原理,見「歷史」一節。
[5] 費曼 (Richard P. Feynman) 著 Essentials of Physics Explained by Its Most Brilliant Teacher,中譯本《費曼的六堂Easy物理課》,師明睿譯,天下文化出版,2001年,頁153-155。
[6] 愛因斯坦對海森堡說的英譯文是:“It is the theory which decides what can be observed.” 見談測不準原理的起始,原標題是 Remarks on the Origin of the Relations of Uncertainty。
[7] 矩陣力學 (matrix mechanics) 是量子力學的一種表述形式,由海森堡、玻恩 (Max Born) 和約當 (Pascual Jordan) 於1925年提出。矩陣力學假設 (1) 所有的可觀察物理量都可以用 Hermitian 矩陣表示,(2) 一個物理量的觀察值是該矩陣的特徵值,(3) 一個物理系統的位置矩陣 Q 與動量矩陣 P 滿足對易關係:QP-PQ=i\hbar I。對易關係無法從古典物理推導出來,它是一個全新的假定,只有實驗才能確認它的真實性。見維基百科:矩陣力學
[8] 量子態 (quantum state) 描述量子系統的狀態。在量子系統裏,量子態由所有可觀察量的機率分布所定義。見維基百科:量子態
[9] 機率幅 (probability amplitude) 是一個描述粒子的量子行為的複函數。當描述粒子的位置時,機率幅是一個波函數,表達為位置的函數。在量子力學中,機率幅常用 \Psi 表示,\vert \Psi\vert^2=\Psi^\ast\Psi 則代表機率幅的機率密度函數。見維基百科:機率幅
[10] 諾伊曼 (John von Neumann) 所著 Mathematical Foundations of Quantum Mechanics,1949年出版,頁233-235。

This entry was posted in 線性代數專欄, 應用之道 and tagged , , , , . Bookmark the permalink.

7 Responses to 海森堡不確定性原理的矩陣證明

  1. Watt Lin says:

    老師謙稱「對量子力學幾乎一無所知」,我所知更少,僅停留在高三物理課程的一點點淺薄概念。當年由課外讀物看到「矩陣力學」名稱,卻不知那是什麼,高中老師也難以講述給學生聽。
    看了老師的文章,幫助我建立基本知識。我自認為,第一次看,只有懂一些,沒關係。至少有些部分進入頭腦裡,將來隔些時日,再回來這個部落格閱讀同一篇文章,會有另一層次的收穫。
    今天看到這篇,其實已經有很大的收穫,感謝老師您的教學。

    • ccjou says:

      幾乎一無所知不是謙稱,為了弄清楚位置與動量的不可交換性,上個周末花了一整天閱讀文件,到現在仍不很明白,暑假有空時再去找些書來仔細研究。

      • Watt Lin says:

        老師您好認真!
        網友們有福氣,看到許多線代觀念的詳細闡述與應用。

  2. 張盛東 says:

    對老師關於simplex method的大作期待中。

    • ccjou says:

      哈哈,你聽過孔子學琴的故事嗎?下面的內容取自
      http://www.dfg.cn/big5/chtwh/srgs/53-kong.html

      孔子向師襄子學習彈琴,學習一首樂曲一段時間後,師襄子對孔子說:「我雖然是以擊磬做的樂官,但我還是擅長於彈琴。如今,你已學會了這首琴曲,可以進一步學點別的了。」孔子聽了,並不急於學其他,回答說:「我還沒有學到它彈奏的技巧啊。」

      孔子用心投入,練習一段時間後,很快學會了技巧。於是,師襄子便對孔子說:「你現在已經學會技巧了,那麼可以學點別的了。」孔子回答說:「可我還沒有瞭解曲子表達的意趣啊。」

      孔子繼續專心練習一段時間,瞭解了曲子的意趣。此時,師襄子又對孔子說:「你瞭解了它的意趣,現在可以進一步再學點別的了。」但孔子依然想繼續深入,回答說:「我還不曉得它是歌頌誰的啊。」

      於是,孔子專心一致,每天彈奏,用心領會曲中歌頌的人物。過了一段時間,有一天,孔子有所深思,高高地站在一個高處,向著遠方眺望說:「我已經知道它是歌頌誰的了,他長得有點黑,身材修長,有著廣闊的胸襟,長遠的目光,他眼光遼闊,囊括四方。若不是周文王,誰能如此啊!」

      如果拿「周老師學單形法」類比,目前我正處在「我還不曉得它是歌頌誰的啊」這個階段。

  3. 張盛東 says:

    老師,但是您依然比像我這些還處於練習"技巧"的學生高出一個境界啊。所以老師的文章對像我這樣的學生有醍醐灌頂之效。

  4. 張晏誠 says:

    老師可以去讀費曼物理學講義

    量子力學的第一本

    他有舉幾個例子說明這個原理的意義

    尤其是電子的狹縫干涉實驗

    英文版的連結

    http://www.feynmanlectures.caltech.edu/III_01.html#Ch1-S8

Leave a comment