為何要學習古典力學?聊聊古典力學與量子力學的神祕關係

網路上的物理社團常常會有年輕人問:「為何要學習古典力學?」。這裡所謂的古典力學 (Classical Mechanics),是指那些量子力學誕生前的力學,包括以下三種型式:牛頓力學 (Newtonian Mechanics)、拉格朗日力學 (Lagrangian Mechanics),以及哈密頓力學 (Hamiltonian Mechanics)。相對論性力學 (Relativistic Mechanics,符合相對論的力學) 也可以表達為以上三種型式,因此也歸類為古典力學。

關於這個問題,我認為它主要是來自學習者的以下兩大疑惑:

A. 如果以上三種形式的力學給出的結果都等價,為何不能只學習原來的牛頓力學就好?為何要大費周章將它表達為不同的形式?

B. 既然量子力學才是對自然正確的描述,為何不乾脆直接學習量子力學?學習古典力學是否是浪費時間?

對我而言,學古典力學是一件性價比 (CP 值) 蠻高的事。這方面的訓練在研究與教學上都給了我很多有用的啟發。身為一個畢業自物理系與物理所的研究者,我想在此分享我對古典力學的個人心得,然後試著回答前述問題。以下先簡介古典力學的主要概念,然後再探討這些問題的答案。

        理工科學生在高中階段接觸過基本的牛頓力學,知道牛頓三大運動定律,也知道它們可以應用在日常尺度的力學問題以及太陽系的星體運動問題上。大一普通物理裡所學到的力學也大致是相同的範圍,但使用了較多的微積分 (calculus),以及少量的微分方程式 (differential equation)。牛頓力學的核心概念是力$$\vec{F}$$、動量$$\vec{P}$$,以及加速度$$\vec{a}$$。對於受已知的作用力$$\vec{F}$$而運動的物體,可根據牛頓第二定律$$\vec{F}$$=m$$\vec{a}$$(質量不變的物體)或$$\vec{F}=\textit{d}\vec{p}/\textit{d}\textit{t}$$(質量變或不變皆可)寫下運動方程式 (equations of motion),然後利用微積分或是微分方程式的技術,根據給定的初始位置 (initial position) 與初始速度 (initial velocity) 將運動軌跡解出。如果作用力不是任意給定,而是來自於萬有引力、靜電力、磁力、彈簧形變的回復力…等等,就會有$$\vec{F}$$與粒子間距、質量、電荷、磁場、速度、彈簧形變量…的函數關係。在大學階段的牛頓力學問題中,可能會比高中的處理方式更強調力與動量是向量 (vectors) 而不是純量。

        在作用力皆為保守力 (conservative force) 的情況下,力學系統可以定義位能 (potential energy)。在這樣的系統裡,可以根據牛頓第二定律推論出力學能(mechanical energy) 守恆。在作用力都是連心力 (central force) 的多粒子系統,可以根據第二定律推論出系統的角動量 (angular momentum) 守恆,也可以根據第三定律推論出系統的動量守恆。這些守恆律 (conservation laws) 在很多情況下可以大大簡化對問題的處理,但由於力、動量,與角動量都是向量,處理起來比較複雜,尤其是在粒子的運動有約束 (constraints,例如擺長固定的單擺) 的情況下。很容易看出,牛頓力學的世界觀是符合因果律 (causality) 的世界觀:給定初始條件 (initial conditions),就可以根據演化方程式 (equation of evolution,即運動方程式) 推論出系統的所有未來狀態。

     一個已經很習慣上述世界觀的年輕人,當他/她第一次聽說牛頓力學定律可以被一個看似目的論 (teleology) 的最小作用量原理 (least action principle) 或哈密頓原理 (Hamilton’s principle) 取代時,可能會很困惑。根據這個原理,當一個粒子受到保守力與約束力 (constraint force) 作用,但沒有阻尼力 (damping force) 牽涉其中時,假如給定出發位置與出發時間$$(\textit{q1,t1})$$,以及要求的到達位置與到達時間$$(\textit{q2,t2})$$,它會在連接此兩時空點的所有可能時空路徑中選擇走那條作用量 (action)$$\textit{S}(path)=\int_{\textit{q1,t1}}^{q2,t2}$$ $$\textit{L}[\textit{q}\left ( t \right ),\dot{q}\left ( t \right )]$$ $$\textit{d}\textit{t}$$的累積量為極小值 (minimum) 的路徑。此處$$\textit{S}\left ( path \right )$$就是對應於選擇的路徑的作用量,而$$\textit{L}[\textit{q}\left ( t \right ),\dot{q}\left ( t \right )]$$是拉格朗日函數 (Lagrangian),在沒有非保守力參與時就是動能$$\textit{T}$$減去位能$$\textit{U}$$,即$$\textit{L}=\textit{T}-\textit{U}$$。此外,$$\textit{q}\left ( t \right )$$與$$\dot{q}\left ( t \right )$$分別是粒子沿該路徑運動時用來表示粒子位置的廣義座標 (generalized coordinate) 與表示粒子速度的廣義速度 (generalized velocity)。若粒子數或空間維度大於 1,就會有一系列的廣義座標與廣義速度,記為$$\textit{q}j\left ( t \right )$$與$$\dot{q}j\left ( t \right )$$,而$$\textit{j}=1,2,...,\textit{s}$$.此處“廣義”一詞意味著以此方法處理力學問題時,可以不必受限於使用具有長度與距離的直接意義的笛卡爾座標 (Cartesian coordinates),而可以使用最方便處理問題的座標,例如極角 (polar angle) 與方位角 (azimuth angle)。廣義座標的總個數$$\textit{s}$$被稱為自由度 (degrees of freedom)。利用所謂變分 (calculus of variation) 運算,就可以從這個極值原理推導出歐勒-拉格朗日方程式 (Euler-Lagrange equation)

$$\frac{\textit{d}}{\textit{dt}}$$ $$\left ( \frac{\partial \textit{L}}{\partial \dot{q}j} \right )-\frac{\partial \textit{L}}{\partial \textit{q}j}=0$$ , $$\textit{j}=1,2,...,\textit{s}$$.         (1)

而這個方程組,在描述力學現象時,跟牛頓定律是等價的。

       當我第一次學到如何從哈密頓原理導出拉格朗日方程式時,雖然我可以接受書上所說的,此種 “能量法” 在許多情況下較牛頓力學的 “向量法” 方便,能夠避免繁瑣的投影等程序,且正常操作公式的運算而不犯錯也並不困難,但至少有兩個 “心理障礙” 讓我很難將這套工具心服口服地完全 “吞下”:

1.   給定路徑的廣義座標$$\textit{q}j\left ( t \right )$$,廣義速度$$\dot{q}j\left ( t \right )$$就被決定了,它怎麼可能被當成是獨立於$$\textit{q}\left ( t \right )$$的變數,被用在拉氏函數$$\textit{L}[\textit{q}\left ( t \right ),\dot{q}\left ( t \right )]$$中呢?

2.   我怎麼會事先知道拉氏函數是$$\mathit{L}=\mathit{T}-\mathit{U}$$,而拉格朗日方程式給出的結果一定符合牛頓定律?

       對於第一個問題,我是經過了很長時間的思考 (應該超過兩個月) 與讀了幾本課本以外的其它相關書籍,才弄清楚我有一些概念上的混淆。事實上,在做變分運算時,在$$\textit{L}\left [  q\left ( t \right ),\dot{q}\left ( t \right )\right ]$$中的 $$\textit{q}\left ( t \right )$$描述的是一個任意的試驗路徑 (尚未被決定的路徑),而不是最後根據拉格朗日方程式解出的那個唯一的路徑。此外,$$\dot{q}\left ( t \right )$$是在$$\textit{t}$$時刻的一個任意速度,並不受$$\textit{q}\left ( t \right )$$或更早時間的位置影響,因此是獨立於$$\textit{q}\left ( t \right )$$的變數。變分運算的目的,就是要找出那個可決定唯一路徑$$q_{c}\left ( t \right )$$(下標 c 表示 “古典”) 的方程式,而那個方程式就是拉格朗日方程式。經由這個方程式,搭配給定的初始位置與初始速度,$$\dot{q}_{c}\left ( t \right )$$才會被$$q_{c}\left ( t \right )$$決定。

       解決第二個問題最直接的方法是從牛頓力學給出的運動方程式倒推拉格朗日方程式。根據達朗貝爾原理 (D’alembert’s principle),可以將牛頓第二定律給出的運動方程式$$\vec{F}=\textit{d}\vec{p}/\textit{d}$$改寫成$$\delta \textit{W}=\left ( \vec{F}-\textit{d}\vec{p}/\textit{d}\textit{t} \right ).\delta \vec{r}=0$$,然後經過變數變換以及將保守力表示為位能的負梯度,就可以導出拉格朗日方程,而其中出現的拉氏函數$$\textit{L}$$就是$$\textit{T}-\textit{U}$$,如此就確定了在保守力的系統中,$$\textit{L}$$=$$\textit{T}-\textit{U}$$一定成立。上式中的$$\delta \vec{r}$$是符合約束條件的無窮小虛位移 (virtual displacement),而$$\delta \textit{W}$$是對應的無窮小虛功 (virtual work),因此達朗貝爾原理也稱虛功原理 (the principle of virtual work)。被磁力與保守力一起作用的具有電荷的粒子運動也可以用拉格朗日方程式描述,但拉氏函數$$\textit{L}$$要改寫為$$\textit{L}$$=$$\textit{T}-\textit{U}$$ + $$\textit{Q}\vec{A}.\vec{v}$$,其中$$\textit{Q}$$是粒子電荷,$$\textit{Q}$$是磁場的向量勢 (vector potential),而$$\textit{Q}$$是粒子速度 (以上內容可參考力學教科書,例如 Herbert Goldstein 的Classical Mechanics)。由此可知拉氏函數$$\textit{L}$$並不一定是$$\textit{T}-\textit{U}$$,而是要根據正確的運動方程式去找出對應的正確拉氏函數$$\textit{L}$$不過,這就產生了一個新問題:如果要根據正確運動方程才能找出正確的$$\textit{L}$$,那麼又為何要使用這套表達方式呢?

       在拉格朗日力學裡,可以定義廣義動量 (generalized momentum) 或正則動量 (canonical momentum) 為

$$\textit{p}j=\frac{\partial \textit{L}}{\partial \dot{q}j},$$ $$\textit{j}=1,2,...,\textit{s}$$.          (2)

當$$\textit{q}j=\textit{x}j$$就是笛卡爾座標時,廣義動量就是一般的動量。如果$$\textit{q}j$$是角度參數,$$\textit{p}j$$就會是對應那種角度變化之旋轉的角動量。拉格朗日方程式其實可寫成$$\frac{dp_{j}}{dt}$$ = $$\frac{\partial L}{\partial q_{j}}$$,因此,若$$\textit{L}$$中不含某個$$\textit{q}\textit{j}$$,就會得到對應的$$\textit{p}\textit{j}$$為一個守恆量(conserved quantity)。根據這個結論,可知若力學系統沿某座標$$\textit{x}\textit{j}$$移動不改變$$\textit{L}$$(系統具有平移對稱性),就會有 (那個平移方向的) 動量守恆。類似地,若系統有旋轉對稱,就會有對應的角動量守恆。由此不難看出,當探討守恆律 (conservation laws) 時,拉格朗日力學會比牛頓力學更清楚而直接。

       哈密頓力學比拉格朗日力學更深奧,通常是數學專業的研究者才有辦法進行深入的研究。此處只整理最基本的知識,供後續討論使用。首先,根據以下的勒壤得轉換 (Legendre transformation) 公式可以定義哈密頓函數 (Hamiltonian) H:

$$\textit{H}=\Sigma _{j}p_{j}\dot{q}_{j}-\textit{L}.$$ $$\textit{j}=1,2,...,\textit{s}$$.          (3)

數學上很容易證明,這個新函數不再是$$\textit{q}_{j}$$與$$\dot{q}_{j}$$的函數,而是$$\textit{q}_{j}$$與$$p_{j}$$的函數,即$$\textit{H}=\textit{H}\left ( q,p \right )$$。此外,$$\textit{H}$$通常就是系統的能量\textit{E}。在這個轉換之下,$$\textit{s}$$個 (二階 second order) 拉格朗日方程式被轉換為2$$\textit{s}$$個哈密頓方程式 (Hamilton’s equations):

$$\dot{q}_{j}=\frac{\partial \textit{H}}{\partial pj}$$ ,  $$\dot{p}_{j}= -\frac{\partial \textit{H}}{\partial qj}$$,  $$\textit{j}=1,2,...,\textit{s}$$.         (4)  

根據給定的初始位置$$q_{j}\left ( 0 \right )$$與初始動量$$p_{j}\left ( 0 \right )$$,就可以用這2$$\textit{s}$$個方程式解出系統在任意時間的運動狀態$$q_{j}\left (t \right )$$$$p_{j}\left ( t \right )$$。從這組方程式也可以看出,若$$\textit{H}$$不含$$q_{j}$$,對應的$$p_{i}$$就會守恆。由$$q_{j}$$與$$p_{j}$$所構成的2$$\textit{s}$$維空間被稱作相空間 (phase space)。在歐幾里得空間裡一個多粒子系統的動力學演化,對應於這個高維相空間裡一個代表點的軌跡。這在古典統計力學 (classical statistical mechanics) 中是很有用的概念。

       對於定義在相空間裡的任意一對力學量$$A\left ( q,p \right )$$與$$B\left ( q,p \right )$$,可以定義一個它們之間的帕松括號 (Poisson Bracket):

$$\left\{ A,B\right\}=\Sigma _{k}$$ $$(\frac{\partial A}{\partial qk} \frac{\partial B}{\partial pk} - \frac{\partial B}{\partial qk} \frac{\partial A}{\partial pk})$$ ,  $$\textit{k}=1,2,...,\textit{s}.$$        (5)

顯然,在座標與動量間有最基本的帕松括號:

$$\left\{ qj,pk\right\} = \delta _{jk}$$,   $$\textit{j,k}=1,2,...,\textit{s}.$$        (6)

它們在指標$$j=k$$時為 1,  $$j\neq k$$時為 0。使用怕松括號,就可以將2$$\textit{s}$$個哈密頓方程式寫成以下形式:

$$\dot{q}_{j} = \left\{ qj,H\right\}, \dot{p}_{j}=\left\{ pj,H\right\}$$  ,  $$\textit{j}=1,2,...,\textit{s}.$$         (7)

現在我們針對$$\textit{H}$$不顯含時間$$\textit{t}$$的情況,將$$H\left ( q,p \right )=E$$代入 (3),並將作用量$$\textit{S}$$視為$$\textit{L}$$對時間的積分,就會得到

$$dS=Ldt=\Sigma _{k}p_{k}dq_{k}-Edt.$$         (8)

上式暗示作用量是$$q$$$$t$$的函數,即$$\textit{S}=\textit{S}\left ( q,t \right )$$,且以下關係式成立:

$$p_{j}=\frac{\partial S\left ( q,t \right )}{\partial q_{j}}$$ ,  $$H=\left ( q,\frac{\partial s}{\partial q} \right )= -\frac{\partial S\left ( q,t \right )}{\partial t}.$$         (9)

上式的第二式被稱作哈密頓—杰可比方程式 (Hamiltonian-Jacobi equation)。

       現在可以回答文章最初的兩個問題了。我給出的答案是:古典力學知識是建立及理解正確量子力學理論的基礎。根據德布羅伊 (Louis Victor de Broglie) 的物質波假說,自由粒子的能量$$E=\not hw$$,動量$$\vec{p}=\not h\vec{k}$$, 其中w與$$\vec{k}$$是角頻率與波向量。將它們代入 (8),就可以看出$$S/\not h$$就是物質波的相位 (phase)。由於巨觀物體的物質波波長非常短,所以在波長尺度內,位能的空間變化很緩慢,這就使得物質波的振幅隨位置的變化非常緩慢,其效應沒有在古典力學方程式中顯現出來。薛丁格 (Erwin Schrödinger) 所做的,就是在知道物質波相位變化規律近似於哈密頓—杰可比方程式的情況下,設法猜出波函數 (wave function,同時含振幅與相位) 所滿足的波方程式,而這就是我們現在所知的薛丁格方程式。狄拉克 (P. A. M. Dirac) 仔細省視海森堡 (Werner Heisenberg) 所發現的量子對易關係 (quantum commutation relations)$$\left [ \hat{q_{j},\hat{p_{k}}} \right ]=i\not h\delta _{jk}$$後,發現它們可以直接對應古典力學中帕松括號 (方程式 (6)),只是數值上要乘以$$i\not h\$$。這就使得古典力學系統的量子化 (quantization) 成為一個很簡單的數學遊戲:只要把古典物理系統中的物理量改寫為量子算符 (quantum operators),並把帕松括號改為對應的量子對易關係,就成為一個正確的量子理論。這就是正則量子化 (canonical quantization) 的基本程序。費曼 (R. P. Feynman) 在研究生時期,因為研究上的需要,探尋不使用哈密頓量與量子算符而使用拉氏函數與作用量的量子化方法。他從狄拉克的一篇論文中獲得啟發,最終成功發展出了路徑積分量子化 (path integral quantization)。

根據以上的事實可知:如果不知道正確的拉氏函數或哈密頓量,就無法以標準的量子化程序 (正則量子化或路徑積分量子化) 進行量子化。在可選擇的標準量子化程序中,並沒有將牛頓力學系統直接量子化的具體方法。因此,至少就更好的理解古典物理系統如何被量子化而言,對拉氏函數與哈密頓量的基本認識都是很必要的。除了與量子化的神祕關係之外,有關古典力學還有許多的有趣的內容,留待將來再與讀者們分享。