物理如何使用數學?漫談物理與數學的關係(I)

從中學時期開始,相信許多人都會有類似的體驗:物理是數學以外使用數學最多的科目。翻開任何一本物理教科書,很難看到連續兩頁都沒有出現數學公式的情況。大學裡,理工科系的必修科目中,通常都有一定數量的高等數學課程;它們的名字或許叫應用數學、工程數學、物理數學、高等微積分,或是數學分析等等。各系也可能將上述課程各部分內容分別獨立出來,開出像是線性代數、向量分析、複變函數、偏微分方程、群論、微分幾何等課程。理想上,這些數學課程存在的目的是為了幫助學生們在學習物理相關課程前打好必要的數學基礎。不過,經常發生的狀況是:學生們在毫無心理準備的情況下先在物理課裡遭遇到這些令他們有些困惑或害怕的數學,然後才在數學課裡再度學習到它們;許多人因此而有適應不良的痛苦經驗。

還有一些時候,物理中遇到的數學是這些數學課裡沒有提到過的,例如變分法(variational calculus)、張量分析(tensor analysis)、黎曼幾何(Riemannian Geometry)、費曼圖(Feynman diagrams)、量子算符(quantum operators)等等;此時學習者就必須現學現用。所有前面提到的事實,都顯示物理基本上是離不開數學的。然而物理為什麼這麼需要數學呢?物理與數學的關係究竟是什麼?其實許多大物理學家都曾表達過他們對這類問題的看法。這些意見很有參考價值,但是大師們的立足點比較高,他們的視角或許跟一般的物理研究者是不一樣的。身為一個長期從事物理研究與教學的平凡人,我將根據自己的經驗,跟讀者們分享我這個平凡人對於這些問題的看法。

數學在物理裡的最初步應用是將可量測的物理量數量化。例如:質量是幾公斤?電荷是幾庫倫?波長是幾奈米?風速是每秒幾公尺?密度是每立方公分幾克?能量是幾焦耳?這些數量表達以及它們的四則運算或許還稱不上使用數學,但這可能是一般人最容易理解的層次,畢竟它們跟日常生活中上市場買東西所用到的數學工具是一樣的。

在這個最初級的應用之後,我們就會遇到「用數學表達物理量之間的關係」這個層次。牛頓第二運動定律 \(F = ma\)、牛頓萬有引力定律 \(F = - \frac{G m_1 m_2}{r^2}\)、虎克彈性定律 \(F = −kx\)、歐姆定律 \(V = IR\)、理想氣體定律 \(PV = nRT\)、愛因斯坦質能公式 \(E = mc^2\) 都是這個層次的例子。這些公式中的物理量都可以直接或間接量測或定義,而它們所描述的對象雖然跟日常生活經驗中常遇到的事物已經有一點不同,但這些用乘除法、平方,與正負號表達的關係都還在一般人比較容易掌握的範疇。在這裡面可以看到:數學描述提供了比一般語言描述更精確的圖像。例如 \(F = − \frac{G m_1 m_2}{r^2} \) 不但告訴我們兩塊質量相互吸引(看負號),還告訴我們當它們的距離變成 \(2\) 倍時,吸引力就降至 \(\frac{1}{4}\)(看分母)。在這個層次,讀者應該已經可以感覺到一般日常語言與不使用數學的邏輯推理「不太夠用」了。


在上述兩種與表達有關的初步應用之後,下一個問題是:如何使用物理定律解決物理問題?一個初級的例子是諧振子(Harmonic oscillator)問題:一顆放在光滑的桌面上,連著彈簧的球(彈簧另一端固定在牆上)在彈力作用下會如何運動?將前述牛頓第二定律與虎克定律相結合,我們就得到了這個問題的數學描述,它是一個微分方程式:$$ m \frac{d^2 x}{dt^2}=-kx \hspace{1cm} (1)$$

此處用到了加速度 \( a = \frac{dv}{dt} = \frac{d^2 x}{dt^2}\)(位移的二階時間導數)這個基本關係式。如果會解二階常微分方程式(second order ordinary differential equation),就可以根據球的初始位置與初始速度,算出球在任何時刻的位置與速度。比這個問題複雜一點的是行星繞日運動的問題,此時需要注意作用力的向量本質,而將運動方程式寫成了以下的向量形式:$$ m \frac{d^2 \vec{r}}{dt^2}= -G \frac{Mm}{r^2} \hat{r} \hspace{1cm} (2)$$

此處 \(M\) 與 \(m\) 分別為太陽與行星的質量,\(r\) 是從太陽指向行星的位置向量,\(r\) 是太陽與行星的距離,而 \( \hat{r}= \vec{r}/r\) 是 \(\vec{r}\) 方向的單位向量。由於維度增加了一維,所以解這個微分方程組問題要比解一維諧振子的運動問題困難。在以前的專欄文《萬有引力的平方反比形式與克卜勒行星運動三大定律》裡,我們是先從方程式(2)推導出這個系統具有守恆的力學能量與角動量,再藉著一些變數代換將運動方程式轉換為一個 \(u = r^{−1} \)對角度 \( \theta\) 的一階微分方程式,從而解出行星的繞日軌跡的。如果不知道這些轉換與守恆量,通常就得借助於數值計算方法去求解這個運動問題了。


從上述兩個例子可知,雖然像(1)與(2)這樣的運動方程式已經包含了那些物理系統所有的資訊,但要更順利地讀出這些資訊,往往需要借助於更有效的數學表達式。以陀螺的運動為例,一個高速自轉的陀螺不會像沒有自轉的陀螺立刻倒下,而是會繞著支點做緩慢的進動(precession)。這個結論雖然已隱藏在根據牛頓定律而寫出的剛體(rigid body)運動方程式裡,但是很難直接從「力等於動量變化率」或 \( \vec{F} = d \vec{p} /dt\) 這個公式去理解陀螺的這種奇怪行為。不過,換成由牛頓定律推出的「力矩等於角動量變化率」公式 \( \vec{N} = d \vec{L} /dt\) 就會很清楚明白。不過,雖然在這個問題裡我們更換了描述物理系統的數學公式,但解決這個問題的數學工具本質上還是一樣的。

在靜電學裡,如果已知電荷在空間上的分布,那麼只要做積分將每一處電荷對總電場或總電位的貢獻加起來,就可以得到總電場或總電位。如果不清楚電荷分布,但很容易控制某個封閉區域四周的邊界電位,那麼就比較適合在給定邊界條件(boundary conditions)的情況下,藉著解拉普拉斯方程式(Laplace equation) \( \nabla^2 V = 0\) 得到那個封閉區域內的電位。跟前面陀螺的例子不同,這裡不但數學表達式不同,所需要的數學工具也不一樣。已知電荷分布時,只需要知道怎麼積分就可以解決問題,但在後一種情況中卻要會解偏微分方程式(partial differential equation,簡稱PDE)。事實上,大部分基本的物理定律都是以偏微分方程式或偏微分方程組寫成的。統御電磁現象的Maxwell 方程組是PDEs,描述量子現象的薛丁格方程式也是PDE。流體力學、熱力學、彈性力學,甚至光學,都離不開偏微分方程。PDE 簡直無處不在。


前面提到即使是數學上等價的不同表達方式,物理上也可能有不同效果。某些表達方式會比其它的表達方式更能有效揭露出物理系統的本質。例如在古典力學裡,雖然牛頓力學、拉格朗日力學(Lagrangian mechanics),與哈密頓力學(Hamiltonian mechanics)在很大範圍內是等價的,但當我們要對一個力學系統量子化(quantize)以得到對應的量子系統時,根據拉格朗日表述可以進行路徑積分量子化(path integral quantization), 根據哈密頓表述則可以進行正則量子化(canonical quantization),但原來的牛頓力學表述就無能為力。此外,在判斷系統有哪些守恆量時,後兩者的表述都較牛頓力學的推導更方便也更系統化。大家耳熟能詳的「當系統具有連續旋轉對稱性,則角動量守恆」就是在後兩種表述之下的直接結果。若採用牛頓力學表述,就必須利用力矩的定義 \( \vec{N} = \vec{r} \times \vec{F}\) 與作用力為連心力(central force)作用力平行於 \( \vec{r}\) )的事實,結合力矩與角動量的關係式 \( \vec{N} = d \vec{L}/dt\) 才能得到這個結論。

物理定律的不同數學表達方式也可能導致意料之外的預測。前面曾提到過Maxwell 方程組統御一切電磁現象。事實上,這些方程組有兩套表達方式:積分形式與微分形式。例如其中的法拉第電磁感應定律(Faraday’s induction law)的積分形式寫成:$$ \oint_C \vec{E} \cdot d \vec{l}= - \frac{d}{dt} \int_S \vec{B} \cdot d \vec{a} \hspace{1cm}(3) $$

它描述繞線圈 \(C\) 的感應電動勢(electromotive force)與通過線圈包圍的面積 \(S\) 的磁通量(magnetic flux)變化率之間的關係。若相信對於空間中一個任意的封閉曲線—無論該曲線是虛構的或是由真實物質構成,(3)式都成立的話,就可以將它改寫成微分形式 \( \nabla \times \vec{E} = - \frac{\partial \vec{B}}{\partial t}\)。磁場的曲線積分也有一個對應的公式,被稱作修正的安培定律(modified Ampere’s Law),寫成$$ \oint_C \vec{B} \cdot d \vec{l} = \epsilon_0 \mu_0 \frac{d}{d t} \int_S \vec{E} \cdot d \vec{a}+ \mu_0 I \hspace{1cm}(4)$$
此處 \(C\) 是一個封閉曲線,\(I\) 是穿過曲線包圍的面積 \(S\) 的電流,\( \frac{d}{dt} \int_S \vec{E}\cdot d \vec{a}\) 是通過 \(S\) 的電通量變化率,而(真空中的)電容率(permittivity)\(\epsilon\) 與磁導率(permeability)\( \mu_0\) 分別是與靜電及靜磁現象直接相關的常數。根據(4)可推出其微分形式 \( \nabla \times \vec{B}= \epsilon_0 \mu_0 \frac{\partial \vec{E}}{\partial t}+ \mu_0 \vec{J}\)。有趣的是,當我們把這兩個微分形式的公式相結合時,它們不但預測了電磁波的存在,還能得到波速 \(c\) 等於 \(\frac{1}{\sqrt{\epsilon_0 \mu_0}}\)。
以上這些例子都說明數學是物理必不可少的工具。不過,物理學家在使用這些數學工具時,關注的是如何解決物理問題,而不是數學本身的嚴密性或優美性。某些數學方法或許比其它的方法在邏輯上更自洽或更優美,但物理學家在發展物理的過程中通常不會等到數學工具發展完備了才解決問題,而是有什麼就用什麼,實在沒有就自己創造一個暫時堪用的工具。愛因斯坦在發展廣義相對論的過程中,發現黎曼幾何(Riemannian geometry)是適當的工具。不過,他使用的其實是偽黎曼幾何(pseudo-Riemannian geometry),具有非正定度規(indefinite metric),並不完全等同於原版的黎曼幾何。海森堡在不懂矩陣的情況下,發現了矩陣力學的基本公式,創造了量子力學的第一個版本。狄拉克(P. A. M. Dirac)想要像計算連續函數一樣計算離散分布,因而發明了Delta 函數,但那並不是一般意義下的函數。量子電動力學(quantum electrodynamics,QED)裡的重整化(renormalization)操作,在數學上看來也是不合理的,但物理學家在物理直覺的引導下合理使用這套工具,給出與實驗結果驚人符合的理論結果。狄拉克思考磁單極(magnetic monopole)的量子效應,以及楊振寧與米爾斯探討非阿貝爾規範(non-Abelian gauge field)的問題時,也都不是等到學會了微分幾何的纖維叢(fiber bundle)概念才進行的。

以上提過這些的例子已能初步說明數學對於物理的工具性價值,但這些討論還遠遠不足以解釋清楚物理與數學究竟是什麼關係。簡單來說,物理與數學有不同的價值觀與目標。物理問題的解法中雖然有數學的應用,但它並不是應用數學。有關這個話題的進一步討論牽涉很多細節,實在無法僅憑三言兩語就講清楚,所以我們以後再繼續聊吧!