理論物理學的硏究方法

  • 科學家隨筆
  • 撰文者:作者:保羅‧埃德里安‧莫里斯‧狄拉克 (P. A. M. Dirac) 譯者:蔡俊謙 教授 (中原大學 物理系)
  • 發文日期:2017-11-25
  • 點閱次數:1212
我們可以回顧過去已經完成的工作,期望能從當中得到一些對處理當前問題有用的提示或教訓;那些我們過去需要處理的難題和現今的難題,基本上有著許多共通之處,檢視過去奏效的方法或許可成為我們今天的助益。
我們可以辨別出理論物理學家的兩類主要工作方法,一類工作方法是以實驗結果為其入手點:他必須與實驗學家保持密切的合作關係,時常閲讀他們所獲得的實驗結果,並試圖將之置於一個完善和令人滿意的架構之下。另一類工作方法是以數學為其入手點:他時常檢驗並審視現存的理論,試圖找出其中的缺失並將之排除。其困難在於排除缺失的同時不得損及原有理論諸多既有的成功。

以上是這兩類一般的工作方法,當然他們的分界卻非壁壘分明的。在這兩個極端工作方法之間充斥著各種以不同程度將它們混合運用的方式,而要採取那一種工作方法主要根據研究的課題。對於一個所知極有限的開拓性研究課題,人們幾乎不得不以實驗所得為其出發點;因此,在一個全新研究課題的草創階段,人們僅能收集實驗證據並將之分類。

讓我們回溯上世紀原子週期系統的建立為例。剛開始時人們只是收集實驗的事實並編排它們;當系統逐漸建立起來後,人們對它的信心也逐漸增長;在系統近乎完備時,人們已具有充足的信心來預測。在週期表的空缺處, 一個新的原子必將被發現來填補該空缺,而這些預測都在後來的研究中實現了。

近來高能物理中有關新粒子的研究與上面陳述十分雷同。這些被發現的新粒子契合於人們深具信心的系統,若該系統出現空缺,人們就能預測必將會發現新粒子來填補它。

對於任何所知極其有限的物理領域,我們必須堅守在實驗的基礎上,以免耽溺於天馬行空且十之八九錯誤的猜測中。我不想一味地去苛責猜測,就算它最終是錯的,它仍可以是有趣的或具間接用處的。我們應該擁有開闊的心胸去容納新的想法,不應徹底地否定或猜測,然而應當注意不要身陷其中而無法自拔。

ab93a4f9c1c50a579ba0536f412f9424
宇宙論的猜測

宇宙論是具有過多猜測的研究領域之一。[1] 在只有極少數確切事實可用的情況下,理論工作者卻忙於使用那些基於他們想像的假設來建構各種宇宙模型。這些模型可能都是錯的。一般假設自然定律一直都與現今的定律相同;然而,這並非基於任何正當的理由。定律可能正在改變之中,特別是那些被視為自然常數的物理量在宇宙的時間尺度下或許是會改變的。這様的變動將全盤打亂那些宇宙模型建構者的盤算。

ab93a4f9c1c50a579ba0536f412f9424
數學的美感[2]

隨著一個硏究課題相關知識的增加,我們有較多的支撐點來著手進行研究,此時我們可以更傾向數學性的工作方法;其隱含的動機是追尋數學的美感 (mathematical beauty)。理論物理學家視數學的美感為一種需求,這純粹基於信念;它並非根據甚麼令人折服的理由,但經驗証明它是具非常豐厚報償的動機。舉例來説,相對論廣為接受的主要理由正是基於其數學美感。

在數學性的工作方法中人們依循兩種主要的作法:(i) 排除不一致性及 (ii) 統一數個原先各自為政、互不相干的理論

ab93a4f9c1c50a579ba0536f412f9424
憑藉方法取得的成功

使用作法 (i) 而獲得輝煌成功的例子不勝枚舉。馬克士威針對當時電磁學方程式中不一致性所作的探討導致了位移電流的引入,進而導向電磁波理論;普朗克針對黑體輻射理論的困難所作的硏究導致了量子的引入;愛因斯坦留意到在黑體輻射中處於熱平衡之原子理論的困難,而導致了受激發射概念的引入,進而導向現代雷射。然而那最叫人拍案叫絶的例子是愛因斯坦廣義相對論的發現,它乃是出於調和牛頓重力論與狹義相對論的需要。
螢幕快照 2017-11-25 下午12.04.04拷貝
在實際的執行上,作法 (ii) 並未獲得事實証明能有豐碩的成果。人們以為兩個物理上已知長距場的重力和電磁場應該是密切關聯的,但愛因斯坦花了多年的歲月嘗試要統一它們而徒勞無功。看來要直接統一各自為政、互不相干的理論,且其本身並無明確不一致之處可供著力,似乎是過於困難的,就算成功也將是透過間接、迂迴的途徑。

採取實驗傾向或數學傾向的工作方法主要是基於研究課題,但這並非是必然的,它也與研究者有關。這一點可從量子力學的發現來説明。

這就要説到以下這兩個人,海森堡及薛丁格。海森堡以實驗結果為其入手點,他運用了當時 (1925年) 已經累積了大量數據的光譜學結果。這些數據大部分是沒有用處的,但其中有一些如:多重態 (multiplet) 譜綫的相對強度卻極有用處。正是海森堡的天才睿智使他能從眾多的資訊中挑出重要的來,並將之編排在一個自然的架構下。海森堡因而被導向矩陣。

薛丁格的處理途徑相當不同,他以數學性考量為其入手點。他不像海森堡那様能對最新的光譜學結果如數家珍般熟悉,但在他的心中有一個想法,他認為光譜頻率應該由本徵值方程式 (eigenvalue equation) 決定,這個想法類似弦振動頻率的決定方式他有這個想法已經有一段很長的日子並最終能以間接的方式來找到正確的式子。

ab93a4f9c1c50a579ba0536f412f9424
相對論的衝擊

要了解當時理論物理學家工作的氛圍,我們必須體認到相對論的巨大衝擊。在一個漫長和艱難的戰爭末期,相對論帶著巨大的衝擊猛然現身科學界,所有的人都想逃離戰爭的壓力,紛紛迫不及待地投入這個新思考模式和新哲學,相對論的轟動和興奮在科學史上堪稱盛況空前。

在這樣的背景下,物理學家正嘗試著解開原子穏定性的奧秘。薛丁格就如同其他人也被上述的新想法抓住,所以他嘗試在相對論的架構下建立量子力學;所有的東西都必須以時空中的向量和張量來表示。不幸地,相對論性量子力學問世的時機尚未成熟,薛丁格的發現因此被拖延。

薛丁格從德布羅意運用相對論性方式來聯繋波和粒子的美妙想法出發。德布羅意的想法只適用於自由粒子,薛丁格嘗試將之推廣到束縛在原子裏的電子上,後來他終於在保持相對論性的架構下成功辦到了。但當薛丁格應用他的理論到氫原子時,卻發現它與實驗不符合,其差異源於他並沒有將電子的自旋考慮進去。電子自旋在當時是未知的。薛丁格隨後察覺到他的理論在非相對論性近似下才是正確的,然而他需要説服自己去發表一個降階版本的工作,在延宕了幾個月之後他才終於發表。

這個故事的教訓是不要想一次達成太多,不要想一步登天。我們應該儘可能把物理中的困難分開,分得越遠越好,然後各個擊破。

海森堡和薛丁格給了我們兩套量子力學,它們隨即被證明是等價的[3]。它們提供兩個可由某種數學轉換相聯繫的物理圖像。

我參與了量子力學的早期工作,依循著數學式的工作方法,使用了一種相當抽象的觀點。我採用海森堡矩陣所建議的非對易性代數作為新力學的主要特性,並查驗古典力學如何能被調整以納入其中。其他人則從各式的觀點來工作,而我們大約在相同的時間取得等價的結果。

ab93a4f9c1c50a579ba0536f412f9424
收穫豐碩的放鬆時刻

我想提一下,我發現最好的想法常常不是來自我們正積極使勁地想要獲取它們的時候,反而來自我們正處於一種比較放鬆的狀態。布洛赫 (Bloch) 教授已經告訴我們他如何在乘坐火車時獲得想法,且常在旅途結束之前就把它們做出來。我的情形並非如此,我常在星期日獨自長距離步行,其間我往往以比較悠閒的方式省思當下的狀況。事實證明這樣的時刻經常是收穫豐碩的,雖然(也許正因為)步行的最主要目的是放鬆而非研究。

就在這樣的時刻下,對易子 (commutators) 和帕松括號 (Poisson brackets) 相關聯的可能性在我心中靈光乍現我當時對帕松括號並不太熟悉,所以對該關聯性也沒什麼把握。回到家後發現我沒有任何一本有關帕松括號的書,所以只能心急如焚地等待第二天早上圖書館開放後去查驗我的想法。

隨著量子力學的發展理論物理有了新的處境;包括海森堡的運動方程、對易關係式和薛丁格方程式等主要的方程式,都在其物理詮釋未明之下被發現。動力學變數的非對易性使我們不可能直接套用古典力學中熟悉的詮釋,找尋這些新方程式的確切意義和其應用模式成了一個棘手的問題。

這一個問題並非以單刀直入及直接了當的方式被解決。人們先是研究了好些例子,如非相對論性的氫原子和康普吞散射,並發現一些可用於這些例子的特殊方法。我們逐漸將之推廣,在過了幾年之後,對這個理論完整了解才演進成今天的面貎,其中包含了海森堡的測不準原理和波函數的一般性統計詮釋。

量子力學在非對論性的架構下迅速發展,但可想而知人們對它並不特別滿意。一個單電子的相對論性方程式被建立了,也就是薛丁格原先的式子,它後來被克來恩 (Klein) 和戈登 (Gordon) 重新發現並以他們命名,然而其詮釋卻與量子力學的一般性統計詮釋不相符。

ab93a4f9c1c50a579ba0536f412f9424
從張量到旋量

當相對論被了解了以後,所有的相對論性理論都必須以張量的形式來表示;在這個基礎下我們不能做得比克來恩戈登理論更出色。大部分的物理學家都滿足於以克來恩戈登理論為最佳的電子量子理論,但我常因它與(量子力學)一般性原理不符而耿耿於懷,且持續為之感到憂心直到我找到解決之道。

在此張量是不能勝任的,我們應該擺脫它們,而引入具有兩個值的量,也就是現在稱為旋量 (spinor) 的東西。那些對張量太熟悉的人不太能擺脫它們而想得更廣泛一些,我之所以可以辦到,只因相較於張量我更歸附於量子力學的一般性原理。當愛丁頓 (Eddington) 看到竟然有跳脫張量的可能性時,他感到非常的驚訝。旋量的引入提供了一個與量子力學一般性原理相符合的相對論性理論[4],且它也為電子的自旋作出説明,雖然這並非該工作的初衷。這個理論在正能量和負能量之間具有對稱性,但只有正能量存在於自然界中;所以有一個新的問題浮現出來,就是負能量的問題!在研究中使用數學的工作方法時,常發生解決完一個難題後又引發出另一個難題的情況。各位可能以為這並沒有帶來任何真正的進展,然而事實並非如此,這是因為第二個難題比第一個更為遙遠。第二個難題其實一直都在那裏,但只有在第一個難題獲得排除後,它才顯露出來。 這正是負能量問題的情況。

所有相對論性的理論都具有正負能量的對稱性,但之前這個困難被遮蔽在較為粗糙的理論缺陷下在假設將真空中所有負能量的態都被填滿的狀態下,排除了這個困難[5]。人們被導向一個具正子和電子的理論;我們的知識因此向前邁進了一歩,但再一次地一個新的難題又來了,現在是關於電子與電磁場的交互作用。

當人們寫下方程式時,人們相信它們精準地描述交互作用,並嘗試求解它們,然而人們得到應該是收歛的但卻是發散的積分。同様地這個困難一直都在那裏,它潛伏在理論裏,直到現在才成為要角。


誤入歧途?

當我們以古典的方法來處理與電磁場作用的點電子時,我們發現一些與場的奇異性相關的困難。人們早從勞侖茲 (Lorentz) 時代以來就知道這些困難,勞侖茲是第一個得出單個電子運動方程式的人。在海森堡和薛丁格的量子力學初期,人們以為這些困難將被這個新力學所掃除。現在我們很清楚這個願望並不能實現。這些困難重新在那作為電子與電磁場作用量子理論的量子電動力學的發散中出現。它們雖被與負能量電子海相關聯的一些無窮大所修正,但它們仍然是顯著的重大難題。

這些發散所造成的困難事實上是非常棘手的。過去二十年來沒有取得任何的進展。後來一個始於蘭姆 (Lamb) 的發現和蘭姆位移 (Lamb shift) 的解釋所引發的進展來到了,這在根本上改變了理論物理的特質。它涉及設立一些規則來去除無窮大,這些規則是精確的,使得去除無窮大後留下定義嚴謹並且可以和實驗比較的數值。然而人們是在運用工作規則 (working rule) 而非常規數學。

當今大部分的理論物理學家似乎對這個景況感到相當滿意,但我並非如此。我以為理論物理因上述發展已經走偏了,並且我們不應該因之沾沾自喜、固步自封。[6] 這和1927年的情況有些雷同,當時大部分的物理學家滿足於克來恩戈登方程式,並不因隨之而來的負機率感到困擾。

當我們需要從我們的方程式中去掉無窮大時,我們就應該要查覺到有一些東西是根本上就錯了,我們應該不計代價地持守住邏輯的基本概念;對這點感到憂心或許可以帶來重大的進展。量子電動力學是我們最熟知的物理領域,想必我們期待在其他物理領域取得任何根本上的進步之前必須先整頓好它,當然那些其他領域將在實驗的幫助下繼續發展。

讓我們看看將現今的量子電動力學立足於邏輯上能做些什麼。我們應該持守於只能忽略那些我們相信是微小量的標準作法,就算該信念本身不一定是可靠的。

為了處理無窮大,我們必須求助於一個截斷 (cut-off) 的程序。在數學上每當我們有一個不必然收斂的級數或積分時,我們必須如此做。當我們引入了一個截斷之後,我們要儘可能地將之推得越遠越好,以便過渡到一個極限,該極限常依賴於截斷的方式;或者我們也可以容許截斷為有限值。在後者的情況下,我們必須找出對截斷不敏感的物理量。

量子電動力學中的發散來自粒子與場作用之能量的高能量項;於是其截斷涉及引入一個姑且稱之為 g 的能量,並忽略能量比它還高的作用能量項。人們發現我們不能讓 g 趨向無窮大而不毀掉邏輯性地求解方程式的可能性。我們必須保持一個有限的截斷。

理論的相對論不變性因此被破壞了;這是令人婉惜的。但相較於偏離邏輯,這是一個兩害取其輕的次要之惡。它導致了一個不適用於涉及能量與 g 大小相當之高能量物理過程的理論,但我們或許仍然可以希望它是一個較低能量物理過程的良好近似。

根據物理的考量,g 的數量級應取為幾百MeV,因為在這個能量區量子電動力學已不再是一個自給自足的理論,此時其他的粒子開始扮演其角色。這樣大小的 g 對於這個理論而言是令人滿意的。

在使用有限截斷的情況下,我們需要去找尋那些對截斷的模式及大小不敏感的物理量。我們隨即發現薛丁格圖像並不合用。薛丁格方程式的解,是真空態的解,對截斷十分的敏感。然而我們可以在海森堡圖像下,推導出有一些對截斷不敏感的計算。

以這個方式我們可以推導出蘭姆位移和異常電子磁矩 (anomalous magnetic moment);這些結果和二十幾年前使用丟掉無窮大的工作規則所得到的結果一樣。但現在這些結果可以使用一個依循只忽略微小量之標準數學的邏輯過程來獲得。

既然我們現在無法使用薛丁格圖像,我們就不能使用那涉及到波函數絕對值平方的一般性物理詮釋了。我們必須逐步摸索出一個可以用於海森堡圖像的新物理詮釋。量子電動力學的這個處境似乎和我們在基本量子力學早期那有方程式而無物理詮釋的景況相似。

在導出蘭姆移位和異常電子磁矩的計算中有一件事應該要提一下。我們發現在開始 的方程式中代表電子質量和電荷的參數 m 及 e 與實際觀測到的這些物理量並不相同。如 果我們仍用 m 和 e 來代表實際觀測到的電子質量和電荷,則開始的方程式中的 m 及 e 要 換成 m + δm 及 ,且 δm 和 δe 都是可以被算出來的小修正量;這個過程被稱為重整化 (renormalization)。 

ab93a4f9c1c50a579ba0536f412f9424
量子電動力學的困難

在開始的方程式中做如此的改變是可以接受的。我們可以隨意採取開始的方程式,然後藉著推演它們來發展我們的理論。各位可能會以為理論物理學家的工作很簡單,因為他可以隨意採取開始的假設,但其困難之處在於他必須使用同一個開始的假設於理論的所有應用上。這大大的限制了他的自由。重整化是可以被允許的,因為它只是一個簡單的改變,但卻可以被廣泛地應用於與電磁場作用的帶電粒子上。

在量子電動力學中尚有一個嚴重的困難,這與光子的自能 (self-energy) 有關。它需要比重整化更為複雜的方式來改變開始的方程式。

終極的目標是要找到合宜的開始的方程式,從而導出整個原子物理。我們還離此很遙遠。一個邁向它的途徑是先完備化低能量物理的理論,也就是量子電動力學,並將之推廣到越來越高的能量。然而目前的量子電動力學達不到人們期望一個基本物理理論應具有的數學美感高標準,這將致使我們懷疑基本觀念的激烈改變仍然是有需要的。[7]

[1]譯註:狄拉克在此針對宇宙論的評論於充滿諸多觀測數據的今時今日已不太適用了。
[2]譯註:本節題為譯者所加因此處之討論不歸屬於上一節。


[3]譯註:狄拉克本人有重要的貢獻。
[4]譯註:此為著名的狄拉克方程。
[5]譯註:此被稱為狄拉克海。
[6]譯註:狄拉克在此節中所批評的方法稱為重整化 (renormalization),今天公認重整化背後的意義或理由為有效理論 (effective theory)。其與狄拉克在此節中隨後的作法有些類似但更為細緻。特別認真的讀者可參考 A. V. Manohar, Effective Field Theories, Lect. Notes Phys. 479, 311 (1997), doi:10.1007/BFb0104294 [hep-ph/9606222]; Steven Weinberg, The Quantum Theory of Fields, Volume 1: Foundations, Cambridge University Press, 2005.
[7]譯註:眾所周知的,狄拉克的觀點與現代物理學上一般的觀點不太相同 (見前註)。


本文翻譯自A. Salam, H. A. Bethe, P. A. M. Dirac, W. Heisenberg, E. P. Wigner, O Klein, E. M. Lifshitz, From a Life of Physics, World Scientific Publishing Co. Pte. Ltd., Singapore, 1989, pp. 19-30 (Chapter 3, Paul Adrain Maurice Dirac, Methods in Theoretical Physics), http://www.worldscientific.com/worldscibooks/10.1142/0877, 經世界科技出版有限公司授權翻譯。本譯文並經高崇文教授過目及提供建議,在此一併致謝。