等效原理與彎曲時空-聊聊愛因斯坦的布拉格論文

封面圖片來源:Schwarzschild-Droste-Lightcone-Diagram.png

愛因斯坦在1905 年發表了狹義相對論以及質能等價關係的論文後,並沒有立即著手研究重力的相對論化問題,而是將注意力轉移到量子問題上。作為廣義相對論基礎的等效原理(equivalence principle)是他在1907 年為《放射學和電子學年鑑》寫相對論綜述文章〈關於相對性原理和由此得出的結論〉時提出的探索性概念,之後他對重力問題保持著沉默。1911 年3 月,當他到布拉格查理大學(Charles University)任教之後,重力問題才重新抓住了他的注意力。在布拉格的16個月裡,愛因斯坦發表了11 篇論文,其中有6篇與相對論及重力問題有關。1912 年7 月,他回蘇黎世理工大學擔任教授,並向老同學格羅斯曼(Marcell Grossmann)學習張量(tensor)與黎曼幾何(Riemann geometry)。他們的合作成果是1913 發表的《廣義相對論綱要和引力論》,至此他已採用彎曲時空的理論架構,但是還沒有找到正確的重力場方程式。他在1914 年回德國擔任柏林大學教授,展開了與德國物理學家的高強度合作與競爭,並在1915 年底完成了那個曠世名作—廣義相對論,解開了重力之謎。

愛因斯坦在布拉格所發表的論文中,最重要的一篇應該是1911 年6 月的《關於引力對光傳播的影響》。在後續的討論中,我將稱它為「布拉格論文」。在此論文中,愛因斯坦將等效原理提升為基本公設,並得出以下重要結論:
1. 光由低重力位能(gravitational potential)處傳到高重力位能處,光波頻率會降低,即發生重力紅移(gravitational redshift)。
2. 任何形式的能量不但會有慣性質量(inertial mass),同時也會有重力質量(gravitational mass)。
3. 時鐘韻律會隨重力位能而變化,在高重力位能處的時鐘走得較快。若採用統一的座標時(coordinate time)計時,則測得的光速會隨重力位能變化。
4. 光線在重力場中傳播時,傳播路徑會被重力場彎曲,且彎曲程度在實驗可檢驗的範圍內。由於布拉格論文中使用的數學比較淺顯,所以很值得介紹給一般讀者們了解。不過,以上幾項皆是在廣義相對論尚未建立起來之前的初步結論,不是最後的精確結果,因此雖然定性上正確,但其數值精確性沒有保證。例如文中算出的星光經過太陽附近會彎曲0.87 秒,但根據廣義相對論計算的光線彎曲量其實是1.75 秒,恰好是此初步結果的兩倍。在本期專欄中,我會解說布拉格論文的主要思路與計算方法。在文章的最後,我也會與讀者們分享我對布拉格與彎曲時空的可能心理連結的猜想。

螢幕擷取畫面 (52).png

圖一:愛因斯坦在布拉格Lesnická1215/07 的住所(Albert Einstein House)。

布拉格論文的摘要裡,愛因斯坦說他對1907 年論文中關於加速坐標系與重力場等效的講法不甚滿意,因而寫出這篇新論文。此外,他發現“ 光線彎曲” 的預測值是在實驗可檢驗的範圍內,因此十分值得重視。不過,他也知道當時的結果只有在一階近似下才是正確的。如果仔細檢視1907 年的那篇論文,會發現以上所說的1 到4 的重點其實都已經得到了。不過,那時採用的是更依賴座標轉換以及馬克士威方程組(Maxwell’s equations)的詳細數學推導方式。與此對比,布拉格論文採用的是更偏重物理圖像並且不依賴馬克士威方程組的推論方式,這使其結論更具有普遍性,也更容易理解。

在布拉格論文的第一節,愛因斯坦考慮兩個座標系\(K\) 與\(K'\)。其中\(K\)是一個靜止的坐標系,內部有一個朝向\(-z\) 方向,強度為\(g\)(原文用符號\(\gamma \))的重力場;而\(K'\) 是一個在無重力場的空間中,朝著\(+z\)方向以加速度\(a=g\) 前進的坐標系。愛因斯坦首先說明,由於慣性質量與重力質量一樣,粒子在這兩個坐標系中的運動方程相同,即它們在力學上是等效的,這其實是牛頓力學的自然結果。接著他進一步假設這個等效性並不局限於力學範疇,這就將等效原理改造成了對一切自然規律都成立的基本公設。愛因斯坦把光的傳播、吸收與輻射現象都一併納入考慮,而這是在愛因斯坦之前的人從沒做過的事。

在第二節,愛因斯坦考慮\(K\)系\(z\)軸上高度\(h\)處的光源\(S_{2}\)發射出能量為\(E_{2}\)的輻射,並研究當這個輻射傳播到原點\(S_{1}\)時,該處測得的能量\(E_{1}\)為何?愛因斯坦得到的(一階近似)的答案是:
\(E_{1}=E_{2}(1+\Phi/c^{2})\)         (1)

此處\(\Phi=gh\)是\(S_{2}\)相對於\(S_{1}\)的重力位能。愛因斯坦推導出(1)式的基本思路如下:將\(K\)換成\(K'\),可算出輻射由\(S_{2}\)傳到\(S_{1}\)所花的時間約等於\(h/c\),此外可知當它遇到\(S_{1}\)時,\(K'\) 正以瞬時速度\(\nu=gh/c=\Phi/c\)上升。將此結果套用於他在1905 年狹義相對論與質能等價論文中用過的輻射能量在相對運動的兩座標系的勞侖茲變換(Lorentz transformation)公式

\(E'=E(1-\nu\textrm{cos}\varphi/c)/\sqrt{1-\nu^{2}/c^{2}}\)            (2)


取\(\varphi=\pi \),並只保留至\(\nu/c\)的一階項,就得到(1)式。

在第二節的後半段,愛因斯坦考慮一個質量為\(M\)的物體,它先是從\(S_{2}\)被移動到\(S_{1}\),過程中對外作功\(M gh\)。然後它吸收上述\(S_{1}\)處輻射能\(E_{1}\)中那個\(E_{2}\)部分的能量,使質量變成\(M'\),再被提升至\(S_{2}\)處。在此提升過程中,外界對其作功\(M' gh\)。最後,此質量將借來的\(E_{2}\)能量還給\(S_{2}\),完成了一個循環。若在此循環中總能量守恆,那個\(S_{1}\)處剩下的能量\(E_{2}gh/c^{2}\)就必須等於外界對物體所做的淨功\((M'-M)gh\),即\(M'-M=E_{2}/c^{2}\)。如此即論證了:輻射能量不僅具有慣性質量,也具有重力質量

第三節探討輻射由\(S_{2}\)射向\(S_{1}\)的頻率變化,此時套用的是相對論性都卜勒效應(relativistic Doppler effect)的公式,其形式與(2)式完全一樣,只要將對應的能量改為頻率即可。最後得到跟(1)式形式一樣的公式,即
\(f_{1}=f_{2}(1+\Phi/c^{2})\)               (3)
此推導在從前的專欄文章《晴空塔、GPS,與費曼時鐘問題—聊聊重力場中的時間效應》裡已經出現過,讀者可以參考其中的細節。

在導出公式(3)後,愛因斯坦探討了光線由太陽(低重力位能處)傳向地球(高重力位能處)的頻率紅移問題。根據相關數據,可算出紅移量大約是原頻率的百萬分之二。數量級相同的太陽光譜紅移現象其實在1897 與1909 年的兩篇法國文獻中有被報導過,但當時都是以其它原因解釋這個結果。精確的實驗檢驗直到1959 年才由哈佛大學的Robert Pound 與Clen A. Rebka, Jr. 做出來。


在第三節的後1/3 部分,愛因斯坦解釋了公式(3)在時間測量上的意義:不同重力位能的地方,時鐘會走得不一樣快。假定有兩個性能一樣的時鐘,在同一個地點被同一家工廠製造出來,然後一個移到\(S_{1}\)處,另一個移到\(S_{2}\)處。當我們用這兩個時鐘去做第三節的輻射發射與接收的實驗時,假設在\(S_{2}\)的光源相對於當地時鐘的時間間隔\(\tau _{2}\)穩定地放出\(N\)個波長,即\(f_{2}=\delta N/\delta\tau _{2}\),那麼在\(S_{1}\)處這\(N\)個波長就是在\(\tau _{1}\)的當地時間間隔接收到的,其中\(f_{1}=\delta N/\delta\tau _{1}=\delta N/\delta\tau _{2}\left[1+\left(\Phi _{2}-\Phi _{1}/c^{2}\right)\right]\)。根據\(\Phi/c^{2}\)是一個小量的事實,可移項並求倒數,就得到以下恆等式:
\(\tau _{1}/\left(1+\Phi _{1}/c^{2}\right)=\tau_{2}/\left(1+\Phi _{2}/c^{2}\right)\)            (4)


根據上式,只要將各地的時鐘時間讀數\(\tau \),又稱原時(proper time),除以與當地的重力位能\(\Phi \)相關的修正因子\(\left(1+\Phi/c^{2}\right)\),即可定義一個各處通用的時間\(t\):

\(t=\tau/\left(1+\Phi/c^{2}\right)\)              (5)

上述這個調整過的通用時間,就是座標時。愛因斯坦知道(雖然沒有證明)根據各地原時,在一個固定地點附近的小範圍內測出的光速會跟狹義相對論中那個光速一樣。他把這個光速記為\(c_{0}\),然後根據(5)式的結果寫出根據座標時會得到的觀測光速\(c\)為

\(c=c_{0}\left(1+\Phi/c^{2}\right)\)            (6)

此式就是愛因斯坦推導光線彎曲角度所依據的公式。

在最精采的第四節(最後一節),愛因斯坦根據(6)式計算了遠方的星光通過太陽附近時,被太陽重力場彎曲的角度。在文章中關於這個計算過程的解說不太好理解,因此我改採另一種觀點做計算:將重力位能對“ 座標光速” 的影響想像為一種介質效應。觀察(6),可定義“等效折射率”(refractive index)\(n\) 為:

\(n=1/\left(1+\Phi/c^{2}\right)\approx 1-\Phi/c^{2}\)             (7)

由於無窮遠處的重力位能被定義為0,而太陽周圍的重力位能為負值,所以上式表明太陽周圍的“等效折射率” 是一個比1略大的空間函數,越靠近太陽數值越大(不考慮太陽內部)。根據這個圖像,當光波傳播經過太陽附近時,靠近太陽的一側走得較慢(折射率大),而較遠的一側走得較快,這就造成了光線偏折的效果。

根據光學的司乃耳定律(Snell’s law)\(n_{1}\mathrm{sin}\theta _{1}=n_{2}\mathrm{sin}\theta_{2}\),可知若將光波傳播方向的單位向量\(\hat{s}=d\textbf{r}/ds\)乘以折射率\(n\)定義為向量\(\textbf{u}=n\hat{s}\),則\(\textbf{u}\)向量在從\(n_{1}\)介質進入\(n_{2}\)介質時,\(\textbf{u}\)平行於交界面的切分量(tangential components)不改變,只改變法分量(normal component),即\(\textbf{u}\)只在折射率變化的方向上變化。此處\(d\textbf{r}\)是沿光線軌跡的無窮小位移,而\(ds\)是這段小位移的長度(移動的距離)。當折射率是連續變化時,這表示\(d\textbf{u}/ds\parallel\triangledown _{n}\),其中\(\mu \)是待定函數。將此式與\(\textbf{u}=n\hat{s}\)做內積,等號左邊得到\(\textbf{u}\cdot d\textbf{u}/ds=0.5d\left(u^{2}\right)/ds=0.5d\left(n^{2}/ds\right)\)
\(\mu ndn/ds=0.5\mu d\left(n^{2}\right)/ds\),而等號右邊得到\(\mu ndn/ds=0.5\mu d\left(n^{2}\right)/ds\)。比較等式左右可知\(\mu=1\)。這樣,我們就得到了光線軌跡方程式:

\(d\textbf{u}/ds=\triangledown _{n}\approx-\triangledown\Phi\left(r\right)/c^{2}=-\hat{r}GM/r^{2}c^{2}\)         (8)

此處已將(7)式代入,並假定太陽中心位於原點。此外,還以\(G\)表示重力常數,\(M\)表示太陽質量,並使用了重力位能公式\(\Phi\left(r\right)=-GM/r\)。

根據(7),在無窮遠處的折射率為1,所以那裏的向量\(\textbf{u}\)與單位向量\(\hat{s}\)沒有區別。對路徑距離參數\(s\)積分全程,就會得到單位向量\(\hat{s}\)的變化\(\Delta\hat{s}\),它的長度就是偏轉角,記為\(\alpha \)。設路徑距太陽中心最近的點的位置向量為\(\textbf{r}=\textbf{R}=R\hat{\textbf{R}}\),其中\(\hat{\textbf{R}}\)為單位向量而\(R\)為最近距離,可知\(\alpha=-\hat{\textbf{R}}\cdot\Delta\hat{s}\)。以\(-\hat{\textbf{R}}\)對(8)式作內積並對\(s\) 積分。其中\(s\)與\(r\)可分別參數化為\(s=R\textrm{tan}\theta \)與\(r=R\textrm{sec}\theta \),就得到

\(\alpha=\int\begin{matrix}\theta=\pi/2\\\theta=-\pi/2\end{matrix}GM\textrm{cos}\theta ds/r^{2}c^{2}=2GM/Rc^{2}\)                            (9)

將重力常數與太陽質量等各項數據代入(9)式(其中\(R\)選為太陽半徑),就可以計算得偏折角\(\alpha \)大約為0.87 秒。


其實從(5)式到(6)式的跳躍幅度很大。愛因斯坦在此似乎不假思索地將光波的波長視為與位置無關,因此只考慮了時間的修正對觀測到的座標光速的影響。當愛因斯坦在1915 年找到了正確的場方程式後,他對光線偏折又重算了一次,得到的數值變成了1.75 秒,並在1919 年的日蝕實驗中被證實了。可以說,在布拉格論文中,愛因斯坦雖然已經釐清了重力位能對時鐘與輻射頻率的影響,但對於重力位能如何影響一把尺的長度,他還是沒有答案的。事實上,他曾試圖用“可變的光速” 來取代重力位能,但後來發現那是不夠的,單靠重力位能不足以顯示完整的重力效應。經過各種錯誤嘗試後,愛因斯坦發現必須採用彎曲時空的語言來描述重力效應,因而尋求老同學格羅斯曼的幫助,學習黎曼幾何。不過,我總是有以下的疑問:當愛因斯坦還生活在布拉格時,是否有任何環境因素,曾經啟發他對“ 彎曲時空” 的想像呢?

翻開愛因斯坦與英費爾德(Leopold Infeld)合寫的那本科普名著《物理學的演進》(The Evolution of Physics)第三章,標題為【幾何與實驗】那一節,會看到書中藉著引入不懂廣義相對論的“ 老物理學家”(O)與懂廣義相對論的“現代物理學家”(M)的虛擬對話來釐清廣義相對論的觀念。其中O 覺得老物理學裡那種“ 理想美國城鎮” 的棋盤方格式街道才是正確的幾何學,而旋轉圓盤上面那些各處不同步的時鐘與長度不一致的直尺,一定會造成許多混亂;然而M 覺得這些問題難不倒他。他認為城鎮不一定要美式的,它也可以是“ 古歐洲式”,雖然位置與距離不是簡單的線性關係,但就像根據地球經緯度一樣可以計算距離,只要掌握了曲面的幾何性質,一切就好辦。該書所給的結論是:物理學的發展迫使我們要選擇“ 古歐洲式” 的幾何。

1703838570804.jpg

圖二:從布拉格老城區的市政廳鐘塔俯瞰布拉格。

上述所謂“ 古歐洲式” 的城鎮究竟指的是什麼?我一直不甚了解;直到我因參加研討會而拜訪布拉格,才有了初步的概念。16 年前,當我第一次爬上布拉格老城區市政廳的鐘塔,俯瞰布拉格時,看到的就是圖二這幅景象。很顯然,這絕對不是棋盤方格式!我當時立刻想起了《物理學的演進》中那段關於“ 古歐洲式” 城鎮與街道格局的對話,並開心地對我太太說:「我知道愛因斯坦為何會想到彎曲時空了。這裡就是彎曲時空,而他天天都生活在彎曲時空裡!」這個想法究竟有沒有道理?就請讀者們自行判斷吧!