愛因斯坦如何導出質能等價關係式\(E=mc^{2}\)

最近(2023 年8 月份)大導演諾蘭(Christopher Edward Nolan)的電影《奧本海默》(Oppenheimer)正在熱映中。許多平常較少關注科學議題的朋友們在這陣子也開始對原子彈相關知識變得有點好奇了。在那些關於連鎖反應以及原子彈設計的技術性知識之外,有一個最核心的物理公式與原子彈釋放的能量有關,那就是世人耳熟能詳,而物理學家霍金(Stephen Hawking)在他的科普名著《時間簡史》(A Brief History of Time: From the Big Bang to Black Holes)一書中無論如何都避不掉的物理公式:質能等價關係式(mass-energy equivalence relation)\( E=mc^{2}\)。根據此公式,僅僅1 公克的質量變化,就可以轉換為 \(9\times 10^{13}\)(90 兆焦耳)的能量,大約是22000 噸TNT 炸藥爆炸所釋放的能量,而這就是原子彈的威力如此驚人的主因。不過,原子彈的設計與製造是很複雜的工程問題,其中還牽涉到工程以外的其它問題,所以不是僅僅依據質能等價關係式就可以成功。這也就是為何一般而言,學術界並不會把愛因斯坦視為原子彈的發明者或製造者的原因。

愛因斯坦曾多次以不同思路向世人展示如何導出質能等價關係式,其中所用到的物理與數學知識的多寡與難易程度各不相同。在近代物理或是狹義相對論的教科書裡對此公式的推導通常有兩類。第一類是先介紹牛頓力學中的動量公式  \(\textbf{p}=m\textbf{v}\) 如何被相對論修正,然後再根據牛頓第二定律 \(\textbf{F}=d\textbf{p}/dt\)  計算力如何對物體作功,得到新的動能公式,最後從新的動能公式中解讀出 \( E=mc^{2}\)。第二類是直接從四維時空觀念著手,導出一個包含能量 \(E\) 與動量 \(\bf{p}\) 的四維向量,稱為四-動量(4-momentum),其中第零分量(zeroth component)就是能量 \(E\),然後據此探討相對論中運動物體的能量與動量的關係。我們在本文的後半部會再回頭來討論這兩類結果。從下一段起,我將為大家介紹愛因斯坦在1946 年發表的一種簡單推導(收錄於《愛因斯坦晚年文集》與其英文版Out of My Later Years )。這個推導假定光與物質在交互作用前後的系統總動量與總能量是守恆的,此外還用到了光的動量與能量關係式 \(E=pc\) ( 可參考費曼物理講義Vol. II,第27-6 節,或是Vol. I,第34-9 節),以及物體低速運動的近似結果。整個推導過程完全沒有用到狹義相對論的羅倫茲轉換(Lorentz transformation)或是時空相關的知識,也不需要直接用到牛頓定律。事實上,愛因斯坦的這類推導所展示的主要是「能量具有慣性質量」 \((m=E/c^{2})\) ,而不是「質量蘊藏著巨大的能量」 \(( E=mc^{2}\)) 。

考慮兩個慣性參考系 \(K_{0}\) 與 \(K\) ,兩者有平行的座標軸,而後者相對於前者以 \(\nu \) 的速率朝 \(-y\)  軸的方向運動;若反過來看,可知前者相對於後者以 \(\nu \)  的速率朝 \(+y\)  軸的方向運動,為了後續推導的簡單性,此處假設 \(\nu \)  遠小於真空光速 \(c\) ,即 \(\nu /c\)  遠小於1。考慮一個靜止於 \(K_{0}\) 系的物體 \(B\) ,在其左右兩側有光源 \(S\)  與 \(S^{'}\) ,各發射能量都是 \(E/2\)  的光脈衝(light pulse),分別朝右 \(\left(-\chi\right)\)  與朝左 \((-\chi)\) 傳播,然後被物體 \(B\) 吸收。根據前一段提到的光的能量與動量關係 \(E=pc\) ,可知這兩個脈衝分別攜帶 \(\pm\frac{E}{2c}\) 的動量(兩者動量的 \(\chi \)  分量數值),射向物體 \(B\) ,並被其吸收。根據動量守恆原理,在 \(K_{0}\) 參考系中, \(B\) 物體在吸收了光脈衝之後會依然保持靜止(如圖)。

1699501545888_0.jpg

圖一: \(K\)  參考系中的光脈衝能量與動量被物體  \(B\)  吸收的過程。

同一個過程,在參考系 \(K\)  裡看起來是怎樣的呢?顯然,物體 \(B\)  在吸收光脈衝前後都是以 \(\nu \)  的速率朝 \(+y\)  軸的方向運動。至於兩個光脈衝,左邊的那個向著右邊 \((+\chi)\) 略為偏上 \(+y\) 的方向傳播,而右邊的那個向著左邊 \((-\chi)\) 略為偏上的方向傳播,兩者與水平方向的夾角(弳角) \(\alpha \)  都近似於 \(\nu /c\)。根據 \(\nu \)  遠小 \(c\)  的假設, \(\alpha \) 是一個非常小的角,所以會有 \(\alpha\approx\nu/c\approx\rm{tan}\alpha\approx\rm{sin}\alpha \) 。不難看出兩個光脈衝在 \(+y\)  方向的總動量(近似值)是 \(p_{y}\approx\left(E/c\right)\alpha\approx E\nu/c^{2}\) ,在被吸收後完全轉移給了物體 \(B\) 。請注意,物體 \(B\)  在吸收光脈衝前後保持著完全相同的運動速度,所以它所吸收的動量並沒有表現在速度變化上,而是表現在質量變化上(因為動量是質量與速度的乘積)。

1699501563984_0.jpg

圖二: \(K\)  參考系中的光脈衝能量與動量被物體 \(B\)  吸收的過程。

設物體 \(B\)  在吸收光脈前後的質量分別是 \(M\)  與 \(M'\) ,那麼根據 \(y\) 方向的動量守恆,可得到以下關係式

\(M'\nu=M\nu+E\nu/c^{2}\) ,                                 (1)

消去速率 \(\nu \) ,就得到質量的變化 \(\triangle M\)  為

\(\triangle M=M'-M=E/c^{2}\)  .                            (2)

公式(2)說明了以下事實:每當一個物體的能量變化了 \(E\) ,就會有對應的質量變化 \(E/c^{2}\) ,換句話說,能量是具有慣性質量的

在一般的物理現象裡,只有能量的變化具有直接的物理意義,所以可以將總能量的數值加減某個常數(亦即任選能量零點的參考點)而不影響物理的結果(讀者可參考另一篇專欄文章:《一個物理多重表述:淺談物理中確定與不需確定的物理量》)。根據這個想法,可定義一個物體的總質量 \(m\) 是總能量 \(E\)  除以 \(c^{2}\) ,這就得到了大家耳熟能詳的質能
等價關係式:

\(E=mc^{2}\)                              (3)

上述的推導雖然簡單,但其實有不少缺陷,例如:使用了低速度與小角度的近似公式,使得所得結果的正確性不夠嚴謹,例如:在參考系 \(K\) 裡,物體 \(B\)  的速度不是0,因此有一個很小的動能,這部分能量也會使物體 \(B\)  的質量被修正,但我們在推導中是將質量變化完全歸因於物體 \(B\)  吸收了光脈衝的能量。此外,將參考系從 \(K_{0}\)  轉換至 \(K\)  時,光脈衝的能量與動量其實要做羅倫茲轉換,而不只是做個簡單的傳播方向修正,不過在低速時兩種做法是幾乎沒有差別的。想要進一步了解這些較嚴謹的推導方式的讀者,可以試試直接讀愛因斯坦1905 年那篇推導出質能等價關係式的原始論文〈 物體的慣性同它所含的能量有關嗎?〉。

公式(3)雖然得出了物體質量與其總能量的關係,但沒有直接給出物體質量與速率的關係。根據質量會隨能量增加的想法,若以一個作用力持續推動一個靜止的物體,那麼隨著動能的增加,此物體的質量應該也會增加,所以質量就會是速率的函數。我們現在試著把這個函數形式推導出來,將動量的定義  \(\textbf{p}=m\textbf{v}\) ,代入牛頓第二定律

\(\textbf{F}=d\textbf{p}/dt\) ,並與速度 \(\bf{v}\)  作內積,會得到作用力對物體做功的功率,即

\(dE/dt=\textbf{v}\cdot\textbf{F}=\textbf{v}\cdot d\left(m\textbf{v}\right)/dt=\nu d\left(mv\right)/dt,\)       (4)

上式中的 \(\nu=\left|\bf{v}\right|\) 是速率,即速度的大小。將(3)代入(4),並在等號兩
端同乘以 \(2m\) ,就得到 \(d\left(m^{2}c^{2}\right)/dt=d\left(m^{2}\nu^{2}\right)/dt\) ,移項得

\(d\left[m^{2}\left(c^{2}-\nu^{2}\right)\right]/dt=0\)         (5)

此結果表示 \(m^{2}\left(c^{2}-\nu^{2}\right)\) 是一個與速率無關的常數。以 \(m_{0}\) 表示速率為0時的質量,即可寫下關係式 \(m^{2}\left(c^{2}-\nu^{2}\right)=m_{0}^{2}c^{2}\)  。根據此式即可解出
 \(m=m_{0}/\sqrt{1-\nu^{2}/c^{2}}=\gamma m_{0}\)          (6)
其中乘以 \(m_{0}\)  的因子 \(\gamma=\left(1-\nu^{2}/c^{2}\right)^{-1/2}\) 是一個大於1 的數,隨速率增大而增大,並在 \(\nu=c\) 時變成無限大。讀者可以在費曼物理講義Vol. I,第15-9 節找到一個類似於(4)至(6)式的推導。

出現在(6)式中的m0 被稱為靜止質量(rest mass)或不變質量(invariant mass),而 \(m\)  被稱為運動質量(moving mass)或相對論性質量(relativistic mass)。在物體速率遠小於光速 \(c\) 時, \(m\)  與 \(m_{0}\)  的差別是幾乎不可能測出來的,以速率900 km/hr(即250 m/s)的客機為例,質量的修正比例大約是 \(3.48\times 10^{-13}\) ,略大於3 兆分之1。這個差異是如此微小,所以在相對論提出之前都沒有被發現。在原來的牛頓力學裡,出現在動量公式 \(\textbf{p}=m\textbf{v}\)  中的 \(m\)  可以視為是一個與速率無關的常數,因此對於一個不與外界交換物質的力學系統,將牛頓第二定律寫成 \(\textbf{F}=d\textbf{p}/dt\) 或是 \(\textbf{F}=m\textbf{a}\) 是沒有差別的。不過,這個微小的質量差異,若乘以 \(c^{2}\)  這個巨大的數量,給出的其實就是不可忽略的動能。根據公式(3)與(6)寫出相對論性能量(relativistic energy)

\(E=E_{0}/\sqrt{1-\nu^{2}/c^{2}}=\gamma E_{0}\)                               (7)

與靜止能量(rest energy) \(E_{0}=m_{0}c^{2}\) ,再根據 \(\gamma \) 因子的低速( \(\nu/c\)  遠小於1)近似 \(\gamma\approx 1+\nu^{2}/2c^{2}\) 計算出物體的動能(kinetic energy)為

\(K=E-E_{0}=\left(\gamma-1\right)E_{0}\approx m\nu^{2}/2\)                          (8)

此式非常合理地重現了牛頓力學裡關於動能的公式。

在研究速率接近光速的相對論性動力學系統時,動量 \(\textbf{p}\) 通常是比速度 \(\textbf{v}\) 更重要的物理量。此時可以將 \(\textbf{v}\) 消去,將其用 \(\textbf{p}\)  取代,將前面提過的恆等式 \(m^{2}\left(c^{2}-\nu^{2}\right)=m_{0}^{2}c^{2}\) 乘以 \(c^{2}\) ,並利用等式 \(E=mc^{2}\)  與  \(p=m\nu \) ,就得到

\(E^{2}=p^{2}c^{2}+m_{0}^{2}c^{4}\)              (9)

根據這個公式,可知光子就是靜止質量為0 的粒子。有一派物理學家(以及不少現代的教科書寫法)不喜歡運動質量的概念,他們主張把靜止質量直接稱為質量,並且就用符號 \(m\) 表示 \(m_{0}\) ,如此(9)式就被改寫為

\(E^{2}=p^{2}c^{2}+m^{2}c^{4}\)             (10)

在這種表達方式中, 運動物體的能量與動量就被寫成 \(E=\gamma mc^{2}\)  與 \(\textbf{p}=\gamma m\textbf{v}\) ,此處的 \(\gamma \)  就是前面提過的 \(\gamma \) 因子 \(1/\sqrt{1-\nu^{2}/c^{2}}\) 。當我們看到“ 光子的質量為0” 時,那個“ 質量” 指的就是這種把靜止質量當成質量的表達方式。


結束此文之前,來談談公式(2)與公式(3)的差別。在愛因斯坦原來的推導中,雖然他論證了能量的變化與質量的變化成正比,比例常數為 \(c^{2}\) (即公式(2)),但這並不能推論出“ 物體的全部質量都可以轉換為能量”。在現代的粒子加速器裡,這個可能性已被實現。如果電子(electron)與正子(positron)被視為“ 物質”,而光子被視為“ 能量” 的話,電子與正子相互湮滅(annihilation),轉換為兩個伽馬( \(\gamma \) )光子的過程,就是這個“ 質量完全轉換為能量” 的一個具體例子。