虛數的物理學:談談虛數在波物理中的實用性與便利性

  據說虛數 (imaginary number) 與複數 (complex number) 是數學家為了解三次方程式而發明出來的工具。其實對數學家而言,任何觀念上的發明,只要在邏輯上是自洽的 (self-consistent),都可以成為數學研究的對象,無所謂存在或不存在。至於在物理學裡,研究的對象都必須有被實驗檢驗的可能性,因此與虛數或複數相關的物理量是否可被觀測,就是不得不考慮的問題。在以前的專欄文《你是物理人還是電機人?談談複數物理量的表達習慣》裡,我們探討的是物理公式中複數表達式的使用習慣與意義,而對複數與虛數究竟在那些具體問題中被使用著墨較少。在此文中,我將進一步聊聊虛數與複數在波動物理與量子力學中具體應用的實例。此篇的複數表達式,將採用「物理人」的慣用法;讀者可以自行參考《你…》文找出對應的「電機人」慣用法。

 所謂複數,就是一個型如 \( z=x+iy\) 的數,其中\(x\) 與 \(y\)都是實數,分別被稱為此複數\(z\) 的實部虛部,用\(x=Re\left(z\right),y=Im\left(z\right)\)表示,而\(i=\sqrt{-1}\)是單位虛數。實部為 0 的複數被稱為純虛數,而將上述複數\(z\) 的虛部變號所得的新複數就是\(z\)的共軛複數 (complex conjugate),通常記為 \( z^{*}\) 或 \(\bar{z}\),即\(z^{*}=x-iy\)。用二維笛卡兒座標系 (Cartesian coordinates) 的座標點  \(\left(x,y\right)\) 表示複數 \(z=x+iy\),並定義原點至該點的距離 \(r=\sqrt{x^{2}+y^{2}}\)為該複數的絕對值,記為\(\left|z\right|\),則可將\(z\) 寫成 \( z=\left|z\right|\left(\rm{cos}\theta+i\rm{sin}\theta\right)\)。歐拉 (Leonhard Paul Euler) 發現這個餘弦與正弦函數的組合複數可以被寫成指數函數的形式,即\(z=\left|z\right|e^{i\theta}\)。此處的指數  \(e^{i\theta}\) 也可以記為 exp\(\left(i\theta\right)\),以方便表示較複雜的 \(\theta\)。在物理的使用中,當\(\theta\)為實數時,被稱為上述複數 \(z\) 的相位 (phase),而把 \(e^{i\theta}\)  稱為相因子 (phase factor)。值得注意的是,歐拉公式\(e^{i\theta}=\rm{cos}\theta+i\rm{sin}\theta \)在\(\theta\) 為複數時依然是正確的,而且此恆等式可以應用在許多物理問題中。將複數型的\(\theta\) 寫成 \(\theta=\theta _{r}+i\theta _{i}\)並代入\(e^{i\theta}\),就得到\(e^{i\theta}=e^{i\left(\theta _{r}+i\theta _{i}\right)}=e^{-\theta _{i}}e^{i\theta _{r}}\),此時相位是\(\theta _{r}\),而\(e^{-\theta _{i}}\) 是一個縮小或放大的因子。

 

一個朝著\(+x\)方向傳播的單一頻率,單一波長的正弦波 (sinusoidal wave) 可以表示為:

\(u=A\rm{cos}\left(\it{kx}-\omega\it{t}+\delta\right)\)           (1)

其中 \(k=2\pi/\lambda \)是波數 (wave number),\(\omega =2\pi/T=2\pi \nu\)是角頻率 (angular frequency), \(\delta \)是這個波的一個參考相位,而 \(A\) 是振幅,\(\lambda \)是波長。在波現象的描述中,角頻率通常是比頻率 \(\nu \) 或週期\(T\) 更方便使用的物理量,有時候就簡稱其為頻率。利歐拉公式,公式 (1) 就可以被改寫為

\(u=Re\left[\tilde{A}e^{i\left(kx-\omega t\right)}\right],\tilde{A}=Ae^{i\delta}\),              (2)

其中 \(\tilde{A}\) 是複數振幅 (complex amplitude),而 \(\delta \) 是 \(\tilde{A}\) 的相位。

 

    當一個型如 (1) 或 (2) 式的平面波 (plane wave) 朝著空間的任意一個方向 \(\hat{n}\)傳播時,可以定義波向量 (wave vector) \(\textbf{k}=k\hat{n}\), 並將位置座標 \(x\) 換成位置向量 \(\textbf{r}\) 在 \(\hat{n}\) 上的投影\(\textbf{r}\cdot\hat{n}\),於是就可以表達為

\(u\left(\textbf{r},t\right)=Re\left[\tilde{A}e^{i\left(\textbf{k}\cdot \textbf{r}\ -\omega t\right)}\right].\)           (3)

若波現象不牽涉非線性效應 (nonlinear effects) 時,不同的分波就可以疊加出一個總波,而後者還滿足與各分波相同的波方程式。由於「取實部」與「疊加」具有交換性,因此在處理可疊加的波的各種線性計算中,使用各個波的複數替身去做計算會比使用實數版的波公式方便許多。這主要來自以下兩個特點:A.複數疊加在幾何上等價於平面向量的疊加,因此直觀上更容易想像;B.對複數相因子 \(e^{i\left({\bf{k}}\cdot{\bf{r}}-\omega {\it{t}}+\delta\right)}\) 進行時間/空間微分或積分時,所得的結果都會正比於原來的指數,因此微積分可被代數乘除法取代;但若對實數函數\(\rm{cos}\left(\textbf{k}\cdot\textbf{r}-\omega {\it{t}}+\delta\right)\)進行微分或積分,卻會得到正比於 \(\rm{sin}\left(\textbf{k}\cdot\textbf{r}-\omega{\it{t}}+\delta\right)\) 的量,必須進行偶數次這類運算才會得到正比於原來函數的導出量。當處理的分波數量較多時,複數處理方式的優越性就很明顯了。 

 

    在表達電磁波的偏振態 (polarization state) 時,複數是必不可少的工具。例如一個朝著 \(+z\) 方向傳播,右旋圓偏振 (right-handed circularly polarized) 的電磁波的電場可寫成 

\(\textbf{E}=A\left[\rm{cos}\left({\it{kz}}-\omega{\it{t}}\right){\textbf{x}}-\rm{sin}\left({\it{kz}}-\omega{\it{t}}\right)\hat{\textbf{y}}\right]\)
    \(=A\left[\rm{cos}\left(\omega{\it{t}}-{\it{kz}}\right)\hat{\textbf{x}}+\rm{sin}\left(\omega{\it{t}}-{\it{kz}}\right)\hat{\textbf{y}}\right]\),  (4)

其中 \(\hat{\textbf{x}}\) 與 \(\hat{\textbf{y}}\) 分別是 x 與 y 軸方向的單位向量。當觀察者站在 z 座標處看著迎面而來得的電磁波時,他會觀察到逆時鐘旋轉的電場向量。若用右手做出比讚的手勢,大拇指指向 z 軸,其餘 4 指就會是逆時鐘繞的,而這就是此偏振的名稱由來。由於電場是垂直於波向量 \(\textbf{k}=k\hat{\textbf{z}}\)的二維向量,所以可以將\(\hat{\textbf{x}}\) 與 \(\hat{\textbf{y}}\)表示為\(\hat{\textbf{x}}=\begin{bmatrix}1\\0\end{bmatrix}\)與 \(\hat{\textbf{y}}=\begin{bmatrix}0\\1\end{bmatrix}\) ,並將電場表示為

\(\textbf{E}=Re\left[A^{'}\hat{\textbf{p}}e^{i(kz-\omega t)}\right],\hat{\textbf{p}}=\frac{1}{\sqrt{2}}\begin{bmatrix}\textbf{1}\\i\end{bmatrix},\)\(A^{'}=\sqrt{2}A.\)        (5)

此處表示偏振的\(\hat{\textbf{p}}\)的第二個分量是純虛數,代表此偏振的\(\hat{\textbf{x}}\)與\(\hat{\textbf{y}}\) 偏振分量有 \(\frac{\pi}{2}\) 的相位差。若將偏振向量的 \(i\) 改成 \(-i\) , 就得到左旋圓偏振態 (left-handed circularly polarization state)。若任意改變兩個分量的振幅與相位差,就可以疊加出所有可能的橢圓偏振態 (elliptical polarization states)。事實上,電磁波或光子的這種偏振態表達式具有與電子的自旋態 (spin state) 相同的數學形式,數學處理上也很類似,雖然它們的物理詮釋差異極大。

    當電磁波或聲波在一個吸收性介質 (absorptive medium) 中傳播時,波振幅會在傳播過程中衰減,此時波向量具有不為 0 的虛部。設傳播方向為\(+z\) ,則波向量可寫成 \(\textbf{k}=\textbf{k}_{r}+i\textbf{k}_{i}=(k_{r}+ik_{i})\hat{\textbf{z}}\),並根據 (3) 得波振幅:

\(u=Re\left[\tilde{A}e^{i(k_{r}+ik_{i})z-\omega t}\right]=Ae^{-k_{i}z}\rm{cos}({\it{k}}_{{\it{r}}}z-\omega {\it{t}}+\delta)\).   (6)

可以看出,若不使用複數表達式,上式的衰減因子\( e^{-k_{i}z}\) 與波相位的函數 \(\rm{cos}({\it{k}}_{{\it{r}}}z-\omega {\it{t}}+\delta)\) 就得視為不同的部分,對公式的處理就會繁複許多。事實上,當使用複數公式時,介質對波能量的吸收性就可以簡單歸結為來自於介質參數的虛部。例如當上式代表的是在均勻等向性的吸收介質裡傳遞的電磁波時,波數\(k=k_{r}+ik_{i}\) 與頻率 \(\omega\) 之間有色散關係 (dispersion relation) \(k=n\omega /c\),此處 \(n=n_{r}+in_{i}\) 是複數折射率 (complex refraction index)。在我們的討論中,採用的是 “物理人” 的習慣,此時 \(n_{i}>0\) 代表吸收性介質,意即波能量會在傳播過程中逐漸損耗而轉換為熱能或其他 “有去無回” 的能量。若採用 “電機人” 的表達習慣,就必須改成是 \(n_{i}<0\) 才代表吸收性介質了。

    在非吸收性的介質裡,也有其他機制可造成虛數的波向量或折射率。例如在電漿 (plasma) 介質裡,相對介電常數 (relative permittivity 或 dielectric constant) \(\epsilon(\omega)\)在低於電漿頻率 (plasma frequency) 時取負值 (虛部太小可以忽略),即 \(\epsilon(\omega)<0\)。根據光的電磁理論,在非磁性介質裡,有 \(n(\omega)=\sqrt{\epsilon(\omega)}\),因此,在電漿頻率以下的電磁波是無法穿透電漿介質的,因為進入電漿介質裡的波,具有一個虛數波數 \(k=ik_{i}\),其分布會大致局限在一個距離表面 \(d=1/k_{i}\) 的深度內。這裡的波形衰減並不是吸收造成的,而是入射的電磁波與電漿中的帶電粒子的運動彼此耦合的結果。帶電粒子並沒有永遠帶走電磁波能量,而是藉著產生與入射波相位相反的電場而抵銷了入射波。在入射區域的那一端,沒有成功穿透電漿介質的電磁波被反射了回去,因此波能量基本上並沒有損失。

    具有能隙 (energy gap) 或頻隙 (frequency gap) 的物理系統是另外一種出現虛數波向量的情況。在晶體 (例如 Si) 的週期位能裡運動的電子,或是在光子晶體 (photonic crystal) 的週期介電質結構裡傳播的電磁波,它們的定態波函數都具有布洛赫波 (Bloch wave) 的形式 (此處對電磁波採複數表達式):

\(\psi _{k}\left(\textbf{r}\right)=e^{i\textbf{k}\cdot\textbf{r}}u_{k}\left(\textbf{r}\right)\) ,                    (7)

此處 \(u_{k}\left(\textbf{r}\right)\) 是一個具有晶格周期的週期函數,而 k布洛赫波向量 (Bloch wave vector)。對應於這種波函數的能/頻譜 (energy/frequency spectrum) 是所謂能帶/頻帶結構 (Energy/frequency Band structures),是多個帶狀,由能隙穿插其間。事實上,能/頻隙就是布洛赫波向量為虛數的能量/頻率範圍,它的絕對值通常在能隙的中心達到最大,代表穿透深度最淺。

    在光學的全反射現象中,光是從光密介質 (大折射率) 射向光疏介質 (小折射率),且入射角大於臨界角 (critical angle) 的情況。根據波動光學或是電磁光學,光疏介質那一側的光場或電磁場其實並不完全為 0,而是集中在光疏—光密交界面附近。這是因為波向量垂直於界面的那個分量在光疏介質中是虛數,所以光能量不會流向光疏介質那一側。光纖或介電質波導 (dielectric waveguide) 利用的就是這個特性,而使光能量既不會流出波導之外 (波向量的橫向分量是虛數),又可以沿著波導傳送 (波向量的縱向分量是實數)。當一束可見光雷射束垂直射向一塊 45°-90°-45° 直角三角形玻璃稜鏡的一股,光會在斜邊處發生全反射,然後以垂直於另一股的方向射出。現在,若準備另一個同款稜鏡,使其斜邊幾乎貼上第一塊稜鏡的斜邊,但保持極短的距離 (在穿透深度以內),就會有部分的光可以透入第二塊稜鏡並穿射而出。如此的雙稜鏡組合就構成一個分束器 (beam splitter),可以將一束光一分為二。適當調整兩個稜鏡的間隔距離,就可以兩束光的強度比。全反射現象有一個簡單的量子對應,那就是電子通過位能障礙 (potential barrier) 的量子穿隧效應 (quantum tunnelling effect)。這兩個現象的差別是:一維量子穿隧現象是電子從低位能區穿過高位能區進入另一個低位能區,而前述光學現象是從光密介質通過光疏介質進入另一個光密介質。此外,光學全反射的波是斜向入射的,其垂直於界面的波向量分量同時受頻率與入射角控制,而一維量子穿隧的波向量 (波數) 只受入射能量控制。最後,光的能量通量,對應的是量子的機率通量。

1693295973937_0.jpg

    以上所討論的各種波與量子系統現象都顯示虛數與複數在這類系統中非常有用。事實上,直接回答虛數有什麼物理意義是不太可能的,必須結合它們的使用場合才能判斷虛數或複數是怎麼被使用在物理描述裡的。讀者或許也注意到了,在這些關於虛數或複數的使用情況裡,公式中的實部與虛部經常是交互影響,無法一刀切割的。引入複數表達式不是為了標新立異,而是它確實能非常有效的幫助我們簡化計算並整合觀念。有關虛數的物理還有很多有趣的內容,尤其是在量子力學與其它高等物理方面。我們將來再回頭來談這個主題。

 1693295981492_0.jpg