FarPhys〜物理学と戯れて〜

物理学の解説をしているFarPhysのブログです!

四元数と回転変換

気になる話題・問題があればこちらからお願いします→お題箱(google from)

 

 

四元数の導入

我々はこれまで様々な数を用いて物理を記述してきた.特に複素数の導入は物理学の記述に大きな貢献をした.それまで独立に扱ってきたサイン・コサイン関数をオイラーの公式
$$
e^{i\theta}=\cos\theta+i\sin\theta
$$
を介して統一的に扱うことができるようになった.この$e^{i \theta}$という形はLie群,すなわち連続パラメータで指定されるような変換の表現である.物理学では回転やブースト,平行移動といった基本的な変換を記述する.そのような意味で複素数という存在は物理学の発展に不可欠だった.

では新たな「虚数単位」とも呼ぶべき$j$を導入して
$$
a_0+a_1i+a_2j\ (a_0,a_1,a_2\in\mathbb{R})
$$
という数を定義してはどうだろう.この試みが成功すれば,物理学に新たな表現方法が生まれるかもしれない.

しかし現実はそう簡単ではない.我々が扱う数は「群」でなければならないという要請がある.すなわち集合$G$の要素$a,b,c$に対して積の演算$\times$が定義できて,
$$\begin{align} & a\times b\in G\\ & {}^\exists 1\in G\ s.t.\ a\times 1=1\times a =a\\ & {}^\exists a^{-1}\in G\ s.t.\ a\times a^{-1}=a^{-1}\times a=1\,, {}^\forall a\\ &(a\times b)\times c=a\times(b\times c)=a\times b\times c\end{align}
$$
の4つの条件を満たしていなければならない.

さて,新たに導入した虚数単位$j$について考えよう.演算は閉じるので,
$$
ij = A+Bi+Cj\,,A,B,C\in \mathbb{R}
$$
が成り立っているはずだ.これに$i$をかけてみよう.ただし$ij=ji$であるとは認めていないので左からかける必要がある.
$$
(-1)j=Ai-B+Cij
$$
これを満たすような$A,B,C$は実は存在しない.計算してみると
$$
-j=Ai-B+C(A+Bi+Cj)\\
(CA-B)+(A+CB)i+(C^2+1)j=0
$$
となるのだが,これが成り立つためには定数項および$i,j$の係数がそれぞれ$0$である必要がある.しかし$j$の係数を見てみると
$$
C^2+1=0
$$
となっている.このような実数$C$は存在しないから,虚数単位$j$を導入して「三元数」とでも呼ぶべき数を構成することはできないのだ.

では,$j$だけではなく$k$という虚数単位も導入してはどうだろうか.このような数
$$
q=q_0+q_1i+q_2j+q_3k\ (q_0,q_1,q_2,q_3\in\mathbb{R})
$$
のことを「四元数 (quaternion)」という.虚数単位の積については次のように定める.
$$
i^2=j^2=k^2=-1\\
ij=-ji=k\,,jk=-kj=i\,,ki=-ik=j
$$
自身との積(2乗)が$-1$になっているのは非常に自然だろう.一方で自分以外との積の関係は,正規直交基底の外積の関係に似ていることがわかる.
$$
\begin{cases}
\mathbf{e}_1\times \mathbf{e}_2=-\mathbf{e}_2\times \mathbf{e}_1=\mathbf{e}_3\\
\mathbf{e}_2\times \mathbf{e}_3=-\mathbf{e}_3\times \mathbf{e}_2=\mathbf{e}_1\\
\mathbf{e}_3\times \mathbf{e}_1=-\mathbf{e}_3\times \mathbf{e}_1=\mathbf{e}_2
\end{cases}
$$
後で確認するが,実際に四元数の第1,2,3成分は基底$\{i,j,k\}$が張る3次元ベクトルの拡張である.

さて,このように虚数単位の積を定義すれば四元数が積の演算で閉じることは明らかである.一方で交換則
$$
qq'=q'q
$$
が成り立たないことも明らかである.

さて,四元数の積の構造を見るために,$q=q_0+q_1i+q_2j+q_3k$の$q_0$をスカラー部分,残りをベクトル部分と呼ぶことにする.さらにスカラー部分は$\alpha:=q$,ベクトル部分は$\mathbf{a}:=q_1i+q_2j+q_3k$と書くことにする.すると2つの四元数$q=\alpha+\mathbf{a}\,,q'=\beta+\mathbf{b}$の積は
$$
qq'=\alpha\beta +\alpha\mathbf{b}+\beta\mathbf{a}+\mathbf{ab}
$$
となる.最後のベクトル同士の積は正規直交基底での内積$\langle\mathbf{a},\mathbf{b}\rangle$と外積$\mathbf{a}\times\mathbf{b}$に対して
$$
\mathbf{ab}=-\langle\mathbf{a},\mathbf{b}\rangle+\mathbf{a}\times\mathbf{b}
$$
と書くことができる(各成分を書き下して計算すればそれがわかる).このことから四元数のベクトル部分は3次元ベクトルを拡張したものであるとわかるだろう.

共役・逆元・ノルム

四元数は群の構造を持つ.従って逆元が存在する.また,複素数の拡張であるから共役を考えることもできる.さらに四元数はベクトルの拡張と見なすこともできるので,ノルムも存在するはずだ.これらの3つについて考えていく.

まず共役な四元数であるが,複素数$a+ib$の共役が虚数単位$i$を$-i$に変える操作だと思えば,四元数$q=q_0+q_1i+q_2j+q_3k$の共役は
$$
q^\dagger=q_0-q_1i-q_2j-q_3k
$$
と定義されるのが自然だろう.では,共役と積の関係はどのようになっているだろうか.先ほどの$q=\alpha+\mathbf{a}\,,q'=\beta+\mathbf{b}$に対して,共役と積の演算を行ってみると
$$
\begin{align}
(qq')^\dagger &= (\alpha\beta+\alpha\mathbf{b}+\beta\mathbf{a}-\langle\mathbf{a},\mathbf{b}\rangle+\mathbf{a}\times\mathbf{b})^\dagger\\
&= (\alpha\beta-\langle\mathbf{a},\mathbf{b}\rangle)-(\alpha\mathbf{b}+\beta\mathbf{a}+\mathbf{a}\times\mathbf{b})\\
q'^\dagger q^\dagger &= (\beta-\mathbf{b})(\alpha-\mathbf{a})\\
&=\alpha\beta-\alpha\mathbf{b}-\beta\mathbf{a}+\mathbf{ba}\\
&= (\alpha\beta-\langle\mathbf{a},\mathbf{b}\rangle)-(\alpha\mathbf{b}+\beta\mathbf{b}-\mathbf{b}\times\mathbf{a})\\
&= (\alpha\beta-\langle\mathbf{a},\mathbf{b}\rangle)-(\alpha\mathbf{b}+\beta\mathbf{b}+\mathbf{a}\times\mathbf{b})\\
&= (qq')^\dagger
\end{align}
$$
となる.この$(qq')^\dagger=q'^\dagger q^\dagger$という共役の構造は,まさに行列のエルミート共役の構造と同じだ.さらに$q^{\dagger\dagger}=q$という関係も明らかであろう.

次に自己の共役との積を考えてみる.
$$
\begin{align}
qq^\dagger &=(\alpha+\mathbf{a})(\alpha-\mathbf{a})\\
&= q_0q_0-\mathbf{aa}\\
&= q_0q_0+\langle\mathbf{a},\mathbf{a}\rangle-\mathbf{a}\times\mathbf{a}\\
&= q_0^2+q_1^2+q_2^2+q_3^2\\
&=q^\dagger q
\end{align}
$$
すなわち,四元数のノルムは次で定義することができる.
$$
||q||:=\sqrt{qq^\dagger}=\sqrt{q^\dagger q}=\sqrt{q_0^2+q_1^2+q_2^2+q_3^2}
$$
これはベクトルのノルムと全く同じ定義である.

さてノルムの正定値性
$$
q\neq 0\to ||q||>0
$$
から,次の関係式が成り立つ.
$$
q\left(\frac{q^\dagger}{||q||^2}\right)=\left(\frac{q^\dagger}{||q||^2}\right)q=1
$$
すなわち,$q\neq 0$は逆元$q^{-1}$を持つことがわかる.​
$$
q^{-1}=\frac{q^\dagger}{||q||^2}
$$
Note. 四元数代数系は体である.

体とは「非零の元$g$が逆元を持ち,非零の元による割り算で閉じる」ような代数系である.実際に$q\neq 0$について,
$$
q'q=q''q\to q'=q''
$$
であることがわかる.しかしこれはベクトルの内積外戚だけでは成り立たない.実際,ベクトル$\mathbf{a}\neq\mathbf{0}$に対して
$$
\langle \mathbf{a},\mathbf{b\rangle}=\langle \mathbf{a},\mathbf{c\rangle}
$$
が成り立っていても,$\mathbf{b}\neq\mathbf{c}$となるように$\mathbf{b},\mathbf{c}$を選ぶことができる.外積についても同様である.しかし,$\mathbf{ab}=-\langle\mathbf{a},\mathbf{b}\rangle+\mathbf{a}\times\mathbf{b}$に対しては,
$$
\mathbf{a}\neq 0,\mathbf{ab}=\mathbf{ac}\to \mathbf{b}=\mathbf{c}
$$
が必ず成り立つのである.

四元数による回転の表現

ノルムが1であるような四元数,単位四元数$q$を考えよう.そして四元数とみなしたベクトル$\mathbf{a}$を$q$で変換する.
$$
\mathbf{a}\to \mathbf{a'}=q\mathbf{a}q^\dagger
$$
変換後の四元数の共役を取ると$(q\mathbf{a}q^\dagger)^\dagger =q\mathbf{a}^\dagger q^\dagger=-q\mathbf{a}q^\dagger$であるから,$\mathbf{a'}$はベクトルであることがわかる.さらにノルムは
$$
\begin{align}
||\mathbf{a'}||^2 &= \mathbf{a'a'}^\dagger=q\mathbf{a}q^\dagger q\mathbf{a}^\dagger q^\dagger\\
&= q\mathbf{aa}^\dagger q^\dagger\\
&= ||\mathbf{a}||^2
\end{align}
$$
であり変換の前後で変化しないことがわかる.すなわち,単位四元数$q$による変換は,回転もしくは鏡映であることがわかる.実際には鏡映を含まない,純粋な回転を表す.このことを証明しよう.

その前に幾何学的なベクトルの回転を考える.任意のベクトル$\mathbf{a}$を単位ベクトル$\mathbf{n}$の周りで角度$\chi$だけ回転させるとどのようになるだろうか.これはロドリグの公式(Rodrigues Formula)で与えられる:
$$
\mathbf{a}\to \mathbf{a'}=\mathbf{a}\cos\chi+\mathbf{n}\times\mathbf{a}\sin\chi+\langle\mathbf{a},\mathbf{n}\rangle\mathbf{n}(1-\cos\chi)
$$

四元数によるベクトルの変換で,これと同じ式が得られるだろうか?まず,
$$
q_0^2+q_1^2+q_2^2+q_3^2 =1
$$
という条件から,次を満たすような$\chi$が存在する.
$$
q_0=\cos\frac{\chi}{2}\,,\sqrt{q_1^2+q_2^2+q_3^2}=\sin\frac{\chi}{2}
$$
この時,元の四元数は$q$のベクトル部分$q_1i+q_2j+q_3k$に平行な単位ベクトル$\mathbf{n}$を用いて
$$
q=\cos\frac{\chi}{2}+\mathbf{n}\sin\frac{\chi}{2}
$$
と書くことができる.この時,ベクトル$\mathbf{a}$の変換は次のようになる.
$$
\begin{align}
q\mathbf{a}q^\dagger &= \left(\cos\frac{\chi}{2}+\mathbf{n}\sin\frac{\chi}{2}\right)\mathbf{a}\left(\cos\frac{\chi}{2}-\mathbf{n}\sin\frac{\chi}{2}\right)\\
&= \mathbf{a}\cos^2\frac{\chi}{2}+(\mathbf{na}-\mathbf{an})\sin\frac{\chi}{2}\cos\frac{\chi}{2}-\mathbf{nan}\sin^2\frac{\chi}{2}
\end{align}
$$
ただし,
$$
\begin{align}
\mathbf{na}-\mathbf{an} &= 2\mathbf{n}\times \mathbf{a}\\
\mathbf{nan} &= \mathbf{n}(-\langle\mathbf{a},\mathbf{n}\rangle+\mathbf{a}\times\mathbf{n})\\
&= -\mathbf{n}\langle\mathbf{a},\mathbf{n}\rangle-\langle\mathbf{n},\mathbf{a}\times\mathbf{n}\rangle+\mathbf{n}\times(\mathbf{a}\times\mathbf{n})\\
&= -\mathbf{n}\langle\mathbf{a},\mathbf{n}\rangle+\mathbf{a}||\mathbf{n}||^2-\mathbf{n}\langle\mathbf{a},\mathbf{n\rangle}\\
&= -2\mathbf{n}\langle\mathbf{a},\mathbf{n}\rangle +\mathbf{a}||\mathbf{n}||^2
\end{align}
$$
である.このことから,変換後のベクトルは
$$
\begin{align}
q\mathbf{a}q^\dagger &=\mathbf{a}\left(\cos^2\frac{\chi}{2}-\sin^2\frac{\chi}{2}\right)+2\mathbf{n}\times\mathbf{a}\sin\frac{\chi}{2}\cos\frac{\chi}{2}+2\mathbf{n}\langle\mathbf{a},\mathbf{n}\rangle\sin^2\frac{\chi}{2}\\
&=\mathbf{a}\cos\chi+\mathbf{n}\times\mathbf{a}\sin\chi+\mathbf{n}\langle\mathbf{a},\mathbf{n}\rangle(1-\cos\chi)
\end{align}
$$
となって,確かにロドリグの公式に一致していることがわかる.このことから四元数$q$によるベクトルの変換は回転変換であることがわかる.

別の考え方によって四元数による変換が純粋な回転であることを確認することもできる.単位四元数$q$について,その条件$||q||=1$を保ったまま,
$$
q_0\to \pm 1,q_i\to0\ (i=1,2,3)
$$
という恒等変換に移すことができる.このことから,単位四元数による変換は連続パラメータで指定される,回転であることがわかる.

単位四元数による変換が回転であることがわかったところで,2つの回転変換を連続的に行うことを考えてみよう.抽象的に回転変換を$\mathcal{R}$と表現し,ベクトル$\mathbf{a}$から$\mathbf{a'}$への変換を
$$
\mathcal{R}:\mathbf{a}\to \mathbf{a'}=\mathcal{R}(\mathbf{a})
$$
とする.さらに$\mathcal{R}$に続けて$\mathcal{R'}$という変換を施す変換を$\mathcal{R'}\circ\mathcal{R}$と表現する.このとき,
$$
\begin{align}
\mathcal{R'}\circ\mathcal{R}:\mathbf{a}\to \mathbf{a'}&:=\mathcal{R'}\circ\mathcal{R}(\mathbf{a})\\
&= q'(q\mathbf{a}q^\dagger)q'^\dagger\\
&= (q'q)\mathbf{a}(q'q)^\dagger
\end{align}
$$
が成り立つことがわかる.すなわち,回転$\mathcal{R}$の四元数による表現を
$$
\mathcal{D}^\mathrm{quat.}(\mathcal{R})=q\,,\mathcal{D}^\mathrm{quat.}(\mathcal{R'})=q'
$$
と書く時,連続した回転の表現は次を満たす.
$$
\mathcal{D}^\mathrm{quat.}(\mathcal{R'\circ\mathcal{R}})=q'q=\mathcal{D}^\mathrm{quat.}(\mathcal{R'})\mathcal{D}^\mathrm{quat.}(\mathcal{R})
$$
すなわち,回転変換の四元数による表現は準同型(積と表現が可換)である.

余談

例えば2次正方行列
$$
U=\left(\begin{matrix}q_0-iq_3 & -q_2-iq_1\\ q_2-iq_1 & q_0+iq_3\end{matrix}\right)
$$
四元数の表現になっている.実際,行列の積
$$
\left(\begin{matrix}q''_0-iq''_3 & -q''_2-iq''_1\\ q''_2-iq''_1 & q''_0+iq''_3\end{matrix}\right)=\left(\begin{matrix}q'_0-iq'_3 & -q'_2-iq'_1\\ q'_2-iq'_1 & q'_0+iq'_3\end{matrix}\right)\left(\begin{matrix}q_0-iq_3 & -q_2-iq_1\\ q_2-iq_1 & q_0+iq_3\end{matrix}\right)
$$
四元数の積
$$
(q''_0+q''_1+q''_2+q''_3)=(q'_0+q'_1+q'_2+q'_3)(q_0+q_1+q_2+q_3)
$$
は同値である.というのも,行列$U$を
$$
\begin{align}
U&=q_0\left(\begin{matrix}1 & 0\\ 0&1\end{matrix}\right)+q_1\left(\begin{matrix}0 & -i\\ -i&0\end{matrix}\right)+q_2\left(\begin{matrix}0 & -1\\ 1&0\end{matrix}\right)+q_3\left(\begin{matrix}-i & 0\\ 0&i\end{matrix}\right)\\
&=q_0\mathbf{1}_2+q_1S_1+q_2S_2+q_3S_3
\end{align}
$$
と書き表すと,行列$\mathbf{1}_2,S_1,S_2,S_3$が四元数の「基底」$1,i,j,k$と同じ関係式
$$
S_1^2=S_2^2=S_3^2=-\mathbf{1}_2\\
S_1S_2=-S_2S_1=S_3\,,S_2S_3=-S_3S_2=S_1\,,S_3S_1=-S_1S_3=S_2
$$
を満たすからである.さらに,ここで導入した行列$S_1,S_2,S_3$であるが,無限小回転の表現であるパウリ行列を用いれば

{S_1=-i\sigma^1,S_2=-i\sigma^2,S_3=-i\sigma^3}

と書くことができる.このことからも四元数が回転と密接に結びついていることがわかるだろう(終)

対称性の話をしよう。

気になる話題・問題があればこちらからお願いします→お題箱(google from)

目次

1. 様々な対称性

私たちが見ることのできるこの世界には.様々な「対称性」を持ったものが存在する.鏡に映る自分の姿は左右が反転された像だ.これは「反転対称」「鏡映」という.球は回転対称性を持つ.しかもどのように軸をとっても対称性がある.日本の伝統的な染物に見られる七宝は,ある特定の方向に特定の距離だけ動かすと元の模様に戻る.これは「並進対称」だ.

https://frame-illust.com

さらに,私たちが馴染みのある数学の世界にも対称性が存在する.「対称式」はその一例で,$x^2+y^2$などのように変数を入れ替えても式が変わらないものを言う.さらにこの対称式には面白い性質があり,基本対称式と呼ばれる低い次数の対称式を用いて表すことができるのだ.この話は本筋から外れるのでこの程度にしておくが,対称性を数学的に見ると幾つか面白い性質が現れることが期待できる.

それでは物理の話に移ろう.

2. 古典力学の対称性〜ネーターの定理〜

ここでは力学を記述する方法として「ラグランジュ形式」を用いる.高校物理まではニュートン運動方程式$F=ma$に基づく「ニュートン形式」を用いて物理を表現してきた.しかしこの方法は座標の取り方に大きくよるため,一般性が低い.そこで座標に依存しない運動エネルギー$K$とポテンシャル$V$から定義されるラグランジアン$L=K-V$で物理を表現するのがラグランジュ形式である.ラグランジュ形式での運動方程式
$$\frac{d}{dt}\frac{\partial L}{\partial \dot{q}}-\frac{\partial L}{\partial q}=0$$
という「オイラーラグランジュ方程式」である.なお,ラグランジアンは「一般化座標$q$」とその時間微分$\dot{q}$及び時間の関数である.

ネーターの定理とは,無限小変換に対して系が不変量である時,その無限小変換に対応する「保存量」が存在するという定理である.具体的には,時間と一般化座標の無限小変換$$\begin{align} t\to t+\delta t\,,q^i\to q^i+\delta q^i\end{align}$$について,無限小変換がパラメータ$\epsilon$と用いて$$\delta t=\epsilon T\,, \delta q^i =\epsilon Q^i$$と書かれる時,$X$という物理量$$X=\left(\frac{\partial L}{\partial \dot{q}^i}\dot{q}^i-L\right)T-\frac{\partial L}{\partial \dot{q}^i}Q^i$$が存在して,これが保存量$$\frac{dX}{dt}=0$$になる.

これを自由粒子に対して考えよう.自由粒子ではポテンシャル$V=0$であるから,ラグランジアンは粒子の質量を$m\,$ として
$$L=\sum_{i=1,2,3}\frac{1}{2}m{\dot{q}^i}^2$$
で書ける.このラグランジアンに,「並進対称性」を要求しよう.すなわち,ベクトル$\mathbf{n}=(n^1,n^2,n^3)$方向への無限小の並進変換
$$q^i\to q^i+\epsilon n^i$$
に対してラグランジアンが不変であるということである.これを先程の式に代入して$X$を求めると,
$$X=\sum_{i=1,2,3}-m\dot{q}^in^i$$
である.ただし$\mathbf{n}$は任意に選んで良いので,結局のところ$m\dot{q}$すなわち「運動量が保存量」となることがわかる.

次に,ラグランジアンが時間発展しても変化しないことを要請しよう.これは「時間発展対称性」という.無限小変換は
$$t\to t+\epsilon T$$
であり,$X$は

$$X=\sum_{i=1,2,3}\left(m{\dot{q}^i}^2-\frac{1}{2}m{\dot{q}^i}^2\right)T =T\sum_{i=1,2,3}\frac{1}{2}m{\dot{q}^i}^2$$

このように,系にある対称性を要請するとそれに対応する何らかの物理量が保存量になることがわかる.しかし,対称性と保存量の関係はまだ顕ではない.この話は「4. 量子力学の対称性」で詳しく見ることにしよう.

3. マクスウェル方程式の対称性と因果律

マクスウェル方程式は,電磁気学の根幹をなす方程式で,以下の4つの式からなる. $$\begin{align} &\nabla\cdot \mathbf{E}=\frac{\rho}{\varepsilon_0}\\&\nabla\cdot \mathbf{B}=0\\ &\nabla\times \mathbf{E}+\frac{\partial\mathbf{B}}{\partial t}=0 \\ &\nabla\times \mathbf{B}=\mu_0\mathbf{j}+\mu_0\varepsilon_0\frac{\partial\mathbf{E}}{\partial t} \end{align}$$ さらに電荷保存則(連続の方程式)$$\frac{\partial\rho}{\partial t}+\nabla\cdot\mathbf{j}=0$$という式も成り立つ.

さて,電流$\mathbf{j}$というのは荷電粒子の流れ($\mathbf{j}=e\mathbf{v}$)であるから,「時間反転」をすると逆向きになることがわかる.そして電場$\mathbf{E}$は電荷が存在することによって生まれるから,時間反転に対して対称であるだろう.一方で磁場は電流から造られるので,時間反転に対して反対称(逆向きになる)だと考えられる.これらのことをまとめてみると
$$\begin{cases} \mathbf{j}\to \mathbf{j'}=-\mathbf{j}\\ \mathbf{E}\to \mathbf{E'}=\mathbf{E}\\ \mathbf{B}\to \mathbf{B'}=-\mathbf{B}\end{cases}$$だ.これを元にマクスウェル方程式を時間反転させてみよう.もちろん$t\to -t$と変換されるから,結局のところ元の形を保つ.マクスウェル方程式は時間反転対称なのである.

マクスウェル方程式が時間反転対称性を持つことを如実に示しているのが「先進・遅延ポテンシャル」の存在である.マクスウェル方程式から電場と磁場を求めようと思っても(実際に求めるのは「電磁ポテンシャル」),いくつか自由度が残っている.そこで新たに拘束条件を加えてマクスウェル方程式を解く.ローレンツ・ゲージと呼ばれる条件を与えるときに得られるのが「先進・遅延ポテンシャル」であり,
$$\begin{align} A(\mathbf{x},t) &= \frac{\mu_0}{4\pi}\int \frac{\mathbf{j}(\mathbf{s},t\pm|\mathbf{x-s}|/c)}{|\mathbf{x-s}|}\cdot d\mathbf{s}\\ \varphi(\mathbf{x},t)&=\frac{\mu_0}{4\pi}\int \frac{\rho(\mathbf{s},t\pm|\mathbf{x-s}|/c)}{|\mathbf{x-s}|}d\mathbf{s}\end{align}$$という式でかける.ここで注目すべきは被積分関数内の$\mathbf{j},\rho$の時間依存である.$$t\pm\frac{|\mathbf{x-s}|}{c}$$という形になっているのだ.これは,座標$\mathbf{x}$,時刻$t$でのポテンシャルが,座標$\mathbf{s}$,時刻$t\pm|\mathbf{x-s}|/c$の電流・電荷分布に影響を受けていることを意味している.複号の$-$については,距離$|\mathbf{x-s}|$だけ隔たった場所の昔の情報が今に影響している,と解釈できる.これが「遅延ポテンシャル」というものだ.一方で複号の$+$,「先進ポテンシャル」についての解釈は厄介だ.距離$|\mathbf{x-s}|$だけ隔たった場所の今後の情報が今に影響している,という解釈になるからである.今の物理状態が未来の物理状態に影響を受けるということはありえないだろう.

先進ポテンシャルはこのような物理的に納得できない解釈を生むので「あり得ない」という理由で棄却される.しかし,そのような事態に陥るのはそもそもマクスウェル方程式が時間反転対称性を持ち,時間が逆行しても問題ない形をしているからである.

電磁気学の基本方程式は,「Aが起こったからBが起きた」というような因果律を含まない,美しい対称性を持つが少々厄介な方程式なのである.

4. 量子力学の対称性

量子力学を記述するのはシュレディンガー方程式であるが,そのベースには古典力学の「ハミルトン形式」がある.ラグランジュ形式でのラグランジアンのように,ハミルトン形式には物理を表す量としてハミルトニアンがある.それはラグランジアンの「ルジャンドル変換」で与えられる.
$$
H=\sum_{i}p_i\dot{q}^i-L=\frac{1}{2m}p^2+V
$$
量子力学でのハミルトニアンは,運動量演算子$\hat{p}$とポテンシャル$V$に対して
$$
H=\frac{1}{2m}\hat{p}^2+V
$$
で書ける.古典力学ハミルトニアンと形が同じなのである.

さて,量子力学において連続パラメータ$\theta$で指定されるような変換(回転や並進)は,それに対応する「生成元」と呼ばれる演算子$\hat{G}$に対して
$$\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)$$で与えられることが知られている.これを波動関数に演算させることによって,変換された波動関数が得られるというわけだ.では,波動関数がこの演算(変換)に対して不変であるとはどういうことだろうか.波動関数を$\psi$と書くことにすると,これは(時間に依存しない)シュレディンガー方程式$$H\psi=E\psi$$を満たしている.ここでの$E$はエネルギー固有値で,$\psi$は固有関数になっている.この$\psi$に対して変換を行うと$$\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)\psi=e^{i\delta}\psi$$となる.ここで$e^{i\delta}$は波動関数の位相である.物理的に意味を持つのは$|\psi|^2$という「確率密度」であるから,ここでは位相の違いは特に意味を持たない.なので$e^{i\delta}=1$として議論を進めよう.
この式に左から$H$を演算させると,$$H\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)\psi=H\psi=E\psi$$となる.このことから,$$\begin{align} H\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)\psi=\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)H\psi\\ \therefore H\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)=\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)H\end{align}$$であることがわかる.交換関係の記号を用いるなら$$\left[H,\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)\right]=0$$である.ここで,$\exp$が冪級数で展開できることを思い出すと,この交換関係は$$[H,\hat{G}]=0$$に帰着する.つまり,ハミルトニアンと交換可能(可換)な演算子を生成元とする連続的な変換では,波動関数は不変なのである.さらに,ハイゼンベルグ方程式と呼ばれる方程式$$i\hbar\frac{\partial \hat{A}}{\partial t}=[H,\hat{A}]$$から,ハミルトニアンと可換な演算子(に対応する物理量)は保存量なのである.要は系を不変に保つ変換の生成元が保存量であるということだ.

並進対称演算子の生成元は運動量演算子である.また,時間発展演算子の生成元はハミルトニアン(エネルギーの演算子)である.このようなことは,「2. 古典力学の対称性〜ネーターの定理〜」の最後に確認した事実と一致していることがわかるだろう.

5. 対称性の破れ

量子力学は物理の終着点ではない.その一歩先に「場の理論」というものが存在する.これは量子力学を相対論的に扱った先に登場する物理の記述である.

そこで重要となる対称性が,チャージ対称性(C対称性),パリティ対称性(空間反転対称性,P対称性),時間反転対称性(T対称性)とその組み合わせである.

1950年代までに,C対称性とP対称性はそれぞれ破れていることが指摘されていた.その一方でCP対称性は破れていないのではないかと思われていた.しかし1964年に,K中間子の崩壊の観測からCP対称性も僅かに破れていることが明らかになる.そしてこのCP対称性の破れを理論的に説明するには,クオークに3つの世代が必要であることが小林・益川によって指摘された.1973年のことである.

1995年までに未発見だった3つのクオーク(チャーム・ボトム・トップ)が見つかり,2008年には小林・益川両氏にノーベル賞が授与された.

現在ではT変換を含めたCPT対称性が成り立っているのではないかと考えられている.もしCPT対称性すら破れていると,特殊相対性理論の礎となっている「ローレンツ対称性」も自動的に破れることになると指摘されている.

物理には様々な「対称性」が存在し,それらが相互に絡み合っている.物理現象を統一的に説明する「究極の理論」があるのならば,そこには美しい対称性があってほしいと思うのが物理学者だろう.

今まさに「究極の理論」の探索が,理論・実験の両方で行われている.この世界はどのような対称性を持っているのだろうか.そこに広がる理論はどのようなものなのだろうか.明らかになるのが待ち遠しい.(終)

縮退のある摂動

気になる話題・問題があればこちらからお願いします→お題箱(google from)

前回の記事はこちら↓↓↓

 

fartherphysics.hatenablog.com

 

前回、時間依存しないSchrödinger方程式を冪級数展開で解きましたが、「縮退のない場合」に限った議論でした。では、縮退のある系はどのように扱えば良いのでしょうか。

縮退のある場合の摂動論

縮退がある系に対しての議論で問題になるのは、状態の摂動展開を計算する際に$$(E_k^{(0)}-E_n^{(0)})\langle k^{(0)}|n^{(1)}\rangle =-\delta H_{kn}$$という形になってしまい、内積不定になってしまう点である。これを上手い具合に回避するために、縮退している部分とそうではない部分に分けて考えるのが良いだろう。
まず、元のHamiltonianに対するエネルギー固有値を$$…<E_{n-1}<\underbrace{E_{n}=E_{n}=…=E_{n}}_{N}<E_{n+1}<…$$とする。すなわち$N$個の状態が縮退しているのである。この縮退している状態が張る空間を$V_N$、それ以外の縮退していない状態が張る空間を$\tilde{V}$と表記する。そして、縮退している状態は区別できるように$$|n^{(0)};1\rangle ,|n^{(0)};2\rangle ,…,|n^{(0)};N\rangle\in V_N\\H^{(0)}|n^{(0)};k\rangle =E_n^{(0)}|n^{(0)};k\rangle$$と書く。さらに正規直交条件を課しておく。$$\langle n^{(0)};p|n^{(0)};q\rangle =\delta _{p,q}$$また、二つの空間の和は全状態空間を張る:$\mathcal{H}=V_N\oplus \tilde V$。もちろんであるが、$V_N$と$\tilde V$は直交している:$$\langle p^{(0)}|n^{(0)};k\rangle =0$$さて、我々が求めていくのは状態とエネルギーの摂動展開である。すでに見たように、$$\begin{align} |n^{(0)};k\rangle \to |n,k\rangle &=|n^{(0)};k\rangle +\lambda|n^{(1)};k\rangle +\lambda^2|n^{(2)};k\rangle +…\\ E_n^{(0)}\to E_n &= E_{n}^{(0)}+\lambda E_{n,k}^{(1)}+\lambda^2 E_{n,k}^{(2)}+…\end{align}$$と書くことができ、これをSchrödinger方程式に代入することによって次々に状態とエネルギーを計算する。ただし、考えるのは縮退した状態$|n;k\rangle$だけで良い。というのも、縮退のない空間$\tilde V$についてはすでに議論が済んでいて、縮退のある場合に生じてきた問題を解決するのがここでの目標だからである。
さて、Schrödinger方程式に上記の冪級数を代入して$\lambda$について整理したものは、摂動のない場合と同様に$$\begin{align} \mathrm{O}(\lambda^0) &: (H^0-E_n^{(0)})|n^{(0)};k\rangle =0\\ \mathrm{O}(\lambda^1) &: (H^0-E_n^{(0)})|n^{(1)};k\rangle =(E_{n,k}^{(1)}-\delta H)|n^{(0)};k\rangle\\ \mathrm{O}(\lambda^2) &: (H^0-E_n^{(0)})|n^{(2)};k\rangle =(E_{n,k}^{(1)}-\delta H)|n^{(1)};k\rangle +E_{n,k}^{(2)}|n^{(0)};k\rangle\\ \vdots\end{align}$$とかける。具体的な計算ステップは次の通りである。

1. $\mathcal{O}(\lambda^1)$の式に左から$\langle n^{(0)};l|$を作用させて、エネルギーの1次摂動を計算する。
2. $\mathcal{O}(\lambda^1)$から$|n^{(1)};k\rangle$の$\tilde{V}$空間成分を計算する。
3. $\mathcal{O}(\lambda^2)$の式に左から$\langle n^{(0)};l|$を作用させて、エネルギーの2次摂動と$|n^{(1)};k\rangle$の$V_N$空間成分を計算する。

Step 1

$\mathcal{O}(\lambda^1)$の式に左から$\langle n^{(0)};l|$を作用させると、やはり左辺は$0$になる。一方で右辺について考えると$$\begin{align} \mathrm{RHS}&=\langle n^{(0)};l|(E_{n,k}^{(1)}-\delta H)|n^{(0)};k\rangle\\ &=E_{n,k}^{(1)}\delta_{l、k}-\langle n^{(0)};l|\delta H|n^{(0)};k\rangle\\ \therefore &\langle n^{(0)};l|\delta H|n^{(0)};k\rangle=E_{n,k}^{(1)}\delta_{l、k}\end{align}$$となる。つまり、$\delta H$の$V_N$空間での行列要素$\langle n^{(0)};l|\delta H|n^{(0)};k\rangle\equiv \delta H_{nl,nk}$は$l\neq k$の要素(非対角要素)が全て$0$になる、対角行列なのである*1。また、エネルギーの一次摂動は$$E_{n,k}^{(1)}=\delta H_{nk,nk}$$であることがわかった。

Step 2

$\mathcal{O}(\lambda^1)$の式に左から$\langle p^{(0)}|\in \tilde{V}$をかける。すると$$\begin{align} \langle p^{(0)}|(H^{(0)}-E_n^{(0)})|n^{(1)};k\rangle &=\langle p^{(0)}|(E_{n,k}^{(1)}-\delta H)|n^{(0)};k\rangle\\ (E_p^{(0)}-E_n^{(0)})\langle p^{(0)}|n^{(1)};k\rangle &=-\langle p^{(0)}|\delta H|n^{(0)};k\rangle\end{align}$$となる。ただし$\langle p^{(0)}|n^{(0)};k\rangle=0\ (\tilde{V}\perp V_N)$を用いた。従って$$(E_p^{(0)}-E_n^{(0)})\langle p^{(0)}|n^{(1)};k\rangle =-\delta H_{p,nk}$$を得る。なお、これは$|n^{(1)};k\rangle$の$\tilde V$空間の基底による展開である。従って、$V_N$空間の基底と$|n^{(1)};k\rangle$との内積については何も述べていない。これに注意して$|n^{(1)};k\rangle$の展開を考えると、$$\begin{align} |n^{(1)};k\rangle &=\sum_p |p^{(0)}\rangle \langle p^{(0)}|n^{(1)};k\rangle +\left.|n^{(1)};k\rangle\right|_{V_N}\\ &=-\sum_p \frac{\delta H_{p,nk}}{E_p^{(0)}-E_n^{(0)}}|p^{(0)}\rangle +\left.|n^{(1)};k\rangle\right|_{V_N}\end{align}$$となるのである。この段階では$|n^{(1)};k\rangle$の$V_N$空間にある状態について何もわかっていない。これを求めるのが次のStep 3である。

Step 3

$\mathrm{O}(\lambda^2)$の式に左から$\langle n^{(0)};l|$を作用させる。やはり左辺は$0$になる。右辺は$$\begin{align} \mathrm{RHS} &= \langle n^{(0)};l|(E_{n,k}^{(1)}-\delta H )|n^{(1)};k\rangle +E_{n,k}^{(2)}\langle n^{(0)};l|n^{(0)};k\rangle\\ &= \langle n^{(0)};l|(E_{n,k}^{(1)}-\delta H)\left(-\sum_p \frac{\delta H_{p,nk}}{E_p^{(0)}-E_n^{(0)}}|p^{(0)}\rangle +\left.|n^{(1)};k\rangle\right|_{V_N}\right)+E_{n,k}^{(2)}\delta _{l、k}\end{align}$$である。さらに、$\langle n^{(0)};l|\delta H$を展開すると$$\begin{align} \langle n^{(0)};l|\delta H &= \langle n^{(0)};l|E_{n,l}^{(1)}+\sum_p \langle n^{(0)};l|p^{{(0)}}\rangle \langle p^{(0)}|\end{align}$$となる(注1を参照)。従って$$\left.\langle n^{(0)};l|\delta H|n^{(1)};k\rangle\right|_{V_N}=\left.E_{n,l}^{(1)}\langle n^{(0)};l|n^{(1)};k\rangle\right|_{V_N}$$を得る。これらのことから、$\mathcal{O}(\lambda^2)$の式は展開して整理すると次のようになる。$$\sum_p \frac{\delta H_{p,nk}}{E_p^{(0)}-E_n^{(0)}}\underbrace{\langle n^{(0)};l|\delta H|p^{(0)}\rangle}_{\delta H_{nl,p}}+(E_{n,k}^{(1)}-E_{n,l}^{(1)})\left.\langle n^{(0)};l|n^{(1)};k\rangle \right|_{V_N}+E_{n,k}^{(2)}\delta _{l、k}=0$$$l=k$を考えれば$E_{n,k}^{(2)}$がわかる。$$E_{n,k}^{(2)}=-\sum_p \frac{|\delta H_{p,nk}|^2}{E_p^{(0)}-E_n^{(0)}}$$一方で$k\ne l$について考えると、$$\left.\langle n^{(0)};l|n^{(1)};k\rangle\right|_{V_N} =-\frac{1}{E_{n,k}^{(1)}-E_{n,l}^{(1)}}\sum_p\frac{\delta H_{p,nk}\delta H_{nl,p}}{E_p^{(0)}-E_n^{(0)}}$$となる。よって$\left.|n^{(1)};k\rangle\right|_{V_N}$がわかる。$$|\left.n^{(1)};k\rangle \right|_{V_N}=-\sum_{l\ne k}|n^{(0)};l\rangle \frac{1}{E_{n,k}^{(1)}-E_{n,l}^{(0)}}\sum_p \frac{\delta H_{p,nk}\delta H_{nl,p}}{E_p^{(0)}-E_n^{(0)}}$$以上から、状態の1次摂動は次のようにかける。$$|n^{(1)};k\rangle =\sum_p \frac{\delta H_{p。nk}}{E_p^{(0)}-E_n^{(0)}}|p^{(0)}\rangle --\sum_{l\ne k}|n^{(0)};l\rangle \frac{1}{E_{n,k}^{(1)}-E_{n,l}^{(0)}}\sum_p \frac{\delta H_{p,nk}\delta H_{nl,p}}{E_p^{(0)}-E_n^{(0)}}$$

*1:$\delta H$は$V_N$空間では対角化されているが、全体の状態空間$\mathcal{H}$では対角化されておらず、$\tilde{V}$空間では非対角要素が残っている。$\mathcal{H}$空間で$\delta H|n^{(0)};l\rangle$を計算すると、$\delta H|n^{(0)};l\rangle =E_{n,l}^{(1)}|n^{(0)};l\rangle+\sum_{p}|p^{(0)}\rangle\langle p^{(0)}|\delta H|n^{(0)};l\rangle$となって余分な項が出てきているのがわかる

縮退のない摂動論

気になる話題・問題があればこちらからお願いします→お題箱(google from)

今回は、量子力学の計算において重要な「摂動論」について話をしていきます。波動関数(状態)はSchrödinger方程式を満たし、それを解くことによって状態を決めることができるのですが、その計算は非常に大変です。ほとんどの系は厳密解を求めることができず、近似解を求めることになります。その近似解を求める手法がこの摂動論です。

摂動論ではHamiltonianが時間に依存しているか、縮退があるかによってとる手法が異なってきます。今回は最も簡単な、Hamiltonianが時間依存せず、縮退のない場合を考えます。

 ---

Hamiltonianを次のように書く。
$$
H(\lambda)=H^{(0)}+\lambda \delta H
$$
ただし$H^{(0)}$ は非摂動項で、そのエネルギー固有値・固有状態はわかっているとする。$\lambda\delta H$が摂動項であるが、$\lambda\in[0,1]$を導入することによって
$$
\begin{cases}
\lambda =0 &:H=H^{(0)}…既知の系\\
\lambda =1 &:H=H^{(0)}+\delta H…計算したい系
\end{cases}
$$
となる。また、摂動Hamiltonian $\delta H$が大きい値を持っていたとしても、非常に小さい$\lambda$を選べば摂動論として近似的に取り扱うことができるようになる。

$H^{(0)}$のよく知っている固有状態を
$$
|k^{(0)}\rangle :k=0,1,2,...
$$
とかく。ただし規格化条件は
$$
\langle k^{(0)}|l^{(0)}\rangle =\delta_{kl}
$$
とする(正規直交条件)。この時の時間に依存しないSchrödinger方程式はエネルギー固有値$E_k^{(0)}$に対して
$$
H^{(0)}|k^{(0)}\rangle =E_k^{(0)}|k^{(0)}\rangle
$$
であるが、$k$の取り方としてエネルギーを昇順にするように選ぶ。ただし今は縮退がない場合を取り扱っているので
$$
E_0^{(0)}< E_1^{(0)}< …
$$
となる。摂動論において我々が計算したいのは、「$E$が$\lambda$に対してどのように変化するか?」ということである。では、摂動項を含んだSchrödinger方程式を扱っていこう。
$$
H(\lambda)|n\rangle_\lambda =E_n(\lambda )|n\rangle_\lambda
$$
ただし、$|n\rangle_\lambda\,,E_n(\lambda)$は次のような$\lambda$の冪級数で定義する。
$$
\begin{align}
|n\rangle_\lambda &=|n^{(0)}\rangle +\lambda |n^{(1)}\rangle +\lambda^2|n^{(2)}\rangle +…\\
E_n(\lambda) &=E_n^{(0)}+\lambda E_n^{(1)}+\lambda^2E_n^{(2)}+…
\end{align}
$$
これを先程のSchrödinger方程式に代入すると
$$
\begin{align}
&(H^{(0)}+\lambda \delta H-E_n(\lambda))|n\rangle_\lambda =0\\
\rightarrow& \left[(H^{(0)}-E_n(\lambda))-\lambda (E_n^{(1)}-\delta H)-\lambda^2E_n^{(2)}-…-\lambda^kE_n^{(k)}-…\right]\left(|n^{(0)}\rangle +\lambda|n^{(1)}\rangle +\lambda^2|n^{(2)}\rangle +…\right)=0
\end{align}
$$
となる。$\lambda$というのは$0\sim1$の任意の数であったから、$\lambda$について整理するとその係数は全て$0$になるはずである。従って
$$
\begin{align}
\mathcal{O}(\lambda^0) &:(H^{(0)}-E_n^{(0)})|n^{(0)}\rangle =0\\
\mathrm{O}(\lambda^1) &:(H^{(0)}-E_n^{(0)})|n^{(1)}\rangle =(E_n^{(1)}-\delta H)|n^{(0)}\rangle\\
\vdots\\
\mathcal{O}(\lambda^i) &:(H^{0}-E_n^{(0)})|n^{(i)}\rangle =(E_n^{(1)}-\delta H)|n^{(i-1)}\rangle +E_n^{(2)}|n^{(i-2)}\rangle +…+E_n^{(i)}|n^{(0)}\rangle
\end{align}
$$
という一連の式を得る。この式を元にしてエネルギー固有値・固有状態を決定していく。ただし$\mathcal{O}(\lambda^0)$は摂動のない元々のSchrödinger方程式であるので特に面白みはない。

まず、摂動によって現れる状態$|n^{(1)}\rangle、|n^{(2)}\rangle…$の規格化条件を$\langle n^{(0)}|n^{(k)}\rangle =0,k=1,2,…$としておく。すなわち、摂動によって現れる状態は、元々の状態とは直交しているとするのである。*1

エネルギーの1次摂動と一般形

$\mathcal{O}(\lambda^1)$について考える。左から$\langle n^{(0)}|$をかけると、
$$
\begin{align}
\langle n^{(0)}|(H^{(0)}-E_n^{(0)})|n^{(1)}\rangle &= \langle n^{(0)}|(E_n^{(1)}-\delta H)|n^{(0)}\rangle\\
0 &=E_n^{(1)}-\langle n^{(0)}|\delta H|n^{(0)}\rangle
\end{align}
$$
となる。ただし左辺は$\langle n^{(0)}|H^{(0)}=\langle n^{(0)}|E_n^{(0)}$であるから$0$になる。すなわちエネルギーの一次摂動が
$$
E_n^{(1)}=\langle n^{(0)}| \delta H|n^{(0)}\rangle
$$
であることがわかった。

さらに一般の$\mathcal{O}(\lambda^k)$についても同様にして求めることができる。左から$\langle n^{(0)}|$をかけるとやはり左辺は0になり、右辺は
$$
\begin{align}
\mathrm{RHS} &= \langle n^{(0)}|(E_n^{(1)}-\delta H)|n^{(i-1)}\rangle +E_n^{(2)}\langle n^{(0)}|n^{(i-2)}\rangle +…+E_n^{(i)}\langle n^{(0)}|n^{(0)}\rangle \\
&= -\langle n^{(0)}|\delta H|n^{(i-1)}\rangle +E_n^{(i)}
\end{align}
$$
となる。従ってエネルギーの$k$次摂動$E_n^{(i)}$は一般に
$$
E_n^{(i)}=\langle n^{(0)}|\delta H|n^{(i-1)}\rangle
$$
となるのである。しかし、これは摂動によって現れる$|n^{(i-1)}\rangle$がわかっていないと計算できない。では状態の摂動はどのようになっているのだろうか。

状態の1次摂動

今度は$\mathcal{O}(\lambda^1)$の式に左から$\langle k^{(0)}|$をかける。この状態$|k^{(0)}\rangle$というのは摂動のない系での$k$番目の固有状態である。固有エネルギーはもちろん$E_k^{(0)}$であるので、
$$
\begin{align}
\langle k^{(0)}|(H^{(0)}-E_n^{(0)})|n^{(1)}\rangle &= \langle k^{(0)}|(E_n^{(1)}-\delta H)|n^{(0)}\rangle \\
(E_k^{(0)}-E_n^{(0)})\langle k^{(0)}|n^{(1)}\rangle &= E_n^{(1)}\langle k^{(0)}|n^{(0)}\rangle -\langle k^{(0)}|\delta H|n^{(0)}\rangle =-\langle k^{(0)}|\delta H|n^{(0)}\rangle
\end{align}
$$
となる。ただし$\langle k^{(0)}|n^{(0)}\rangle =\delta_{kn}=0$を用いた。このことから、
$$
\langle k^{(0)}|n^{(1)}\rangle = \frac{-\delta H_{kn}}{E_k^{(0)}-E_n^{(0)}}
$$
とかける*2。ただし$\delta H_{kn}\equiv\langle k^{(0)}|\delta H|n^{(1)}\rangle$と定義した。

求めたいのは状態の1次摂動$|n^{(1)}\rangle$であった。これを展開すると次のようになる。
$$
\begin{align}
|n^{(1)}\rangle &= \sum_k|k^{(0)}\rangle \langle k^{(0)}|n^{(1)}\rangle\\
&= \sum_{k\neq n} \langle k^{(0)}|n^{(1)}\rangle|k^{(0)}\rangle
\end{align}
$$
なお、$\langle n^{(0)}|n^{(1)}\rangle=0$であるので、$n=k$については考えなくて良い。これによって、先ほどまでの議論とを組み合わせることができて、
$$
|n^{(1)}\rangle =-\sum_{k\neq n}\frac{\delta H_{kn}}{E_k^{(0)}-E_n^{(0)}}|k^{(0)}\rangle
$$
を得る。

エネルギーの2次摂動

状態の1次摂動がわかったので、エネルギーの2次摂動を求めることができる。
$$
\begin{align}
E_n^{(2)} &= \langle n^{(0)}|\delta H|n^{(1)}\rangle \\
&= -\sum_{k\neq n}\frac{\langle n^{(0)}|\delta H|k^{(0)}\rangle\delta H_{kn}}{E_k^{(0)}-E_n^{(0)}}\\
&= -\sum_{k\neq n}\frac{\delta H_{nk}\delta H_{kn}}{E_k^{(0)}-E_n^{(0)}}\\
&= -\sum_{k\neq n}\frac{|\delta H_{kn}|^2}{E_k^{(0)}-E_n^{(0)}}
\end{align}
$$
なお、$\delta H_{kn}$と$\delta H_{kn}$はHamiltonianのエルミート性より複素共役でつながる。従って$\delta H_{kn}\delta H_{kn}=|\delta H_{nk}|^2$なのである。

以上のことをまとめると、
$$
\begin{align}
&|n\rangle =|n^{(0)}\rangle -\lambda \sum_{k\neq n}\frac{\delta H_{kn}}{E_k^{(0)}-E_n^{(0)}}|k^{(0)}\rangle +\mathcal{O}(\lambda^2)\\
&E_n(\lambda) =E_n^{(0)}+\lambda \delta H_{nn}-\lambda^2\sum_{k\neq n}\frac{|\delta H_{nk}|^2}{E_k^{(0)}-E_n^{(0)}}+\mathcal{O}(\lambda^3)
\end{align}
$$
となる。

Remark

エネルギーの2次摂動について、考えているエネルギー準位よりも上の準位はエネルギーを下げる効果を持ち、下の準位はエネルギーを上げる効果を持つ。
$$
\begin{align}
E_{n}^{(2)\mathrm{upper}}\equiv -\lambda^2\sum_{k>n}\frac{|\delta H_{nk}|^2}{E_k^{(0)}-E_n^{(0)}}\\
E_{n}^{(2)\mathrm{lower}}\equiv -\lambda^2\sum_{k<n}\frac{|\delta H_{nk}|^2}{E_k^{(0)}-E_n^{(0)}}
\end{align}
$$
このように$E_n^{(2)}$を$n$よりも低い準位からの効果と高い準位からの効果に分ければ、$E_n^{(0)}$の大小関係により
$$
\begin{align}
E_n^{(2)\mathrm{upper}}<0\\
E_n^{(2)\mathrm{lower}}>0
\end{align}
$$
であることがわかる。(終)

*1:: 例えば$|n^{(1)}\rangle_f$という状態が摂動によって出てきて、これが$|n^{(0)}\rangle$を含んでいたとする:$|n^{(1)}\rangle_f =\alpha|n^{(1)}\rangle +\beta|n^{(0)}\rangle$。このような場合には出てきた$\beta|n^{(0)}\rangle$を無理やり元からあった$|n^{(0)}\rangle$に足して、規格化してやれば良い。そのような手続きを踏むことによって結局上記の規格化条件を満足する。

*2:エネルギーの差による割り算が可能になるのは異なる$n,k$に対して$E_n^{(0)}\neq E_k^{(0)}$の時だけである。このことから、縮退のある場合には別の方法を考える必要があることがわかる。

角運動量の加算

気になる話題・問題があればこちらからお願いします→お題箱(google from)

今回は角運動量の加算について考えていきます。
角運動量演算子には、古典力学での角運動量に対応する「軌道角運動量演算子」と、内部自由度に対応する「スピン角運動量演算子」の二つが存在します。どちらも同じ角運動量であり、この二つを足したものが「全角運動量演算子」と呼ばれるものです。
この「角運動量を足す」ということについて、状態の掛け算という観点から考えていきましょう。

 

fartherphysics.hatenablog.com

 

軌道角運動量とスピン角運動量の合成

まずは手始めに全角運動量演算子を直積を用いて表します。軌道角運動量演算子とスピン角運動量演算子はそれぞれ\(\hat{L}\,,\hat{S}\)と書きます。そしてそれらを合成した全角運動量演算子は$$\hat{J}=\hat{L}+\hat{S}$$と書きます。
これを直積の意味をあらわに書くと$$\hat{J}=\hat{L}\otimes{\textbf 1} +{\textbf 1}\otimes \hat{S}$$となるでしょう。

2電子系のスピンの合成

同じようにスピン1/2を持つ粒子・電子の状態を合成します。電子1,2に対するスピン角運動量演算子を\(\hat{S}_i\)とかくと、2粒子系に対するスピン角運動量演算子は$$\hat{S}_\mathrm{tot.}=\hat{S}_1\otimes {\textbf 1}+{\textbf 1}\otimes \hat{S}_2$$となります。ただし直積記号の左側が電子1に、右側が電子2に作用する演算子です。
ここで、それぞれの電子に対する角運動量はLie代数を満たしています:

$$\begin{align} [\hat{S}_{1j},\hat{S}_{1j}] &=i\hbar\epsilon_{ijk}\hat{S}_{1k}\\ [\hat{S}_{2i},\hat{S}_{2j}]& =i\hbar\epsilon_{ijk}\hat{S}_{2k}\\ [\hat{S}_{1i},\hat{S}_{2j}] &=0 \end{align}$$

すなわち、同じ電子についてはよく知った交換関係を満たしており、違う電子については演算子が交換するということです。

さて、角運動量とその固有状態には次のような関係がありました。

$$\begin{align} \hat{\vec{J}}|j,m\rangle & = \hbar^2j(j+1)|j,m\rangle\\ \hat{J}_z|j,m\rangle & = m \hbar |j,m\rangle \end{align}$$

この関係はスピン角運動量でももちろん成り立つものですが、合成した後の演算子\(\hat{S}_\mathrm{tot.}\)については成り立つのでしょうか?

まずは簡単な\(\hat{S}_z=\hat{S}_{1z}+\hat{S}_{2z}\)から。

$$\begin{align} \hat{S}_z|s_1,m_1;s_2,m_2\rangle & = (\hat{S}_{1z}\otimes{\textbf 1}+{\textbf 1}\otimes\hat{S}_{2z})|s_1,m_1\rangle\otimes|s_2,m_2\rangle\\ & = m_1\hbar|s_1,m_1\rangle\otimes |s_2,m_2\rangle+m_2\hbar|s_1,m_1\rangle\otimes|s_2,m_2\rangle\\ & = (m_1+m_2)\hbar|s_1,m_1;s_2,m_2\rangle \end{align}$$

\(\hat{S}_z\)については成り立っていることがわかりました。次に\(\hat{\vec{S}}\)についてみてみましょう。

$$\begin{align} \hat{\vec{S}}^2|s_1,m_1;s_2,m_2\rangle & = (\hat{\vec S}_1+\hat{\vec S}_2)^2|s_1,m_1\rangle\otimes|s_2,m_2\rangle\\ & = (\hat{\vec S}_1^2+2\hat{\vec S}_1\hat{\vec S}_2+\hat{\vec S}_2^2)|s_1,m_1\rangle\otimes|s_2,m_2\rangle\\ & = \left[\hbar^2\left(s_1(s_1+1)+s_2(s_2+1)\right)+2\hat{\vec S}_1\hat{\vec S}_2\right]|s_1,m_1\rangle\otimes|s_2,m_2\rangle\end{align}$$

どうやら\(\hat{\vec S}_1\hat{\vec S}_2\)を計算する必要がありそうです。

$$\begin{align}\hat{\vec S}_1\hat{\vec S}_2 & = \hat{S}_{1x}\hat{S}_{2x}+\hat{S}_{1y}\hat{S}_{2y}+\hat{S}_{1z}\hat{S}_{2z}\\ & = \frac{1}{2}(\hat{S}_{1+}\hat{S}_{2-}+\hat{S}_{1-}\hat{S}_{2+})+\hat{S}_{1z}\hat{S}_{2z}\end{align}$$

したがって、\(\hat{\vec S}_1\hat{\vec S}_2|s_1,m_1;s_2,m_2\rangle\)を計算すると $$\begin{align} & \hat{\vec S}_1\hat{\vec S}_2|s_1,m_1;s_2,m_2\rangle = \left[\frac{\hat{S}_{1+}\hat{S}_{2-}+\hat{S}_{1-}\hat{S}_{2+}}{2}+\hat{S}_{1z}\hat{S}_{2z}\right]|s_1,m_1;s_2,m_2\rangle\\ & = \frac{\hbar^2}{2}\sqrt{(s_1-m_1)(s_1+m_1+1)(s_2+m_2)(s_2-m_2+1)}|s_1,m_1+\hbar;s_2,m_2-\hbar\rangle\\ &+ \frac{\hbar^2}{2}\sqrt{(s_1+m_1)(s_1-m_1+1)(s_2-m_2)(s_2+m_2+1)}|s_1,m_1-\hbar;s_2,m_2\hbar\rangle\\ &+\hbar^2m_1m_2|s_1,m_1;s_2,m_2\rangle \end{align}$$

となって、固有値方程式を満たしていないことがわかります。期待していた形にはなりませんでしたが、合成した状態が合成した演算子の二乗の固有状態にはならないという、興味深い結果を得ることができました。
これに関する考察は一旦置いておき、\(|\pm\rangle_i\)の直積で生まれる状態

$$|++\rangle,|+-\rangle,|-+\rangle,|--\rangle$$

について考えていきましょう。

ベクトル空間の直積を直和に直す(直積で得た空間を「空間の足し算」にする)知識があれば、スピン1/2空間\(V_{1/2}\)の直積は

$$V_{1/2}\otimes V_{1/2}=V_{1}\oplus V_{0}$$

とかけることがわかります。これはスピン1/2の粒子2つからなる系は、スピン1の系と0の系の和である、ということを意味しています。
まずはスピン1の状態で最も\(m\)の値が大きいもの、すなわち\((s,m)=(1,1)\)を考えましょう。するとこれに該当するのは$$|++\rangle$$であることがわかります。実際に\(\hat{S}_z\)を作用させるとそれがわかるでしょう。
\(s=1\)でそれ以外の\(m\)の状態を得るには、昇降演算子を用いて状態を上げ下げすれば良いでしょう。\(|++\rangle\)についてそれを行うと

$$\begin{align}&\hat{S}_-|++\rangle = |-+\rangle+|+-\rangle\\ &\hat{S}_-(|-+\rangle+|+-\rangle)= |--\rangle\end{align}$$

という式が得られます。ただし規格化することで

$$\begin{align}|s=1,m=1\rangle & = |++\rangle\\ |s=1,m=0\rangle & = \frac{1}{\sqrt{2}}(|-+\rangle+|+-\rangle)\\ |s=1,m=-1\rangle & = |--\rangle\end{align}$$

と書くことができます。これで求めたい状態のうち3つがわかりました。
残る最後は\(V_0\)の状態です。これは他の状態(基底)と垂直になるように構成すればよく、

$$|s=0,m=0\rangle =\frac{1}{\sqrt{2}}(|+-\rangle-|-+\rangle)$$

となります。これで2つの電子がある系の状態を表す基底を書くことができました。

 

複合系の状態を求めたい場合はそれらの直積を用いることで表現できます。ただし直積の状態が、元の系で満たしていた固有値方程式に対応するとは限りません。なので、新しい状態の規程を求める必要があります。
複合系の規定を求める際には、今回のように「最も(角運動量固有値が)高い状態」からスタートして、昇降演算子で状態を「下げていく」という方法が常套手段となります。(終)

状態の「掛け算」

気になる話題・問題があればこちらからお願いします→お題箱

今回は複数の状態を合わせて一つの状態として扱う方法を考えます。例えば粒子は「位置(という状態)」「運動量(という状態)」「スピン」などの様々な状態を持っており、私たちが扱うのはそれらが合わさった状態です。また、複数の電子がある系(原子模型など)では2個以上の電子を合わせて一つの系として扱います。この際にも状態の「掛け算」をする必要があります。

まず最初に「状態ベクトルの合成」について考えてみましょう。
まず1つの粒子について、状態をケットで表現します。スピン自由度は上むきと下向きの二つがあり、粒子なので位置の自由度も持っています。なので状態ケットを次のように書きたくなるでしょう。

$$|\vec{x};\pm\rangle$$

さて、ケットはベクトルのように「空間を張る」ということを思い出しましょう。\(|\vec{x};\pm\rangle\)はどのような空間を張るのでしょうか?そしてその空間は\(|\vec{x}\rangle\)や\(|\pm\rangle\)の張る空間とどのような関係があるのでしょうか?

これを端的に表すのが次の式です。上で書いた状態ケットの式は、次のように定義されます。

$$|\vec{x};\pm\rangle =|\vec{x}\rangle \otimes |\pm\rangle$$

\(\otimes\)という記号は「直積」という数学記号で、2つのベクトル空間を掛け合わせたようなものを意味します。ここでは\(|\vec{x}\rangle\)という位置の空間と\(|\pm\rangle\)というスピン空間を掛け合わせたものです。
したがって、位置の空間に作用する演算子\(\hat{A}\)とスピンの空間に作用する演算子\(\hat{B}\)を足した演算子を\(|\vec{x};\pm\rangle\)に作用させると次のようになります。

$$(\hat{A}+\hat{B})|\vec{x};\pm\rangle = (\hat{A}|\vec{x}\rangle)\otimes|\pm\rangle+|\vec{x}\rangle\otimes (\hat{B}|\pm\rangle)$$

このことを考えると、\(\hat{A}+\hat{B}\)は次のように書いても良いのではないでしょうか。

$$\hat{A}+\hat{B}=\hat{A}\otimes {\textbf 1}+{\textbf 1}\otimes \hat{B}$$

直積記号の右側は位置の空間に作用し、左側はスピンの空間に作用するという意味です。\(\hat{A}\)は位置の空間にしか作用しないので、スピンの空間には恒等演算子\({\textbf 1}\)がついています。

それでは別の例を考えてみましょう。2つのスピンのない粒子1と2があり、それらの位置ケットが\(|\vec{x}\rangle_i(i=1,2)\)と書かれているとします。この2粒子系を一つの状態としてかくと

$$|\vec{x}\rangle_1\otimes |\vec{x}\rangle_2$$

となるでしょう。そして粒子1に対して作用する\(\hat{A}\)と粒子2に対して作用する\(\hat{B}\)の足し算は

$$\hat{A}\otimes {\textbf 1}+{\textbf 1}\otimes \hat{B}$$

であり、実際に作用させると次のようになるはずです。

$$\hat{A}|\vec{x}\rangle_1\otimes |\vec{x}\rangle_2+|\vec{x}\rangle_1\otimes\hat{B}|\vec{x}\rangle_2$$

 

この考え方を用いて、「角運動量の加算」を考えていきましょう。

 

fartherphysics.hatenablog.com

 

SU(2)の構成

気になる話題・問題があればこちらからお願いします→お題箱

------------

今回はLie群の中のSU(2):2次特殊ユニタリー群の表現を構成していきます。調和振動子を用いた構成方法を用います。この方法は$SU(n)$に拡張するのが容易であるというメリットがあります。

群の復習したい場合はこちらの記事をどうぞ。

fartherphysics.hatenablog.com

 そして、今回のゴールは$J_\pm,J_3$の行列要素を求めることです。

ハミルトニアン、生成・消滅演算子

互いに相互しない粒子が$N$個ある場合、等方調和振動子ハミルトニアン

$$H=\sum_{i=1}^N \left(\frac{1}{2m}p_i^2+\frac{1}{2}m\omega^2x_i^2\right)$$

とかけます。これからは簡単のために$m=\omega=\hbar=1$の系を考えることにしましょう。すると生成・消滅演算子と個数演算子は次のようにシンプルな形でかけます。

$$a\equiv \frac{1}{\sqrt{2}}(x+ip)\,,a^\dagger \equiv \frac{1}{\sqrt{2}}(x-ip)$$

$$N\equiv a^\dagger a$$

交換関係なども確認しておきましょう。

$$[a,a^\dagger]=1$$

$$[N,a]=-a\,,[N,a^\dagger]=a^\dagger\,:Na^\dagger=a^\dagger(N+1)$$

この時ハミルトニアンは$H=a^\dagger a+\frac{1}{2}$とかけます。

一般の状態の構成:$|n\rangle$

それでは、一般の状態$|n\rangle$を構成していきます。まずは1次元で考えましょう。

結果は

$$n\rangle =\frac{1}{\sqrt{n!}}\left(a^\dagger\right)^n|0\rangle$$

になるので、量子力学ですでにこの結果を知っている人は読み飛ばしてください。[>>続き]

まずは状態$|0\rangle$を考えます。この$0$というのは$N$の固有値で、例えば$|m\rangle$に対しては$N|m\rangle=m|m\rangle$となります。

 

このことから、状態$|n\rangle$を作りたい場合は$|0\rangle$に$a^\dagger$を$n$回作用させれば良いのです。ただし係数は未知数で

$$|n\rangle =C_n\left(a^\dagger\right)^n|0\rangle$$

と書くことができます。また、係数$C_n$は規格化条件から決定することができます。

$$\begin{eqnarray} \langle n'|n\rangle &=& C_{n'}^\ast C_n\langle 0|a^{n'}{a^\dagger}^n|0\rangle\\ &=&\delta_{nn'}C_{n'}^\ast C_nn\langle 0|a^{n'-1}{a^\dagger}^{n-1}|0\rangle\\ …&=&n!|C_n|^2=1 \end{eqnarray}$$

すなわち$|n\rangle$は係数を実数にとって

$$|n\rangle =\frac{1}{\sqrt{n}}\left(a^\dagger\right)^n|0\rangle$$

とかけるのです。

[>>続き]

この$|n\rangle=\frac{1}{\sqrt{n!}}\left(a^\dagger\right)^n|0\rangle$を1次元から$D$次元に拡張すると次のようになります。

$$a\to a_i$$

$$N\to N_i \equiv a_i^\dagger a_i\,, N\equiv \sum_{i=1}^DN_i$$

$$[a_i,a_j^\dagger]=\delta_{ij}$$

$$|n_1,...,n_D\rangle =\frac{1}{\sqrt{n_1!...n_D!}}\left(a_1^\dagger\right)^{n_1}...\left(a_D^\dagger\right)^{n_D}|0\rangle$$

$$(i=1,2,...,D)$$

SU(2)のLie代数

 それでは本題の$SU(2)$を構成していきます。まず、2次元における生成・消滅演算子$a_1\,,a_2$を考えましょう。このとき個数演算子$N$とハミルトニアン$H$は

$$N=a_1^\dagger a_1+a_2^\dagger a_2$$

$$H=N+1$$

となります。

ここで、回転を表す行列$u\in SU(2)$は生成元を$J$として$u=e^{i\vec{\theta}\cdot\vec{J}}$と書くことができます。この$J$は

$$J_i\equiv \frac{1}{2}\sum_{a,b=1,2}a_a^\dagger σ^i_{ab}a_b=\frac{1}{2}\vec{a}^\dagger σ^i\vec{a}$$

というように構成します。ただし$σ$はPauli行列です。理由は省略しますが、$[H,J]=0$となるような構成です。$i=1,2,3$について書き下すと

$$J_1=\frac{1}{2}(a_1^\dagger a_2+a_2^\dagger a_1)$$

$$J_2=\frac{1}{2}(a_1^\dagger a_2-a_2^\dagger a_1)$$

$$J_3=\frac{1}{2}(a_1^\dagger a_1 +a_2^\dagger a_2)=\frac{1}{2}(N_1-N_2)$$

となります。このことから$J_i$の交換関係は

$$[J_i,J_j]=i\epsilon_{ijk}J_k$$

であることがわかります。これが$SU(2)$のLie代数と呼ばれる交換関係です。

SU(2)の構成

では最後に$J$の行列要素を求めていきましょう。そのためには$|p\rangle_1|q\rangle_2$という状態を考える必要があります。これは「粒子1の状態が$|p\rangle$で、粒子2の状態が$|q\rangle$である状態」と考えていいでしょう。2粒子の複合系とでも言いましょうか。

この状態は$|0\rangle$と生成・消滅演算子を用いて次のように書くことができます。

$$|p\rangle_1|q\rangle_2=\frac{1}{\sqrt{p!q!}}\left(a_1^\dagger\right)^p\left(a_2^\dagger\right)^q|0\rangle_1|0\rangle_2$$

これは『一般の状態の構成』 の最後に得た結果で$D=2$としたものです。

さて、この状態に個数演算子$\hat{N}=a_1^\dagger a_1+a_2^\dagger a_2$を作用させます。以降、簡単のために$|p\rangle_1|q\rangle_2=|p,q\rangle$と書くことにしましょう。

$$\hat{N}|p,q\rangle=(p+q)|p,q\rangle$$

カシミア演算子$\vec{J}^2$は(少々大変な計算を経て)$\vec{J}^2=\frac{\hat{N}}{2}\left(\frac{\hat{N}}{2}+1\right)$となります。状態$|p,q\rangle$に対する$\vec{J}^2$の固有値を、角運動量の表記に従って$j$と書くことにしましょう。すると$\frac{\hat{N}}{2}$の固有値$\frac{N}{2}=j$となります。

さらに、$|p,q\rangle$の$\hat{N}$の固有値$N$は真面目に計算すると$N=p+q$です。一方で状態$|p,q\rangle$に$J_3$を作用させると

$$J_3|p,q\rangle=\frac{1}{2}(p-q)|p,q\rangle$$

であることもわかります。すなわち$|p,q\rangle$を角運動量演算子の固有状態の表記に従って$|p,q\rangle =|j,m\rangle\rangle$とかけば、

$$j=\frac{1}{2}(p+q)\,,m=\frac{1}{2}(p-q)$$

となるのです。これらから直ちに$p=j+m\,,q=j- m $という関係もわかります。

つまり$|p,q\rangle$に演算子$J$、例えば$J_+$を作用させてみると、

$$\begin{eqnarray} J_+|p,q\rangle &=& a_1^\dagger |p\rangle_1 a_2|q\rangle_2\\ &=&\sqrt{p+1}|p+1\rangle_1 \sqrt{q}|q-1\rangle_2\\ &=&\sqrt{(p+1)q}|p+1,q-1\rangle\\ &=&\sqrt{(p+1)q}|j,m+1\rangle\rangle\\ &=&\sqrt{(j+m+1)(j-m)}|j,m+1\rangle\rangle\end{eqnarray}$$

であることがわかります。このような議論を$J_-\,,J_3$に対しても行えば、それぞれの行列要素が

$$\langle j,m+1|J_+|j,m\rangle =\sqrt{(p+1)q}=\sqrt{(j+m+1)(j-m)}$$

$$\langle j, m -1|J_-|j,m\rangle =\sqrt{(p-1)q}=\sqrt{(j-m+1)(j+m)}$$

$$\langle j',m'|J_3|j,m\rangle =m\delta_{jj'}\delta_{mm'}$$

などとなることが示されます。これが$SU(2)$の行列要素です(終)