Lie代数と物理
気になる話題・問題があればこちらからお願いします→お題箱
------------
今回は、Lie代数という群(Group)の代数と物理学の関係性についてみていきます。素粒子論などに興味のある方は是非読んで欲しい話です。
「群」について復習したい場合はこちらの記事をどうぞ。
回転を表す行列
まず初めにあるベクトルの回転を考えてみましょう。線形代数を習った方はお分かりかと思いますが、あるベクトル$\bf v$を他のベクトル$\bf v'$に移す操作は行列を用いて
$${\bf v'}=A{\bf v}$$
と書くことができます。ベクトル$\bf v\,,\bf v'$が$n$次のベクトルなら、行列$A$は$n$次の正方行列になりますね。
さて、回転とはどのような変換でしょう。それは「2ベクトルの内積を不変に保つ変換」です。この条件を数式で書いてみます。
2つの複素ベクトル$\bf v,\bf w$を行列$A$で表される変換で$\bf v'\,,\bf w'$にそれぞれ移します。すると
$${\bf v'}=A{\bf v}$$
$${\bf w'}=A{\bf w}$$
とかけるでしょう。ここで$A$が回転を表しているのなら、ベクトル$\bf v\,,\bf w$の内積と$\bf v'\,,\bf w'$の内積は変わらないはずです。すなわち
$$({\bf v'},{\bf w'})={\bf v'}^\dagger{\bf w'}=\left({\bf v}^\dagger A^\dagger\right)\left( A{\bf w}\right)={\bf v}^\dagger {\bf w}$$
となります。このことから、$A^\dagger A={\bf 1}$であれば良いことがわかりました。つまり、行列$A$はエルミート行列であれば良いのです。
さて、エルミート行列の性質をもう少し見てみましょう。行列式を見ると、
$$\mathrm{det}(A^\dagger A)=|\mathrm{det}A|^2=\mathrm{det}{\bf 1}=1$$
となります。すなわち、$\mathrm{det}A$は実数$\theta$に対して
$$\mathrm{det}A=e^{i\theta}$$
とかけるのです。このような行列$A$は群を成します。これをユニタリー群といい、$n$次元のユニタリー群を$U(n)$と書きます。
$SU(n)$
それではn次元の回転に対応するユニタリー群$U(n)$について考えていきます。
行列$A$が$A\in U(n)$であるとは、$A$がn次の正方行列で、その行列式について
$$\mathrm{det}A=e^{i\theta}$$
が成り立っていれることを意味します。ここで、この条件に更に制約を課して
$$\mathrm{det}A=1$$
としましょう。このような行列$A$の集合を「特殊ユニタリー群(Special Unitary)」といい、$SU(n)$と書きます。
では$SU(n)$はどのような行列の群なのでしょう?答えは、「回転を表す行列の群」です。おや?と思ったかたもいるのではないでしょうか。そうです。一番最初に回転を表す行列の群を考えた時に出てきたのがユニタリー群だったはずです。
実は、ユニタリー行列は「ベクトルの内積を不変にする変換の行列」だったのです。なので、回転のほかに鏡映(反転)などの変換も含んでいます。回転だけが属する群が特殊ユニタリー群なのです。
$$U(n)\to \left\{\begin{array}{l}\mathrm{det}A\neq 1…鏡映など\\ \mathrm{det}A=1…回転:SU(n)\end{array}\right.$$
$SU(2)$
$SU(2)$は電子のスピンに関する様々な洞察を与えてくれます。角運動量演算子にも現れてくる代数です。また、$SU(2)$の基本的な行列はパウリ行列と呼ばれる行列です。量子力学のSchrödinger-Pauli方程式、Dirac方程式などでも登場する行列です。
$$σ_1=\left( \begin{matrix}1 & 0\\0 & 1\end{matrix}\right)$$
$$σ_2=\left( \begin{array}{cc}0 & -i\\i & 0\end{array}\right)$$
$$σ_3=\left( \begin{array}{cc}1 & 0\\0 & -1\end{array}\right)$$
$SU(3)$
$SU(3)$はクオークやその複合粒子であるバリオンなどの分類、摂動論への応用に用いられます。
これらはLie代数の物理への応用のほんの一部です。ほかにもカラー自由度やスピノルへの応用などがあります(終)。
量子力学の「良い基底」
気になる話題・問題があればこちらからお願いします→お題箱
量子力学では波動関数\(\psi\)を\(n,l,m\)でラベルして\(\psi_{nlm}\)と書いたり、bra-ket記法を用いて\(|n,l,m\rangle\)と書いたりします。bra-ket記法では波動関数をベクトルとして、演算子を行列として扱います。では、そのベクトルの基底はどのように選ぶのが良いのでしょうか?
線形代数学的に考えてみる
時間に依存しないSchrödinger方程式は次のようにかけるのでした。
$$\hat{H}\psi =E\psi$$
\(\hat{H}\)はハミルトニアンで、\(E\)は固有エネルギーです。これをbra-ket記法で書くと次のようになります。
$$\hat{H}|\psi\rangle = E|\psi\rangle$$
\(\psi\) が\(|\psi\rangle \)に変わっただけですね。では、これを線形代数学の眼で見てみましょう。
\(\hat{H}\)は行列で、\(|\psi\rangle\)はベクトル、\(E\)はスカラーですので、Schrödinger方程式は固有値方程式であることがわかります。固有値方程式については最後に載せておきますね。
Schrödinger方程式に限らず物理量に関する固有値方程式を扱う時、考える行列が対角化されていると議論が簡単になります。行列は固有値を対角成分に並べたもの、状態ベクトルは固有ベクトルを縦に並べたものに過ぎないからです。
逆にいうと、考えたい演算子に対応する行列を対角化するようなベクトルが「良いベクトル」になるのです。
例1)1次元調和振動子
一次元調和振動子のポテンシャルは
$$V(x)=\frac{1}{2}m\omega^2x^2$$
ですので、ハミルトニアンは次のようになります。
$$H=\frac{1}{2m}\vec{p}^2+\frac{1}{2}m\omega^2x^2$$
1次元調和振動子のSchrödinger方程式を解いたことのある人はすでにご存知でしょうが、固有値は
$$E=\left(n+\frac{1}{2}\right)\hbar\omega\ ,n=0,1,2,...$$
です。また固有状態とエネルギーは一対一の関係があります(縮退がない)から、状態は\(n\)でラベルするのが良いでしょう。波動関数\(\psi\)を\(\psi_n\)とかく理由です。
では、\(\psi_n\)を状態ベクトルの基底とする時ハミルトニアンは本当に対角化されているでしょうか?
\(m\)でラベルされる状態\(|m\rangle\)とエネルギー\(E_m\)について固有値方程式を書くと
$$H|m\rangle=E_m|m\rangle$$
です。これを\(m=0\sim n\)について縦に並べてみましょう。
$$H=\left(\begin{matrix}E_1 & 0 & 0 & \cdots & 0\\ 0 & E_2 & 0 & \cdots & 0\\ 0 & 0 & E_3 & \cdots & 0\\ \vdots & \vdots & \vdots & \ddots & \cdots \\ 0 & 0 & 0 & \cdots & E_n \end{matrix}\right)$$
このことから\(n\)でラベルされる基底は良い基底になっていますね。
例2) 水素の電子の\(\vec{p}^4\)
このようなことは普通考えないでしょうが、今回は一例として水素原子核の周りを回っている電子の\(\vec{p}^4\)の期待値について考えます。この例はマサチューセッツ工科大学で2018年に開講された"Quantum Physics III"の講義で出てきた話題です。
答えを先に言うと、波動関数を\(n,l,m\)でラベルするのが良い基底となります(\(n\):主量子数 \(l\):軌道角運動量量子数 \(m\):磁気量子数)。
例1では演算子(ハミルトニアン)が対角化されているか?という視点で良い基底かどうかを考えたのですが、今回は「演算子(\(\vec{p}^4\))とラベルに対応する物理量の演算子(\(\vec{L}^2\,,\hat{L_z}\))が同時対角化可能か」ということを考えます。
演算子が同時対角化可能である条件とは、演算子が可換であるということでした。なので今回の例では
$$[\vec{p}^4,\vec{L}^2]=0$$
$$[\vec{p}^4,L_z]=0$$
が成り立っていれば良いということです。
これは成り立っていますよね?成り立っています。角運動量演算子の定義を思い出せばすぐにわかるので説明は割愛させてください。
このことから分かるのは、演算子\(X\)を考えるときは\(X\)に可換な演算子\(A\)
$$[X,A]=0$$
の固有値\(a\)でラベルされる固有状態を考えると良い、ということです。ラベルは1つとは限りませんが、このようなラベルを選ぶことで演算子\(X\)を対角化させて考えることができます。(終 以降は固有値方程式の復習です)
続きを読む
角運動量演算子と固有状態
気になる話題・問題があればこちらからお願いします→お題箱
量子力学において3次元系の問題を扱う時、角運動量演算子は避けて通れない存在です。二体問題を扱う際にも出てくる存在ですね。
今回はその角運動量演算子の固有値・固有状態を求めていきます。
角運動量演算子の交換関係
$$\begin{align}{\bf {\hat{J}}}&=\left(\hat{J_x},\hat{J_y},\hat{J_z}\right)\\ [\hat{J_i},\hat{J_j}]&=i\hbar\epsilon_{ijk}\hat{J_k}\\ \hat{J_i}^{\dagger} &=\hat{J_i} \end{align}$$
さてこここで\({\bf \hat{J}}^2=\hat{J_x}^2+\hat{J_y}^2+\hat{J_z}^2\)という演算子を考えてみましょう。カシミア演算子とも言います。角運動量演算子の各成分との交換関係は次のようになります。
$$\begin{align}[{\bf{\hat{J}}^2},\hat{J_l}]&=[\hat{J_i}^2,\hat{J_l}]\\ &=\hat{J_i}[\hat{J_i},\hat{J_l}]+[\hat{J_i},\hat{J_l}]\hat{J_i}\\ &=\hat{J_i}i\hbar\epsilon_{il}{}_{m}\hat{J_m}+i\hbar\epsilon_{il}{}_{m}\hat{J_m}\hat{J_i}\\ &=i\hbar (\epsilon_{il}{}_{m}\hat{J_i}\hat{J_m}+\epsilon_{mli}\hat{J_i}\hat{J_m})=0\end{align}$$
これは\(\hat{{\bf J}}^2\)と\(\hat{J_i}\)が同時対角化可能であること、つまりこれらの同時固有状態が存在することを意味しています。
昇降演算子
角運動量演算子の固有値を求める前に、昇降演算子を定義します。
$$\hat{J}_{\pm}\equiv \hat{J_x}\pm i\hat{J_y}$$
昇降演算子を定義したことによって、基底\(\hat{J_x},\hat{J_y},\hat{J_z}\)が新たな基底\(J_z,J_{\pm}\)に移ったと考えてもいいでしょう。
$$\begin{align}[\hat{\bf{J}}^2,\hat{J_{\pm}}] &=[\hat{\bf{J}}^2,\hat{J_x}]\pm i[\hat{\bf{J}}^2,\hat{J_y}]=0\\ [\hat{J_z},\hat{J_\pm}] & =[\hat{J_z},\hat{J_x}]\pm i[\hat{J_z},\hat{J_y}]=\pm\hbar \hat{J_\pm}\\ \hat{J_+}\hat{J_-}&=\hat{\bf{J}}^2-\hat{J_z}^2+\hbar\hat{J_z}\\ \hat{J_-}\hat{J_+} & =\hat{\bf{J}}^2-\hat{J_z}^2-\hbar\hat{J_z} \end{align}$$
固有状態を求める
準備が整ったので角運動量演算子の固有値を求めていきましょう。\(\hat{{\bf J}}^2\)と\(\hat{J_i}\)が同時対角化可能だったので\(\hat{\bf{J}}^2\)に対応する固有値を\(a\)、\(\hat{J_z}\)に対応する固有値を\(b\)として議論していきます。
この設定を固有値方程式で書いてみます。
$$\hat{\bf{J}}^2|a,b\rangle =a|a,b\rangle$$
$$\hat{J_z}|a,b\rangle =b|a,b\rangle$$
固有状態は固有値をラベルに用いて\(|a,b\rangle\)と書きました。ただし規格化されているものとします。
さて固有値\(a,b\)を求めるのですが、これらには制約がかかっていることをみておきましょう。というのも、古典論における角運動量を考えると
$$\hat{\bf{J}}^2\geq \hat{J_z}^2$$
なので、対応する固有値にも\(a\geq b^2\)の関係があると思われます。実際に計算するとそれがわかります。
$$\begin{align}a-b^2 & \langle a,b|\hat{\bf{J}}^2-\hat{J_z}^2|a,b\rangle\\ &=\langle a,b|\hat{J_x}^2|a,b\rangle+\langle a,b|\hat{J_y}^2|a,b\rangle\geq 0\\ & \therefore a\geq b^2\end{align}$$
ここで先ほど定義した昇降演算子がどのような働きをするのかみてみます。そのまま固有状態に作用させるのではなくて\(\hat{{\bf J}}^2,\hat{J_z}\)と一緒に作用させてみます。
まずは\(\hat{\bf{J}}^2\)。
$$\hat{\bf{J}}^2\hat{J_\pm}|a,b\rangle=\hat{J_\pm}\hat{\bf{J}}^2|a,b\rangle =a\hat{J_\pm}|a,b\rangle$$
\(\hat{J_\pm}|a,b\rangle\)は\(\hat{\bf J}^2\)の固有状態で、固有値は\(a\)であることがわかりました。
次に\(\hat{J_z}\)。
$$\begin{align}\hat{J_z}\hat{J_\pm}|a,b\rangle & =(\hat{J_\pm}\hat{J_z}\pm\hbar\hat{J_\pm})|a,b\rangle\\ &=(b\pm\hbar)|a,b\rangle\end{align}$$
\(\hat{J_\pm}|a,b\rangle\)は\(\hat{J_z}\)の固有状態で、固有値は\(b\pm\hbar\)でした。
このことから、\(\hat{J_\pm}|a,b\rangle\)は
$$\hat{J_\pm}|a,b\rangle=C_{ab}|a,b\pm\hbar\rangle$$
とかけることがわかりました。\(\hat{\bf{J}}^2\)や\(\hat{J_z}\)を作用させると上でみた式を満たすことを確認してください。
つまり\(\hat{J_\pm}\)を状態\(|a,b\rangle\)に作用させることで、\(\hat{J_z}\)の固有値を\(\hbar\)ずつ上げ下げできることが言えます。これが\(\hat{J_\pm}\)に昇降演算子という名前がついている理由です。
さて昇降演算子によって\(\hat{J_z}\)の固有値の上げ下げができたのですが、既にみた固有値の制約\(a\geq b^2\)から\(b\)には上限と下限が存在することがわかります。このことについて考えてみましょう。
\(\hat{J_+}\)を作用させ続けると、「これ以上\(b\)を増やせない!」という状態に行き着きます。これはどのような場合かというと、
$$\hat{J_+}|a,b_\mathrm{max}\rangle=0$$
という場合です。\(\hat{J_+}\)を作用させて0になってしまうので、これ以上\(b\)は増やせないですね。このとき\(\hat{\bf{J}}^2\)を作用させると、
$$\begin{align}\hat{\bf{J}}^2|a,b_\mathrm{max}\rangle & =\hat{J_z}(\hat{J_z}+\hbar)|a,b_\mathrm{max}\rangle\\ & =b_\mathrm{max}(b_\mathrm{max}+\hbar)|a,b_\mathrm{max}\rangle\end{align}$$
となり、\(a\)と\(b_\mathrm{max}\)との関係は
$$a=b_\mathrm{max}^2+\hbar b_\mathrm{max}$$
となります。\(a\geq b^2\geq 0\)だったので\(b_\mathrm{max}\geq 0\)ですね。
同様にして「これ以上\(b\)を減らせない!」という状態を考えると
$$\hat{J_-}|a,b_\mathrm{min}\rangle=0$$
$$\begin{align}\hat{\bf{J}}^2|a,b_\mathrm{min}\rangle & =\hat{J_z}(\hat{J_z}-\hbar)|a,b_\mathrm{min}\\ &=b_\mathrm{min}(b_\mathrm{min}-\hbar)|a,b_\mathrm{min}\rangle\\ a &=b_\mathrm{min}^2-\hbar b_\mathrm{min}\,,b_\mathrm{min}\leq 0 \end{align}$$
です。さて、得られた二式の差をとってみましょう。
$$\begin{align}a-a & =(b_\mathrm{max}^2+b_\mathrm{max})-(b_\mathrm{min}^2-\hbar b_\mathrm{min})\\ & =(b_\mathrm{max}+b_\mathrm{min})(b_\mathrm{max}-b_\mathrm{min}+\hbar)=0\end{align}$$
$$\therefore b_\mathrm{max}+b_\mathrm{min}=0\ (\because b_\mathrm{max}-b_\mathrm{min}+\hbar> 0)$$
となりました。
このことから\(b_\mathrm{max}=j\hbar\,,b_\mathrm{min}=-j\hbar\,,j\geq 0\)とかけるので、固有値は
$$a=j(j+1)\hbar^2$$
$$b=-j\hbar\,,-j\hbar+\hbar\,,...,j\hbar-\hbar\,,j\hbar$$
となります。\(b\)の個数が\(2j+1\)個なので、\(2j=0,1,2,...\)です。
\(b\)の見栄えが少し悪いので\(b=m\hbar\)と書き直しましょう。すると
$$\begin{align}\hat{\bf{J}}^2|j,m\rangle & =j(j+1)\hbar^2|j,m\rangle\\ \hat{J_z}|j,m\rangle & =m\hbar|j,m\rangle\\ j & =0,1/2,2,...\\ m& =-j,-j+1,...,j-1,j(2j+1個)\end{align}$$
こちらの記事もどうぞ。
ルジャンドル変換の意外なはなし
今回はルジャンドル変換(Legendre transformation)について解説します。ルジャンドル変換とは、熱力学において熱力学第一法則から種々の自由エネルギーを作る時や、解析力学においてラグランジュ形式からハミルトン形式に移る時に用いられる変換です。
この変換は物理でよく登場するのですが、具体的に触れられることはほとんどありません。今回はルジャンドル変換がもつ意味について探っていこうと思います。
グラフの表現
さて、ここで1変数関数\(f(x)\)を考えます。この関数によるグラフを\(xy\)平面で書くのですが、この時の座標の表示方法は2つ考えられます。
- \(xy\)平面での点を直接指定する方法:点座標
- ある点での傾きと接線の\(y\)切片を指定する方法:接線座標
です。点座標は普段使っている表現ですが、接線座標は馴染みがないですね。
この時、点座標から接線座標への変換のことをルジャンドル変換と言います。
数学的な定義
さてルジャンドル変換のイメージが掴めたところで、数学的な定義を与えましょう。
\(\mathrm{def.}\)
凸関数\(f(x)\)に対して、変換\(x\to p\,,f\to f^* \):
をルジャンドル変換という。
また、下に凸な関数に対して
も上の定義と等価である。
定義の意味
ここでいくつか数学の記号が出てきたので説明します。
まず\(f(x\pm 0)\)という表記ですが、これは関数\(f\)の\(x>0 or x<0\)から\(x=0\)への極限をとるという意味です(右極限と左極限)。連続な関数ではこれらの極限は一致しています(\(f(x\pm 0)=f(x)\))。
次に\(\sup_x\)ですが、これは「上限」というものです。例えばある開領域\(A=[a,b]\)があったとしましょう。この時の上限は\(\sup A=b\)となります。また、閉領域\(B=[a,b]\)に対しては\(\sup B=b\)です。上限は「開領域に対しても値を持つ最大値のようなもの」と思っていいでしょう。
定義をもっと直感的に
さて上での定義に意味づけをしていきましょう。ルジャンドル変換は「点座標から接線座標への変換」だったことを思い出してください。
関数\(f(x)\)がある時、
関数の傾き:\(p := \frac{\partial f(x)}{\partial x}\)
接線の\(y\)切片:\(f^*(p ):= x(p)\cdot p-f\left(x(p)\right)\)
となります。
これはまさに定義の2番目の式に他なりません!
解析力学でのルジャンドル変換
解析力学で用いられるルジャンドル変換は、多変数関数に対して用いることがほとんどです。というのも、\(N\)個の粒子が3次元で運動している場合には、変数の数が一般化座標と一般化運動量の個数(6\(N\))個になるからです。
さて、多変数関数に対するルジャンドル変換を定義しましょう。
\(\mathrm{def.}\)
\(n\)個の変数\(x^i\ (i=1,2,...,n)\)の関数\(f(x)=f(x^1,x^2,...,x^n)\)が与えられた時、
\(\omega_i \equiv \frac{\partial f(x)}{\partial x^i}\)
\(f^*(\omega)\equiv \sum_i x^i(\omega)\cdot \omega_i-f(x(\omega))\)
の変換がルジャンドル変換
変わったのは多変数関数になったことで\(x^i(\omega)\cdot \omega_i\)という\(i\)について和をとる項が出てきた点だけです。
なお、ルジャンドル変換の逆変換はルジャンドル変換と同じ構造をしていることが知られています。
このようにルジャンドル変換は「点座標と接線座標の変換」であり、逆変換も同じ構造を持っている特殊な変換です。また、本題とは関係ありませんが、上限や下限などの概念も押さえておくと良いでしょう。(終)
群のはなし
群(group)とは、数学における数や行列などのある特徴を持ったグループ(集合)のことです。数学では「群論」という分野で群を扱います。物理学でも量子論などで群が登場します。
さて、群の具体例をみてみましょう。
などです。一度は出会ったことがあるでしょう。
では、どのような集合が群になるのでしょうか?
群の定義
群は次の4つの条件を満たすような集合\(G\)のことです。
- 集合の元に対して積\(\cdot\)が定義され、任意の元の積が集合の元となる(積の定義)
\({}^\forall g_1,g_2\in G s.t. g_1\cdot g_2 \equiv g \in G\) - 単位元\(e \in G\)が存在する
\(e\cdot g =g\cdot e =g\) - 逆元が存在する
\(g\cdot g^{-1}=g^{-1}\cdot g =e\) - 結合則が成り立つ
\(g_1\cdot (g_2\cdot g_3)=(g_1\cdot g_2)\cdot g_3\)
では、これらの定義を有理数の集合\(\mathbb{Q}\)で考えてみましょう。
- 二項演算子の定義
任意の有理数\(a,b\)には和が定義されています。いわゆる\(+\)です。
また、\(a,b\)の和\(a+ b\)は明らかに0以外の有理数になっています。 - 単位元
単位元とは、和をとっても値が変わらないものを言います。有理数の集合における単位元は、0です。 - 逆元
逆元とは、和を取ると単位元になるものです。なので元\(a\)の逆元は\(-a\)になります。 - 結合則
0でない有理数\(a,b,c\)に対して\(a+b+ c\)を考えると、\(a+ b\)を先に計算する場合と\(b+ c\)を先に計算する場合で結果が一致するのは当然でしょう。これが結合則です。
積の順序を入れ替えることができるかは別の話なので混同しないように注意しましょう。
群の性質
では次に群の性質を見てみましょう。群が一般的に満たす性質は次の2つです。
- 単位元の一意性
- 逆元の一意性
要するに、一つの群に対して単位元・逆元はそれぞれ1つしかないということです。当然のように思えることですが、一応証明をしておきましょう。
\(\mathrm{Prf.}\)単位元の一意性
\(\hspace 15pt\)単位元\(e\,,e^\prime (e\neq e^\prime)\)が存在すると仮定する
\(\hspace 15pt\)\(ae^\prime =e^\prime a =a\) より、\(a=e\)とすると \(ee^\prime =e^\prime e =e\)
\(\hspace 15pt\)また、\(ae =ea =a\) より、\(a=e^\prime\)とすると \(e^\prime e=ee^\prime =e^\prime\)
\(\hspace 15pt\)したがって\(e=e^\prime\)となって仮定に矛盾
\(\hspace 15pt\)すなわち単位元は唯一 \(\mathrm{Q.E.}\mathrm{D.}\)
\(\mathrm{Prf.}\)逆元の一意性
\(\hspace 15pt\)元\(a\)の逆元\(b\)は\(ba=e\)で定義される。
\(\hspace 15pt\)よって\(baa^{-1}=ea^{-1}\,, b=a^{-1}\)
\(\hspace 15pt\)\(a\)の\(b\)ではない逆元\(c\)が存在したとすると、同様の議論で\(c=a^{-1}\)
\(\hspace 15pt\)よって\(b=c\)となって逆元は唯一 \(\mathrm{Q.E.}\mathrm{D.}\)
まとめ
群とは、集合のうち、ある性質を満たすようなもののことでした。
群には様々な種類がありますが、物理学で多用するのは「連続群(リー群)」と呼ばれるものです。物理学でのリー群に関する導入的な参考書は少ないので、基本的な群の性質から勉強していきましょう。(終)
Planckの輻射法則(Planckの導出)
1900年、ドイツの物理学者Max Planckは黒体から放出される光のエネルギー密度と振動数の関係を、光のエネルギーを量子化することによって論理的に説明しました。このPlanckの量子仮説は量子力学の第一歩と言っても過言ではありません。
今回はそのPlanckの輻射法則をPlanckによる方法で導出します。
Planckの輻射法則
Planckの輻射法則は、放射エネルギー密度\(\rho\)について
$$\rho(\omega,T)=\frac{\hbar \omega ^3}{\pi^2c^3}\frac{1}{\exp(\hbar \omega /k_BT)-1}$$
という式で表されます。文献によっては、\(\hbar \to \frac{h}{2\pi}, \omega \to 2\pi \nu\)の表記で書いてあるかもしれません。
1 輻射の自由度
Plankによる導出は、光を波動として捉えるところから出発しています。
まず始めに輻射の自由度を考えます。輻射は電磁波なので、考えるべきは電磁波の自由度、さらに言えばVector Potential\(\bf A\)の自由度になります。
ここで\({\bf A}({\bf r},t)=A({\bf r})\exp(i\omega t)\)とすると 、□\({\bf A}=0\)から
$$\left(\Delta +\frac{\omega^2}{c^2}\right){\bf A}({\bf r})=\left(\Delta +k^2\right){\bf A}({\bf r})=0$$
となります。なお□はダランベール演算子で、□\({\bf A}=0\)はMaxwellの方程式をVector Potentialで表記した時の
$$□{\bf A}=\mu_0 {\bf i}$$
において\({\bf i}={\bf 0}\)としたものです。
さて、ここでVector Potentialがクーロンゲージを満たすとしましょう。この時、
$$\mathrm{div}{\bf A}=0 \Leftrightarrow {\bf A\cdot k}=0$$
となります。成分を顕にして書くと、
$$A_xk_x+A_yk_y+A_zk_z =0$$
です。また、波数\({\bf k}\)の大きさについては
$$|{\bf k}|^2=k_x^2+k_y^2+k_z^2\equiv k^2 =\frac{\omega ^2}{c^2}$$
となるので、天下り的ではありますが
$$k_x=\frac{n_x\pi}{a}\,,k_y=\frac{n_y\pi}{a}\,,k_z=\frac{n_z\pi}{a}\, n_x,n_y,n_z=1,2,3,...$$
とかけます。\(a\)は考えている空間の代表的なスケールであり、この式は空間の並進対称性によるものです。
この時、\((dn_z\,,dn_y\,,dn_z)\)の範囲に含まれるVector Potential\({\bf A}\)の自由度\(dN^\prime\)は\((n_z\,,n_y\,,n_z)\)空間の体積と同一視でき、 \(n_x,n_y,n_z\)は第一象限にあるので
$$dN^\prime=\frac{\pi}{2}n^2dn\, (n^2=n_x^2+n_y^2+n_z^2)$$
これは角振動数が\(\omega \sim \omega +d\omega\)にあるようなVector Potential の自由度なので\(dN^\prime (\omega)\)と書くと
$$dN^\prime (\omega)=\frac{1}{2}\pi n^2dn=\frac{\pi}{2}\left(\frac{a}{\pi}\right)^3k^2dk=\frac{V}{2\pi^2c^3}\omega ^2d\omega$$
一つの電磁波のモードには2つの編曲自由度があることを考えると
$$\frac{dN}{d\omega}=\frac{V}{\pi^2c^3}\omega^2$$
となります。
1.2 Rayleigh-Jeansの輻射法則
次に、実際にエネルギー密度と角振動数の関係を求めてゆきます。
まず温度\(T\)、体積\(V\)の空洞を用意し、その中での輻射を考えます。なお、輻射は一様で等方的かつ偏極なしと仮定しましょう。
輻射のエネルギー密度\(\rho(\omega ,T)\)は空洞全体との関係を考えると
$$\frac{E}{V}=\int_V \rho(\omega ,T)d\omega$$
となります。また、輻射のエネルギー=電磁場のエネルギーとしましょう。
さて、振動数は電磁場の固有振動数になります。これは考えている空間が有限の体積を持った空洞であるからです。
ここで次の2つの量を定義します。
\(\frac{dN}{d\omega}(\omega)d\omega\):角振動数が幅\(d\omega\)に含まれるモードの数
\(\bar{\varepsilon}(\omega,T)\):角振動数\(\omega\)のモードの温度\(T\)でのエネルギー
この時、角振動数が幅\(d\omega\)にあるようなエネルギーは
$$V\rho(\omega,T)d\omega = \frac{dN}{d\omega}(\omega)\bar{\varepsilon}(\omega,T)d\omega$$
$$\therefore \rho(\omega ,T)=\frac{1}{V}\frac{dN(\omega)}{d\omega}\bar{\varepsilon}(\omega,T)$$
となります。また、\(\frac{dN}{d\omega}=\frac{V}{\pi^2c^3}\omega^2\)から
$$\rho(\omega,T)=\frac{1}{\pi^2c^3}\omega^2\bar{\varepsilon}(\omega,T)$$
ここで光の偏光自由度が2で、エネルギー等分配則から\(\bar{\varepsilon}=k_BT\)となることを用いるとRayleigh-Jeansの輻射法則
$$\rho(\omega,T)=\frac{k_BT}{\pi^2c^3}\omega^2$$
導かれます。
エネルギーの量子化
導出したRayleigh-Jeansの輻射法則ですが、実際の観測結果と比べると\(\omega\)が大きい領域ではずれが生じてしまうことがわかっていました。
これを解決するために、Planckはエネルギーを量子化しました:
$$\varepsilon_n =n\cdot \hbar \omega $$
これを用いると平均のエネルギー\(\bar{\varepsilon}\)はBoltzmann分布により
$$\bar{\varepsilon}=\frac{\sum{}_n\varepsilon_n\exp(-\varepsilon/k_BT)}{\sum{}_n\exp(-\varepsilon_n/k_BT)}=\frac{\hbar \omega}{\exp(\hbar \omega/k_BT)-1}$$
となります。これを前述の\(\rho\)の式に代入すると
$$\rho(\omega,T)=\frac{\hbar \omega ^3}{\pi^2c^3}\frac{1}{\exp(\hbar \omega /k_BT)-1}$$
というPlanckの輻射法則が得られます。
Planckはこの導出を行う際に導入した「光エネルギーの量子化」はあくまで仮定として扱っており、具体的な物理的意味を見出すことはできませんでした。しかしその後Einsteinによって全く別の方向からPlanckの輻射法則が成り立つことが示され、光が粒子性を持つことが認められるようになります。(終)
Gaussの定理とStokesの定理
物理学では、閉領域や閉曲面、閉曲線におけるベクトルの積分を扱うことが多くあります。これらを結びつけるのがGaussの定理・Stokesの定理です。
復習〜Nabla演算子\(\nabla \)〜
Nabla演算子は、ベクトル場における勾配を求めるために導入された微分演算子です。3次元デカルト座標系におけるNabla演算子は
$$\nabla \equiv \left(\frac{\partial}{\partial x},\frac{\partial}{\partial y},\frac{\partial}{\partial z}\right)$$
となります。Nabla演算子はベクトルなので、スカラーに作用させるとベクトルが得られます。例えば力とポテンシャルの関係式。
$${\bf F}=-\nabla U$$
また、ベクトルとの内積(scalar product)を取るとスカラーになり、外積(vector product)を取るとベクトルになります。
Gaussの定理
はじめに注意して欲しいのですが、これから扱う「Gaussの定理」と「Gaussの法則」は全く別のものです。「Gaussの定理」は数学の定理であり、「Gaussの法則」は電磁気学の法則の一つです。
さてそのGaussの定理ですが、次のような式をしています。
$$\int _S {\bf J}\cdot{\bf n}dS=\int_V \nabla \cdot {\bf J}dV$$
ここで\(V\)は任意の閉領域、\(S\)は閉領域の表面で、\(\bf n\)は表面\(S\)の微小な面積要素における外向きの単位法線ベクトルです。
また右辺の被積分関数\(\nabla \cdot {\bf J}\)のようにNabla演算子とベクトルによる内積のような演算を\(\mathrm{div}\,{\bf J}\)と書きます。この演算子\(\mathrm{div}\)は「発散(divergence)」を意味しています。
定理の意味
Gaussの定理は物理的にどのような意味を持っているのでしょうか。Gaussの定理の右辺は\({\bf J}\cdot {\bf n}\)という量を表面積\(S\)で足し合わせています。\({\bf J}\cdot {\bf n}\)はある微小な面積要素におけるベクトル\({\bf J}\)の外向き法線方向の大きさでした。これを足し合わせた量は、表面からベクトル\({\bf J}\)が外に向かって出ている量、ということになります。\({\bf J}\)を流れのベクトルと見ると、\(\int_S {\bf J}\cdot{\bf n}dS\)は表面\(S\)から湧き出す流れの量となるでしょう。
では右辺はどのような意味があるのでしょう。実は\(\mathrm{div}\,{\bf J}\)は\(\bf J\)のある点における「湧き出し・吸い込み」を表しています。なので、これを体積全体で積分すると、閉領域\(V\)から出てゆくベクトル\(\bf J\)の量となります。
つまり、右辺・左辺ともに領域から湧き出すベクトル\(\bf J\)の量を表しており、記述方法が体積積分と面積積分の2通りあるということです。
Stokesの定理
次にStokesの定理をみてみましょう。
$$\oint_C {\bf F}\cdot d{\bf r}=\int_S( \nabla \times {\bf F})\cdot {\bf n}dS $$
左辺の\(C\)は閉経路で、右辺の\(S\)は\(C\)を境界に持つような曲面のことです。\(C\)の向きは、進行方向向かって左側に\(S\)があるような向き(正の向き)にします。
定理の意味
Gaussの定理と同様に、Stokesの定理もある量を二つの方法で表現しています。その量とは何でしょうか。
左辺はベクトル\(\bf F\)を閉曲線\(C\)に沿って積分した量になります。ならば、右辺も同様の量を表しているはずです。
右辺を考える前に、\(\nabla \times {\bf F}\)という演算を考えてみましょう。これは\(\mathrm{rot}\,{\bf F}\)とも書き、ベクトル\({\bf F}\)の「回転(rotation)」を表しています。では、\(\mathrm{rot}\,{\bf J}\)を\(S\)で積分することを考えましょう。
面\(S\)を微小領域に分割し、そのそれぞれで\(\mathrm{rot}\)を考えます。
中心にある領域の\(\mathrm{rot}\)を見ると、隣り合う領域と打ち消しあって0になることがわかります。このようなことが領域内部で成り立つので、\(S\)全体で考えると、境界での\(\mathrm{rot}\)しか残らないことになります。境界での\(\mathrm{rot}\,{\bf F}\)を全て足すと左辺の積分に一致するでしょう。
Stokesの定理はベクトルの境界における積分を、境界に着目した方法と面に着目した方法の二つで表したものだということです。
まとめ
Gaussの定理
$$\int_S {\bf J}\cdot{\bf n}dS=\int_V \mathrm{div}\, {\bf J}dV$$
Stokesの定理
$$\oint_C {\bf F}\cdot d{\bf r} = \int_S \mathrm{rot}\, {\bf F}\cdot{\bf n}dS$$
(終)