FarPhys〜物理学と戯れて〜

物理学の解説をしているFarPhysのブログです!

大学院入試【理学研究科・物理学専攻】

2022年度春入学の大学院入試が終わりました。1年ほどかけて準備をしてきた中で、文字で残しておきたいことがあったので、ここにまとめようと思います。

今回の受験の中身

・志望:東北大学 理学研究科 物理学専攻

・筆記試験:基礎数学・力学・電磁気学量子力学・熱統計力学

・面接試験:あり(今年はコロナの影響でオンライン面接でした)

・試験勉強を始めた時期:試験のちょうど1年前

・解いた過去問:東北大15回/東大物理36回(18年2周)/東大数学34回(17年2周)/京大3回

 

院試勉強、いつから始める?

「人それぞれ」だと思います。ですが、少なくとも3ヶ月以上前から院試対策として勉強するのをお勧めします。過去問を解いていく中で不足していた知識・計算技術の存在に気づくこともありますし、志望する大学の試験が他の大学の試験と似通っていることも多々あります。

学力に不安がある人、倍率の高い研究室を志望する人は1年ほど前から知識の見直しを始めても良いのではないでしょうか。

院試はあくまで試験ですので、合格したもの勝ちです。自分に実力があってもなくても、戦略的に望むのが良いと思います。

 

過去問はどれぐらい解く?

大学によって、公表されている過去問の量にはばらつきがあります。

東北大学:直近6年程度

東京大学:平成8年度〜

京都大学:平成8年度〜

研究室の先輩などに聞けばさらに昔の過去問が手に入ることもあります。また、研究室の学生部屋に歴代の過去問が残されている場合もありますので、探してみてください。

志望する大学院の問題は、できるだけ多く解くのが良いでしょう。3ヶ月あれば10~20年分の問題を解くことができるはずです。

ですが「解いて終わり」は最も良くない勉強法です。先人たちの回答例がWebなどに存在するはずなので、探してみてください。FarPhysでも入試問題の解答を公表していく予定です。

 

過去問を解ける自信がない人へ

過去問はあくまでも「自分の実力がどれぐらいかを測る手段」に過ぎません。基礎知識等に不安がある人は、まず最初に大学の演習問題を解くことをお勧めします。大学の演習問題や市販の演習書はその分野の基礎的な知識等を網羅しています。まずは「自分は何がわかっていないのか?」を明確にすることから始めましょう。

 

勉強するときのTips

ここからは試験勉強をする際の小技を紹介しようと思います。

勉強の記録をつける:自分がどれぐらいの時間を、何に費やしているかに意識的になりましょう。「学習計画表」などとGoogle検索すると勉強時間を記録するためのさまざまなツールが出てきます。アプリを使うのもよし、紙媒体を使うもよし、です。「今日はOO時間頑張った!」「明日も頑張ろう!」というモチベーションにもつながると思います。

勉強に使ったノート・紙は捨てずに残しておく:勉強に使ったノートたちは、努力の量そのものです。試験当日は不安になることもありますが、勉強に使ったノートの量がわかれば、自分に自信が持てると思います。また、勉強している際に「この問題、昔やったなぁ」と思う時が必ず来ます。その時に、以前自分がどのような議論をして答えを出したか確認できる手段があることは、どんなに素晴らしい解説書を読むよりも有益だと思います。

 

院試当日のTips

院試直前と当日にやっておくと良いことを紹介します。

1週間前から、当日起きる時間に起きるようにする:人間、急に「この時間に起きなさい!」と言われても無理です。早めに体を当日のスケジュールに慣らしておきましょう。

試験開始前に机に慣れる:大抵の場合、試験場は普段勉強している場所とは環境が全く異なります。机や椅子の高さ・硬さ・傾きもコンディションに直結します。試験場に入ったら、ノートに数式などを書いてその環境に少しでも慣れておきましょう。

解直しをする(特に理論志望者):理論系の研究室では面接の際に、筆記試験で間違えた問題を再度解き、解説することが要求されることが多々あります。筆記試験終了から面接試験までの時間は一晩〜1日と短いですが、自分の志望する研究室に関連する分野(素核理論なら数学・量子力学、物性理論なら電磁気学統計力学など)だけでも良いので解き直し、自分がどのように間違えたか、正しい議論はどのようなものか、しっかりと確認しておきましょう。

 

最後に

大学院入試は試験ですが、大学院からの生活は学部生時代の「お勉強生活」ではなく「研究生活」です。入試では最大限の努力をし、終わったら卒論やその先の研究に向けて、気持ちを切り替えていきましょう(終)

f:id:Pharphys:20210825192008j:plain
使ったノートの一部。入試勉強を通して抜けている知識や計算技術を再確認・習得できたので、勉強を頑張って損はないと思います。

井戸型ポテンシャルの共鳴

有限の深さの井戸型ポテンシャルに散乱状態の波動を入射すると「共鳴」が起こることが知られている.今回は確率密度流の反射・透過を計算した上で,共鳴状態について考えてみる.

セットアップ

f:id:Pharphys:20210713222546p:plain

ポテンシャルの形状


簡単のために1次元領域で議論をする.ポテンシャル$V(x)$が

$$ V(x)=\begin{cases} 0&x\leq -a/2\,,a/2\leq x\\ -V_0<0&-a/2<x<a/2 \end{cases} $$

で与えられている領域にエネルギー$E>0$をもった粒子状態が$x\to-\infty$から入射される状況を考えよう.散乱状態の波動関数はSchrödinger方程式を解いて一般に

$$ \psi(x)=Ae^{ikx}+Be^{ikx}\,, k=\sqrt{\frac{2m(E-V(x))}{\hbar^2}} $$

で与えられるが,$e^{ikx}$負から正の向きに確率密度流$j=\frac{\hbar^2 k}{m}$で進む波,$e^{-ikx}$は正から負の向きに確率密度流$j=\frac{\hbar^2k}{m}$で進む波なので、

$$ \psi(x)=\begin{cases} e^{ikx}+Re^{-ikx} &x<-a/2\\ \alpha e^{ik'x}+\beta e^{-ik'x}& -a/2<x<a/2\\ Te^{ikx}& a/2<x \end{cases} $$

と書くことができる.ただし各領域での波数は定義から

$$ k=\sqrt{\frac{2mE}{\hbar^2}}\,,k'=\sqrt{\frac{2m(E+V_0)}{\hbar^2}} $$

である.

係数を求める

ここからは波動関数の中に含まれている係数$R,T,\alpha,\beta$を求めていく.最終的な目標は透過率に対応する$T$を求めることだ.

境界条件として波動関数と1階導関数の連続性を要請すると,4条件が得られる.求める係数も4つであるから,この4条件を用いて議論していけばよさそうだ.

波動関数の連続性は

$$ \begin{align} e^{-ika/2}+Re^{ika/2}&=\alpha e^{-ik'a/2}+\beta e^{ik'a/2}\\ \alpha e^{ik'a/2}+\beta e^{-ik'a/2}&=Te^{ika/2} \end{align} $$

であり,1階導関数の連続性は

$$ \begin{align} ik(e^{-ika/2}-Re^{ika/2})&=ik'(\alpha e^{-ik'a/2}-\beta e^{ik'a/2})\\ ik'(\alpha e^{ik'a/2}-\beta e^{-ik'a/2})&=ikTe^{ika/2} \end{align} $$

となる.まず$x=a/2$での条件から

$$ \left(\begin{matrix} e^{ik'a/2}&e^{-ik'a/2}\\ ik'e^{ik'a/2}&-ik'e^{-ik'a/2} \end{matrix}\right) \left(\begin{matrix} \alpha\\\beta \end{matrix}\right)= T\left(\begin{matrix} e^{ika/2}\\ ike^{ika/2} \end{matrix}\right) $$

であり,これを解くと

$$ \begin{align} \left(\begin{matrix} \alpha\\\beta \end{matrix}\right)&= \frac{Te^{ika/2}}{-2ik'} \left(\begin{matrix} -ik'e^{-ik'a/2}&-e^{-ik'a/2}\\ -ik'e^{ik'a/2}&e^{ik'a/2} \end{matrix}\right) \left(\begin{matrix} 1\\ ik \end{matrix}\right)\\ &=\frac{Te^{ika/2}}{2ik'}\left(\begin{matrix} i(k+k')e^{-ik'a/2}\\ i(-k+k')e^{ik'a/2} \end{matrix}\right) \end{align} $$

となる.これを用いると

$$ \begin{align} &\begin{cases} Re^{ika/2}&=\frac{Te^{ika/2}}{2k'}\left((k+k')e^{-ik'a}+(-k+k')e^{ik'a}\right)-e^{-ika/2}\\ Re^{ika/2}&=-\frac{k'}{k}\frac{Te^{ika/2}}{2k'}\left((k+k')e^{-ik'a}-(-k+k')e^{ik'a}\right)+e^{-ika/2} \end{cases}\\ &Te^{ika/2}\left[\left(\frac{1}{k'}+\frac{1}{k}\right)(k+k')e^{-ik'a}+\left(\frac{1}{k'}-\frac{1}{k}\right)(-k+k')e^{ik'a}\right]=4e^{-ika/2}\\ &T=\frac{4kk'e^{-ika}}{(k+k')^2e^{-ik'a}-(k-k')^2e^{ik'a}}=\frac{e^{-ika}}{\cos(k'a)-i\frac{k^2+k'^2}{2kk'}\sin(ka)} \end{align} $$

となる.$|T|^2$が透過率であり,計算すると

$$ |T|^2=\left[\cos^2(k'a)+\left(\frac{k^2+k'^2}{2kk'}\right)^2\sin^2(k'a)\right]^{-1} $$

となる.$k=k'$となるような状態,すなわち$E\to\infty$では$|T|=1$となって波が完全に透過することがわかる.さらに他にも完全透過が起こる条件がある.

$$ \begin{align} 1&=\cos^2(k'a)+\left(\frac{k^2+k'^2}{2kk'}\right)^2\sin^2(k'a)\\ \therefore &(k^2-k'^2)^2\sin^2(k'a)=0\,, k'a=n\pi\ (n=1,2,3…) \end{align} $$

この状態は,井戸型ポテンシャルの幅$a$が半波長の整数倍となるような場合である.この時$x=\pm a/2$は定在波の節に当たるので,入射された波動があたかも束縛されているように見える.これが共鳴状態である(終).

f:id:Pharphys:20210713221434p:plain

透過率の波数依存性

 

MacBook Proを修理した話

今回は、物理の話ではなくMacBook Proが壊れて修理に出した話。

何が壊れた?

今回壊れたのはMacBook Pro(13-inch, 2017, Two Thunderbolt 3 ports)。買ったのは発売からしばらく経った2018年で、15万円以上した代物。 既に3年以上使っていて、Thunderbolt(USB-Cの差込口)の接触が悪くなって1度修理に出していました。

今回の故障は致命的でした。 普段通りzoomでの打ち合わせ中、突如電源が落ち画面が真っ暗に。慌てて他のデバイスでzoomに再接続したのですが、Macは再起動を始め…

「問題が起きたためコンピュータを再起動しました。このまま起動する場合は、いずれかのキーを押すか、数秒間そのままお待ちください。」

というメッセージ。「カーネルパニック」と呼ばれるエラーが発生していたようです。

カーネルパニック:主にUNIX系OSで発生する現象の1つで、Windowsの「ブルースクリーン」やMacOS X以降で標準実装する「パワーボタンマーク」などと同じ現象を指す。OSの中核部分であるカーネル(kernel)の実行に致命的な支障が発生することから、こう呼ばれるようになった。UNIXから派生したLinux系OSやMac OS Xにおいても、同様の状況をカーネルパニックと呼ぶことがある。(大塚商会

試したこと

さまざまなブログやApple サポートの記事を参考にして次のことを試しました。

  • システムの問題を解消するため、セーフブート(セーフモード)でMacを起動する
  • 復旧アシスタントを使ってOSの問題を解決する

ほとんどの場合はこれらを実行することで問題が解消するようなのですが、今回は何も進展がありませんでした。そして、

  • OSの再インストール

を実行。しかし再インストールの最中にMacがブラックアウトしてしまいました。

もうどうしようもない…!

これ以上できることがなかったので、Appleサポートに直接問い合わせよう…と思ったのですが、Apple Careの期限が切れておりサポートサービスを使えないことが判明。もはや修理に出すしかない!でも保障が切れているから修理費は実費になる…

そうは言っても直さない訳には行かないので、Apple のページから修理を予約。近い場所にサービスプロバイダがなかったので、車で20分ほどの距離にあるカメラのキタムラを予約しました。

いざ、修理へ

カメラのキタムラでMacの様子を見てもらうことに。お店のMacと壊れたMacBook Prowifiで繋いで、壊れ具合を確認してもらっていたのですが、

「お客様のmacとの通信が途切れました。フリーズしてしまってますね。おそらくハードの問題だと思います。」

ハードの問題、というのはMacの中に入っている基盤(ロジックボード)の故障とのこと。今回修理に出したMacBook Proのロジックボードはストレージと一体になっているらしく、ロジックボードを交換するとストレージも交換する必要があると言われました。当然保存していたファイルなどは復元できません(バックアップを定期的に取っていたので大きな影響はありませんでしたが、もしバックアップしていなかったら…恐ろしい)。

そして気になるお値段ですが…61,300円!!!衝撃です。しかしMacBook Pro一台の半分以下の値段なので、直す方が良いか…と思い修理をお願いしました。

修理、そして受け取り

修理に出したのは水曜日の夕方。そして土曜日の昼にカメラのキタムラから電話が。

「修理が完了したので、受け取りに来てください」

早い…!実質2日半で修理が終わったのです。代わりのPCを準備していなかったので、修理が早く完了して助かりました。

修理代は見積もり通りでした。故障の原因は結局わからなかったのですが、これからも大事に使っていこうと思います。(終)

f:id:Pharphys:20210709150223j:plain
修理報告書と返ってきたMacBook Pro

波動関数の境界条件

はじめに

波動関数量子力学において「粒子の状態」を記述する複素関数である。その絶対値の2乗は確率分布、つまりどれぐらいの確率で粒子がそこにいるかを表している。

領域によってポテンシャルが変わる場合には、それぞれでSchrödinger方程式をといて、それらの解に「境界条件」を課すというのが一般的だ。その境界条件は大抵、

というものである。これらはしばしば「物理的要請」として登場するのだが、本当に正当な条件なのだろうか。

デルタ関数のポテンシャル

簡単のために1次元に限って議論をしよう。$x=0$において無限の深さを持ったポテンシャルがあるとする。それ以外の領域でポテンシャルは0だ。

$$V(x)=-U\delta(x)\,, U>0$$

束縛状態

束縛状態とは、粒子のエネルギーがポテンシャルよりも小さい状態のことをいう。粒子のエネルギーを$E$とおくと、束縛状態では$E<0$だ。

このような状態についてSchrödinger方程式を解くと波動関数$\psi(x)$は連続性を考慮すると

$$\psi(x)=Ae^{-q|x|}$$

となる。ここで$q=\sqrt{-2mE}/\hbar$である。

ここで衝撃的なことがわかる。波動関数の連続性を要請すると、自動的に1階導関数の連続性は満たされない。1階導関数の連続性は必要条件、というわけではなさそうだ。

散乱状態

次に$E>0$の散乱状態を考えてみよう。散乱状態の波動関数は一般に規格化することができないため、「確率密度流」を導入して議論を行う。

例えば$e^{ikx}$という波動関数で表される状態は、確率密度流$j=\frac{\hbar k}{2m}$で$x$の負から正に移動する粒子状態に対応する。一方で$e^{-ikx}$は確率密度流の正負が逆転し、正から負に移動する粒子状態に対応する。

このようなことを考えると、粒子を負から正に流した際の波動関数

$$\psi(x)=\begin{cases}e^{ikx}+Be^{-ikx}&x<0\\Ce^{ikx}&0<x\end{cases}$$

とかける。$e^{ikx}$は入射した粒子、$Be^{-ikx}$は$x=0$のポテンシャルで反射した粒子、$Ce^{ikx}$はポテンシャルを透過した粒子に対応している。散乱状態の粒子が負のポテンシャルを感じて反射する、というのは少々気持ち悪いかもしれないが、一旦それを認めて次へ進もう。

今、波動関数には未知の定数$A,B$が含まれている。これを決めるために波動関数導関数の連続性を使うと、

$$1+B=C$$

$$ik(1-B)=ikC$$

つまり$B=0,C=1$である。

「ほら見ろ、散乱状態は負のポテンシャルで反射しないじゃないか!」と思うかもしれない。しかしここで使った「導関数の連続性」の正当性は確認できていないのだ。まずはそれについて考えてみよう。

導関数の連続性」?

一般のポテンシャルに対して、時間に依存しないSchrödinger方程式は次のようにかけた。

$$\left(-\frac{\hbar^2}{2m}\frac{d^2}{dx^2}+V(x)\right)\psi(x)=E\psi(x)$$

これを$x=0$の周り、$x\in[-\epsilon,\epsilon]\,,\epsilon\ll 1$で積分してみよう。

左辺は

$$\int_{-\epsilon}^\epsilon\left(-\frac{\hbar^2}{2m}\frac{d^2}{dx^2}+V(x)\right)\psi(x)dx =-\left.\frac{\hbar^2}{2m}\psi'(x)\right|_{-\epsilon}^\epsilon-\int_{-\epsilon}^\epsilon dxV(x)\psi(x)$$

右辺はすぐにわかる。

$$E\int_{-\epsilon}^\epsilon dx\psi(x)$$

$\psi(x)$や$V(x)\psi(x)$の原子関数が$x=0$で連続ならば、$\epsilon\to 0$の極限を考えることで

$$\int_{-\epsilon}^\epsilon dx V(x)\psi(x)=E\int_{-\epsilon}^\epsilon dx \psi(x)=0$$

となり、最終的に

$$\lim_{\epsilon\to0}\left.\psi'(x)\right|_{-\epsilon}^\epsilon=0$$

つまり$x=0$における波動関数の1階導関数の連続性が導かれる。

しかしデルタ関数形ポテンシャルではこれが成り立たない。なぜなら

$$\int_{-\epsilon}^\epsilon dx\delta(x)\psi(x)=\psi(0)$$

であるからだ。これを考慮すれば、デルタ関数形ポテンシャルの場合における、「波動関数の連続性」と並ぶもう一つの境界条件

$$-\left.\frac{\hbar^2}{2m}\psi'(x)\right|_{x\uparrow 0}^{\downarrow0}=-U\psi(0)$$

でなければならない。

これを解くとようやく定数$B,C$が

$$B=\frac{mU}{ik\hbar^2-mU}\,,C=\frac{ik\hbar^2}{ik\hbar^2-mU}$$

と決まる。

最後に

波動関数の1階導関数の連続性は「物理的要請」ではないことがわかった。しかしデルタ関数以外の大抵のポテンシャルに対しては、1階導関数の連続性を使って議論することになりそうだ。(終)

四元数と回転変換

気になる話題・問題があればこちらからお願いします→お題箱(google from)

 

 

四元数の導入

我々はこれまで様々な数を用いて物理を記述してきた.特に複素数の導入は物理学の記述に大きな貢献をした.それまで独立に扱ってきたサイン・コサイン関数をオイラーの公式
$$
e^{i\theta}=\cos\theta+i\sin\theta
$$
を介して統一的に扱うことができるようになった.この$e^{i \theta}$という形はLie群,すなわち連続パラメータで指定されるような変換の表現である.物理学では回転やブースト,平行移動といった基本的な変換を記述する.そのような意味で複素数という存在は物理学の発展に不可欠だった.

では新たな「虚数単位」とも呼ぶべき$j$を導入して
$$
a_0+a_1i+a_2j\ (a_0,a_1,a_2\in\mathbb{R})
$$
という数を定義してはどうだろう.この試みが成功すれば,物理学に新たな表現方法が生まれるかもしれない.

しかし現実はそう簡単ではない.我々が扱う数は「群」でなければならないという要請がある.すなわち集合$G$の要素$a,b,c$に対して積の演算$\times$が定義できて,
$$\begin{align} & a\times b\in G\\ & {}^\exists 1\in G\ s.t.\ a\times 1=1\times a =a\\ & {}^\exists a^{-1}\in G\ s.t.\ a\times a^{-1}=a^{-1}\times a=1\,, {}^\forall a\\ &(a\times b)\times c=a\times(b\times c)=a\times b\times c\end{align}
$$
の4つの条件を満たしていなければならない.

さて,新たに導入した虚数単位$j$について考えよう.演算は閉じるので,
$$
ij = A+Bi+Cj\,,A,B,C\in \mathbb{R}
$$
が成り立っているはずだ.これに$i$をかけてみよう.ただし$ij=ji$であるとは認めていないので左からかける必要がある.
$$
(-1)j=Ai-B+Cij
$$
これを満たすような$A,B,C$は実は存在しない.計算してみると
$$
-j=Ai-B+C(A+Bi+Cj)\\
(CA-B)+(A+CB)i+(C^2+1)j=0
$$
となるのだが,これが成り立つためには定数項および$i,j$の係数がそれぞれ$0$である必要がある.しかし$j$の係数を見てみると
$$
C^2+1=0
$$
となっている.このような実数$C$は存在しないから,虚数単位$j$を導入して「三元数」とでも呼ぶべき数を構成することはできないのだ.

では,$j$だけではなく$k$という虚数単位も導入してはどうだろうか.このような数
$$
q=q_0+q_1i+q_2j+q_3k\ (q_0,q_1,q_2,q_3\in\mathbb{R})
$$
のことを「四元数 (quaternion)」という.虚数単位の積については次のように定める.
$$
i^2=j^2=k^2=-1\\
ij=-ji=k\,,jk=-kj=i\,,ki=-ik=j
$$
自身との積(2乗)が$-1$になっているのは非常に自然だろう.一方で自分以外との積の関係は,正規直交基底の外積の関係に似ていることがわかる.
$$
\begin{cases}
\mathbf{e}_1\times \mathbf{e}_2=-\mathbf{e}_2\times \mathbf{e}_1=\mathbf{e}_3\\
\mathbf{e}_2\times \mathbf{e}_3=-\mathbf{e}_3\times \mathbf{e}_2=\mathbf{e}_1\\
\mathbf{e}_3\times \mathbf{e}_1=-\mathbf{e}_3\times \mathbf{e}_1=\mathbf{e}_2
\end{cases}
$$
後で確認するが,実際に四元数の第1,2,3成分は基底$\{i,j,k\}$が張る3次元ベクトルの拡張である.

さて,このように虚数単位の積を定義すれば四元数が積の演算で閉じることは明らかである.一方で交換則
$$
qq'=q'q
$$
が成り立たないことも明らかである.

さて,四元数の積の構造を見るために,$q=q_0+q_1i+q_2j+q_3k$の$q_0$をスカラー部分,残りをベクトル部分と呼ぶことにする.さらにスカラー部分は$\alpha:=q$,ベクトル部分は$\mathbf{a}:=q_1i+q_2j+q_3k$と書くことにする.すると2つの四元数$q=\alpha+\mathbf{a}\,,q'=\beta+\mathbf{b}$の積は
$$
qq'=\alpha\beta +\alpha\mathbf{b}+\beta\mathbf{a}+\mathbf{ab}
$$
となる.最後のベクトル同士の積は正規直交基底での内積$\langle\mathbf{a},\mathbf{b}\rangle$と外積$\mathbf{a}\times\mathbf{b}$に対して
$$
\mathbf{ab}=-\langle\mathbf{a},\mathbf{b}\rangle+\mathbf{a}\times\mathbf{b}
$$
と書くことができる(各成分を書き下して計算すればそれがわかる).このことから四元数のベクトル部分は3次元ベクトルを拡張したものであるとわかるだろう.

共役・逆元・ノルム

四元数は群の構造を持つ.従って逆元が存在する.また,複素数の拡張であるから共役を考えることもできる.さらに四元数はベクトルの拡張と見なすこともできるので,ノルムも存在するはずだ.これらの3つについて考えていく.

まず共役な四元数であるが,複素数$a+ib$の共役が虚数単位$i$を$-i$に変える操作だと思えば,四元数$q=q_0+q_1i+q_2j+q_3k$の共役は
$$
q^\dagger=q_0-q_1i-q_2j-q_3k
$$
と定義されるのが自然だろう.では,共役と積の関係はどのようになっているだろうか.先ほどの$q=\alpha+\mathbf{a}\,,q'=\beta+\mathbf{b}$に対して,共役と積の演算を行ってみると
$$
\begin{align}
(qq')^\dagger &= (\alpha\beta+\alpha\mathbf{b}+\beta\mathbf{a}-\langle\mathbf{a},\mathbf{b}\rangle+\mathbf{a}\times\mathbf{b})^\dagger\\
&= (\alpha\beta-\langle\mathbf{a},\mathbf{b}\rangle)-(\alpha\mathbf{b}+\beta\mathbf{a}+\mathbf{a}\times\mathbf{b})\\
q'^\dagger q^\dagger &= (\beta-\mathbf{b})(\alpha-\mathbf{a})\\
&=\alpha\beta-\alpha\mathbf{b}-\beta\mathbf{a}+\mathbf{ba}\\
&= (\alpha\beta-\langle\mathbf{a},\mathbf{b}\rangle)-(\alpha\mathbf{b}+\beta\mathbf{b}-\mathbf{b}\times\mathbf{a})\\
&= (\alpha\beta-\langle\mathbf{a},\mathbf{b}\rangle)-(\alpha\mathbf{b}+\beta\mathbf{b}+\mathbf{a}\times\mathbf{b})\\
&= (qq')^\dagger
\end{align}
$$
となる.この$(qq')^\dagger=q'^\dagger q^\dagger$という共役の構造は,まさに行列のエルミート共役の構造と同じだ.さらに$q^{\dagger\dagger}=q$という関係も明らかであろう.

次に自己の共役との積を考えてみる.
$$
\begin{align}
qq^\dagger &=(\alpha+\mathbf{a})(\alpha-\mathbf{a})\\
&= q_0q_0-\mathbf{aa}\\
&= q_0q_0+\langle\mathbf{a},\mathbf{a}\rangle-\mathbf{a}\times\mathbf{a}\\
&= q_0^2+q_1^2+q_2^2+q_3^2\\
&=q^\dagger q
\end{align}
$$
すなわち,四元数のノルムは次で定義することができる.
$$
||q||:=\sqrt{qq^\dagger}=\sqrt{q^\dagger q}=\sqrt{q_0^2+q_1^2+q_2^2+q_3^2}
$$
これはベクトルのノルムと全く同じ定義である.

さてノルムの正定値性
$$
q\neq 0\to ||q||>0
$$
から,次の関係式が成り立つ.
$$
q\left(\frac{q^\dagger}{||q||^2}\right)=\left(\frac{q^\dagger}{||q||^2}\right)q=1
$$
すなわち,$q\neq 0$は逆元$q^{-1}$を持つことがわかる.​
$$
q^{-1}=\frac{q^\dagger}{||q||^2}
$$
Note. 四元数代数系は体である.

体とは「非零の元$g$が逆元を持ち,非零の元による割り算で閉じる」ような代数系である.実際に$q\neq 0$について,
$$
q'q=q''q\to q'=q''
$$
であることがわかる.しかしこれはベクトルの内積外戚だけでは成り立たない.実際,ベクトル$\mathbf{a}\neq\mathbf{0}$に対して
$$
\langle \mathbf{a},\mathbf{b\rangle}=\langle \mathbf{a},\mathbf{c\rangle}
$$
が成り立っていても,$\mathbf{b}\neq\mathbf{c}$となるように$\mathbf{b},\mathbf{c}$を選ぶことができる.外積についても同様である.しかし,$\mathbf{ab}=-\langle\mathbf{a},\mathbf{b}\rangle+\mathbf{a}\times\mathbf{b}$に対しては,
$$
\mathbf{a}\neq 0,\mathbf{ab}=\mathbf{ac}\to \mathbf{b}=\mathbf{c}
$$
が必ず成り立つのである.

四元数による回転の表現

ノルムが1であるような四元数,単位四元数$q$を考えよう.そして四元数とみなしたベクトル$\mathbf{a}$を$q$で変換する.
$$
\mathbf{a}\to \mathbf{a'}=q\mathbf{a}q^\dagger
$$
変換後の四元数の共役を取ると$(q\mathbf{a}q^\dagger)^\dagger =q\mathbf{a}^\dagger q^\dagger=-q\mathbf{a}q^\dagger$であるから,$\mathbf{a'}$はベクトルであることがわかる.さらにノルムは
$$
\begin{align}
||\mathbf{a'}||^2 &= \mathbf{a'a'}^\dagger=q\mathbf{a}q^\dagger q\mathbf{a}^\dagger q^\dagger\\
&= q\mathbf{aa}^\dagger q^\dagger\\
&= ||\mathbf{a}||^2
\end{align}
$$
であり変換の前後で変化しないことがわかる.すなわち,単位四元数$q$による変換は,回転もしくは鏡映であることがわかる.実際には鏡映を含まない,純粋な回転を表す.このことを証明しよう.

その前に幾何学的なベクトルの回転を考える.任意のベクトル$\mathbf{a}$を単位ベクトル$\mathbf{n}$の周りで角度$\chi$だけ回転させるとどのようになるだろうか.これはロドリグの公式(Rodrigues Formula)で与えられる:
$$
\mathbf{a}\to \mathbf{a'}=\mathbf{a}\cos\chi+\mathbf{n}\times\mathbf{a}\sin\chi+\langle\mathbf{a},\mathbf{n}\rangle\mathbf{n}(1-\cos\chi)
$$

四元数によるベクトルの変換で,これと同じ式が得られるだろうか?まず,
$$
q_0^2+q_1^2+q_2^2+q_3^2 =1
$$
という条件から,次を満たすような$\chi$が存在する.
$$
q_0=\cos\frac{\chi}{2}\,,\sqrt{q_1^2+q_2^2+q_3^2}=\sin\frac{\chi}{2}
$$
この時,元の四元数は$q$のベクトル部分$q_1i+q_2j+q_3k$に平行な単位ベクトル$\mathbf{n}$を用いて
$$
q=\cos\frac{\chi}{2}+\mathbf{n}\sin\frac{\chi}{2}
$$
と書くことができる.この時,ベクトル$\mathbf{a}$の変換は次のようになる.
$$
\begin{align}
q\mathbf{a}q^\dagger &= \left(\cos\frac{\chi}{2}+\mathbf{n}\sin\frac{\chi}{2}\right)\mathbf{a}\left(\cos\frac{\chi}{2}-\mathbf{n}\sin\frac{\chi}{2}\right)\\
&= \mathbf{a}\cos^2\frac{\chi}{2}+(\mathbf{na}-\mathbf{an})\sin\frac{\chi}{2}\cos\frac{\chi}{2}-\mathbf{nan}\sin^2\frac{\chi}{2}
\end{align}
$$
ただし,
$$
\begin{align}
\mathbf{na}-\mathbf{an} &= 2\mathbf{n}\times \mathbf{a}\\
\mathbf{nan} &= \mathbf{n}(-\langle\mathbf{a},\mathbf{n}\rangle+\mathbf{a}\times\mathbf{n})\\
&= -\mathbf{n}\langle\mathbf{a},\mathbf{n}\rangle-\langle\mathbf{n},\mathbf{a}\times\mathbf{n}\rangle+\mathbf{n}\times(\mathbf{a}\times\mathbf{n})\\
&= -\mathbf{n}\langle\mathbf{a},\mathbf{n}\rangle+\mathbf{a}||\mathbf{n}||^2-\mathbf{n}\langle\mathbf{a},\mathbf{n\rangle}\\
&= -2\mathbf{n}\langle\mathbf{a},\mathbf{n}\rangle +\mathbf{a}||\mathbf{n}||^2
\end{align}
$$
である.このことから,変換後のベクトルは
$$
\begin{align}
q\mathbf{a}q^\dagger &=\mathbf{a}\left(\cos^2\frac{\chi}{2}-\sin^2\frac{\chi}{2}\right)+2\mathbf{n}\times\mathbf{a}\sin\frac{\chi}{2}\cos\frac{\chi}{2}+2\mathbf{n}\langle\mathbf{a},\mathbf{n}\rangle\sin^2\frac{\chi}{2}\\
&=\mathbf{a}\cos\chi+\mathbf{n}\times\mathbf{a}\sin\chi+\mathbf{n}\langle\mathbf{a},\mathbf{n}\rangle(1-\cos\chi)
\end{align}
$$
となって,確かにロドリグの公式に一致していることがわかる.このことから四元数$q$によるベクトルの変換は回転変換であることがわかる.

別の考え方によって四元数による変換が純粋な回転であることを確認することもできる.単位四元数$q$について,その条件$||q||=1$を保ったまま,
$$
q_0\to \pm 1,q_i\to0\ (i=1,2,3)
$$
という恒等変換に移すことができる.このことから,単位四元数による変換は連続パラメータで指定される,回転であることがわかる.

単位四元数による変換が回転であることがわかったところで,2つの回転変換を連続的に行うことを考えてみよう.抽象的に回転変換を$\mathcal{R}$と表現し,ベクトル$\mathbf{a}$から$\mathbf{a'}$への変換を
$$
\mathcal{R}:\mathbf{a}\to \mathbf{a'}=\mathcal{R}(\mathbf{a})
$$
とする.さらに$\mathcal{R}$に続けて$\mathcal{R'}$という変換を施す変換を$\mathcal{R'}\circ\mathcal{R}$と表現する.このとき,
$$
\begin{align}
\mathcal{R'}\circ\mathcal{R}:\mathbf{a}\to \mathbf{a'}&:=\mathcal{R'}\circ\mathcal{R}(\mathbf{a})\\
&= q'(q\mathbf{a}q^\dagger)q'^\dagger\\
&= (q'q)\mathbf{a}(q'q)^\dagger
\end{align}
$$
が成り立つことがわかる.すなわち,回転$\mathcal{R}$の四元数による表現を
$$
\mathcal{D}^\mathrm{quat.}(\mathcal{R})=q\,,\mathcal{D}^\mathrm{quat.}(\mathcal{R'})=q'
$$
と書く時,連続した回転の表現は次を満たす.
$$
\mathcal{D}^\mathrm{quat.}(\mathcal{R'\circ\mathcal{R}})=q'q=\mathcal{D}^\mathrm{quat.}(\mathcal{R'})\mathcal{D}^\mathrm{quat.}(\mathcal{R})
$$
すなわち,回転変換の四元数による表現は準同型(積と表現が可換)である.

余談

例えば2次正方行列
$$
U=\left(\begin{matrix}q_0-iq_3 & -q_2-iq_1\\ q_2-iq_1 & q_0+iq_3\end{matrix}\right)
$$
四元数の表現になっている.実際,行列の積
$$
\left(\begin{matrix}q''_0-iq''_3 & -q''_2-iq''_1\\ q''_2-iq''_1 & q''_0+iq''_3\end{matrix}\right)=\left(\begin{matrix}q'_0-iq'_3 & -q'_2-iq'_1\\ q'_2-iq'_1 & q'_0+iq'_3\end{matrix}\right)\left(\begin{matrix}q_0-iq_3 & -q_2-iq_1\\ q_2-iq_1 & q_0+iq_3\end{matrix}\right)
$$
四元数の積
$$
(q''_0+q''_1+q''_2+q''_3)=(q'_0+q'_1+q'_2+q'_3)(q_0+q_1+q_2+q_3)
$$
は同値である.というのも,行列$U$を
$$
\begin{align}
U&=q_0\left(\begin{matrix}1 & 0\\ 0&1\end{matrix}\right)+q_1\left(\begin{matrix}0 & -i\\ -i&0\end{matrix}\right)+q_2\left(\begin{matrix}0 & -1\\ 1&0\end{matrix}\right)+q_3\left(\begin{matrix}-i & 0\\ 0&i\end{matrix}\right)\\
&=q_0\mathbf{1}_2+q_1S_1+q_2S_2+q_3S_3
\end{align}
$$
と書き表すと,行列$\mathbf{1}_2,S_1,S_2,S_3$が四元数の「基底」$1,i,j,k$と同じ関係式
$$
S_1^2=S_2^2=S_3^2=-\mathbf{1}_2\\
S_1S_2=-S_2S_1=S_3\,,S_2S_3=-S_3S_2=S_1\,,S_3S_1=-S_1S_3=S_2
$$
を満たすからである.さらに,ここで導入した行列$S_1,S_2,S_3$であるが,無限小回転の表現であるパウリ行列を用いれば

{S_1=-i\sigma^1,S_2=-i\sigma^2,S_3=-i\sigma^3}

と書くことができる.このことからも四元数が回転と密接に結びついていることがわかるだろう(終)

対称性の話をしよう。

気になる話題・問題があればこちらからお願いします→お題箱(google from)

目次

1. 様々な対称性

私たちが見ることのできるこの世界には.様々な「対称性」を持ったものが存在する.鏡に映る自分の姿は左右が反転された像だ.これは「反転対称」「鏡映」という.球は回転対称性を持つ.しかもどのように軸をとっても対称性がある.日本の伝統的な染物に見られる七宝は,ある特定の方向に特定の距離だけ動かすと元の模様に戻る.これは「並進対称」だ.

https://frame-illust.com

さらに,私たちが馴染みのある数学の世界にも対称性が存在する.「対称式」はその一例で,$x^2+y^2$などのように変数を入れ替えても式が変わらないものを言う.さらにこの対称式には面白い性質があり,基本対称式と呼ばれる低い次数の対称式を用いて表すことができるのだ.この話は本筋から外れるのでこの程度にしておくが,対称性を数学的に見ると幾つか面白い性質が現れることが期待できる.

それでは物理の話に移ろう.

2. 古典力学の対称性〜ネーターの定理〜

ここでは力学を記述する方法として「ラグランジュ形式」を用いる.高校物理まではニュートン運動方程式$F=ma$に基づく「ニュートン形式」を用いて物理を表現してきた.しかしこの方法は座標の取り方に大きくよるため,一般性が低い.そこで座標に依存しない運動エネルギー$K$とポテンシャル$V$から定義されるラグランジアン$L=K-V$で物理を表現するのがラグランジュ形式である.ラグランジュ形式での運動方程式
$$\frac{d}{dt}\frac{\partial L}{\partial \dot{q}}-\frac{\partial L}{\partial q}=0$$
という「オイラーラグランジュ方程式」である.なお,ラグランジアンは「一般化座標$q$」とその時間微分$\dot{q}$及び時間の関数である.

ネーターの定理とは,無限小変換に対して系が不変量である時,その無限小変換に対応する「保存量」が存在するという定理である.具体的には,時間と一般化座標の無限小変換$$\begin{align} t\to t+\delta t\,,q^i\to q^i+\delta q^i\end{align}$$について,無限小変換がパラメータ$\epsilon$と用いて$$\delta t=\epsilon T\,, \delta q^i =\epsilon Q^i$$と書かれる時,$X$という物理量$$X=\left(\frac{\partial L}{\partial \dot{q}^i}\dot{q}^i-L\right)T-\frac{\partial L}{\partial \dot{q}^i}Q^i$$が存在して,これが保存量$$\frac{dX}{dt}=0$$になる.

これを自由粒子に対して考えよう.自由粒子ではポテンシャル$V=0$であるから,ラグランジアンは粒子の質量を$m\,$ として
$$L=\sum_{i=1,2,3}\frac{1}{2}m{\dot{q}^i}^2$$
で書ける.このラグランジアンに,「並進対称性」を要求しよう.すなわち,ベクトル$\mathbf{n}=(n^1,n^2,n^3)$方向への無限小の並進変換
$$q^i\to q^i+\epsilon n^i$$
に対してラグランジアンが不変であるということである.これを先程の式に代入して$X$を求めると,
$$X=\sum_{i=1,2,3}-m\dot{q}^in^i$$
である.ただし$\mathbf{n}$は任意に選んで良いので,結局のところ$m\dot{q}$すなわち「運動量が保存量」となることがわかる.

次に,ラグランジアンが時間発展しても変化しないことを要請しよう.これは「時間発展対称性」という.無限小変換は
$$t\to t+\epsilon T$$
であり,$X$は

$$X=\sum_{i=1,2,3}\left(m{\dot{q}^i}^2-\frac{1}{2}m{\dot{q}^i}^2\right)T =T\sum_{i=1,2,3}\frac{1}{2}m{\dot{q}^i}^2$$

このように,系にある対称性を要請するとそれに対応する何らかの物理量が保存量になることがわかる.しかし,対称性と保存量の関係はまだ顕ではない.この話は「4. 量子力学の対称性」で詳しく見ることにしよう.

3. マクスウェル方程式の対称性と因果律

マクスウェル方程式は,電磁気学の根幹をなす方程式で,以下の4つの式からなる. $$\begin{align} &\nabla\cdot \mathbf{E}=\frac{\rho}{\varepsilon_0}\\&\nabla\cdot \mathbf{B}=0\\ &\nabla\times \mathbf{E}+\frac{\partial\mathbf{B}}{\partial t}=0 \\ &\nabla\times \mathbf{B}=\mu_0\mathbf{j}+\mu_0\varepsilon_0\frac{\partial\mathbf{E}}{\partial t} \end{align}$$ さらに電荷保存則(連続の方程式)$$\frac{\partial\rho}{\partial t}+\nabla\cdot\mathbf{j}=0$$という式も成り立つ.

さて,電流$\mathbf{j}$というのは荷電粒子の流れ($\mathbf{j}=e\mathbf{v}$)であるから,「時間反転」をすると逆向きになることがわかる.そして電場$\mathbf{E}$は電荷が存在することによって生まれるから,時間反転に対して対称であるだろう.一方で磁場は電流から造られるので,時間反転に対して反対称(逆向きになる)だと考えられる.これらのことをまとめてみると
$$\begin{cases} \mathbf{j}\to \mathbf{j'}=-\mathbf{j}\\ \mathbf{E}\to \mathbf{E'}=\mathbf{E}\\ \mathbf{B}\to \mathbf{B'}=-\mathbf{B}\end{cases}$$だ.これを元にマクスウェル方程式を時間反転させてみよう.もちろん$t\to -t$と変換されるから,結局のところ元の形を保つ.マクスウェル方程式は時間反転対称なのである.

マクスウェル方程式が時間反転対称性を持つことを如実に示しているのが「先進・遅延ポテンシャル」の存在である.マクスウェル方程式から電場と磁場を求めようと思っても(実際に求めるのは「電磁ポテンシャル」),いくつか自由度が残っている.そこで新たに拘束条件を加えてマクスウェル方程式を解く.ローレンツ・ゲージと呼ばれる条件を与えるときに得られるのが「先進・遅延ポテンシャル」であり,
$$\begin{align} A(\mathbf{x},t) &= \frac{\mu_0}{4\pi}\int \frac{\mathbf{j}(\mathbf{s},t\pm|\mathbf{x-s}|/c)}{|\mathbf{x-s}|}\cdot d\mathbf{s}\\ \varphi(\mathbf{x},t)&=\frac{\mu_0}{4\pi}\int \frac{\rho(\mathbf{s},t\pm|\mathbf{x-s}|/c)}{|\mathbf{x-s}|}d\mathbf{s}\end{align}$$という式でかける.ここで注目すべきは被積分関数内の$\mathbf{j},\rho$の時間依存である.$$t\pm\frac{|\mathbf{x-s}|}{c}$$という形になっているのだ.これは,座標$\mathbf{x}$,時刻$t$でのポテンシャルが,座標$\mathbf{s}$,時刻$t\pm|\mathbf{x-s}|/c$の電流・電荷分布に影響を受けていることを意味している.複号の$-$については,距離$|\mathbf{x-s}|$だけ隔たった場所の昔の情報が今に影響している,と解釈できる.これが「遅延ポテンシャル」というものだ.一方で複号の$+$,「先進ポテンシャル」についての解釈は厄介だ.距離$|\mathbf{x-s}|$だけ隔たった場所の今後の情報が今に影響している,という解釈になるからである.今の物理状態が未来の物理状態に影響を受けるということはありえないだろう.

先進ポテンシャルはこのような物理的に納得できない解釈を生むので「あり得ない」という理由で棄却される.しかし,そのような事態に陥るのはそもそもマクスウェル方程式が時間反転対称性を持ち,時間が逆行しても問題ない形をしているからである.

電磁気学の基本方程式は,「Aが起こったからBが起きた」というような因果律を含まない,美しい対称性を持つが少々厄介な方程式なのである.

4. 量子力学の対称性

量子力学を記述するのはシュレディンガー方程式であるが,そのベースには古典力学の「ハミルトン形式」がある.ラグランジュ形式でのラグランジアンのように,ハミルトン形式には物理を表す量としてハミルトニアンがある.それはラグランジアンの「ルジャンドル変換」で与えられる.
$$
H=\sum_{i}p_i\dot{q}^i-L=\frac{1}{2m}p^2+V
$$
量子力学でのハミルトニアンは,運動量演算子$\hat{p}$とポテンシャル$V$に対して
$$
H=\frac{1}{2m}\hat{p}^2+V
$$
で書ける.古典力学ハミルトニアンと形が同じなのである.

さて,量子力学において連続パラメータ$\theta$で指定されるような変換(回転や並進)は,それに対応する「生成元」と呼ばれる演算子$\hat{G}$に対して
$$\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)$$で与えられることが知られている.これを波動関数に演算させることによって,変換された波動関数が得られるというわけだ.では,波動関数がこの演算(変換)に対して不変であるとはどういうことだろうか.波動関数を$\psi$と書くことにすると,これは(時間に依存しない)シュレディンガー方程式$$H\psi=E\psi$$を満たしている.ここでの$E$はエネルギー固有値で,$\psi$は固有関数になっている.この$\psi$に対して変換を行うと$$\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)\psi=e^{i\delta}\psi$$となる.ここで$e^{i\delta}$は波動関数の位相である.物理的に意味を持つのは$|\psi|^2$という「確率密度」であるから,ここでは位相の違いは特に意味を持たない.なので$e^{i\delta}=1$として議論を進めよう.
この式に左から$H$を演算させると,$$H\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)\psi=H\psi=E\psi$$となる.このことから,$$\begin{align} H\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)\psi=\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)H\psi\\ \therefore H\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)=\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)H\end{align}$$であることがわかる.交換関係の記号を用いるなら$$\left[H,\exp\left(-\frac{i}{\hbar}\theta\hat{G}\right)\right]=0$$である.ここで,$\exp$が冪級数で展開できることを思い出すと,この交換関係は$$[H,\hat{G}]=0$$に帰着する.つまり,ハミルトニアンと交換可能(可換)な演算子を生成元とする連続的な変換では,波動関数は不変なのである.さらに,ハイゼンベルグ方程式と呼ばれる方程式$$i\hbar\frac{\partial \hat{A}}{\partial t}=[H,\hat{A}]$$から,ハミルトニアンと可換な演算子(に対応する物理量)は保存量なのである.要は系を不変に保つ変換の生成元が保存量であるということだ.

並進対称演算子の生成元は運動量演算子である.また,時間発展演算子の生成元はハミルトニアン(エネルギーの演算子)である.このようなことは,「2. 古典力学の対称性〜ネーターの定理〜」の最後に確認した事実と一致していることがわかるだろう.

5. 対称性の破れ

量子力学は物理の終着点ではない.その一歩先に「場の理論」というものが存在する.これは量子力学を相対論的に扱った先に登場する物理の記述である.

そこで重要となる対称性が,チャージ対称性(C対称性),パリティ対称性(空間反転対称性,P対称性),時間反転対称性(T対称性)とその組み合わせである.

1950年代までに,C対称性とP対称性はそれぞれ破れていることが指摘されていた.その一方でCP対称性は破れていないのではないかと思われていた.しかし1964年に,K中間子の崩壊の観測からCP対称性も僅かに破れていることが明らかになる.そしてこのCP対称性の破れを理論的に説明するには,クオークに3つの世代が必要であることが小林・益川によって指摘された.1973年のことである.

1995年までに未発見だった3つのクオーク(チャーム・ボトム・トップ)が見つかり,2008年には小林・益川両氏にノーベル賞が授与された.

現在ではT変換を含めたCPT対称性が成り立っているのではないかと考えられている.もしCPT対称性すら破れていると,特殊相対性理論の礎となっている「ローレンツ対称性」も自動的に破れることになると指摘されている.

物理には様々な「対称性」が存在し,それらが相互に絡み合っている.物理現象を統一的に説明する「究極の理論」があるのならば,そこには美しい対称性があってほしいと思うのが物理学者だろう.

今まさに「究極の理論」の探索が,理論・実験の両方で行われている.この世界はどのような対称性を持っているのだろうか.そこに広がる理論はどのようなものなのだろうか.明らかになるのが待ち遠しい.(終)

縮退のある摂動

気になる話題・問題があればこちらからお願いします→お題箱(google from)

前回の記事はこちら↓↓↓

 

fartherphysics.hatenablog.com

 

前回、時間依存しないSchrödinger方程式を冪級数展開で解きましたが、「縮退のない場合」に限った議論でした。では、縮退のある系はどのように扱えば良いのでしょうか。

縮退のある場合の摂動論

縮退がある系に対しての議論で問題になるのは、状態の摂動展開を計算する際に$$(E_k^{(0)}-E_n^{(0)})\langle k^{(0)}|n^{(1)}\rangle =-\delta H_{kn}$$という形になってしまい、内積不定になってしまう点である。これを上手い具合に回避するために、縮退している部分とそうではない部分に分けて考えるのが良いだろう。
まず、元のHamiltonianに対するエネルギー固有値を$$…<E_{n-1}<\underbrace{E_{n}=E_{n}=…=E_{n}}_{N}<E_{n+1}<…$$とする。すなわち$N$個の状態が縮退しているのである。この縮退している状態が張る空間を$V_N$、それ以外の縮退していない状態が張る空間を$\tilde{V}$と表記する。そして、縮退している状態は区別できるように$$|n^{(0)};1\rangle ,|n^{(0)};2\rangle ,…,|n^{(0)};N\rangle\in V_N\\H^{(0)}|n^{(0)};k\rangle =E_n^{(0)}|n^{(0)};k\rangle$$と書く。さらに正規直交条件を課しておく。$$\langle n^{(0)};p|n^{(0)};q\rangle =\delta _{p,q}$$また、二つの空間の和は全状態空間を張る:$\mathcal{H}=V_N\oplus \tilde V$。もちろんであるが、$V_N$と$\tilde V$は直交している:$$\langle p^{(0)}|n^{(0)};k\rangle =0$$さて、我々が求めていくのは状態とエネルギーの摂動展開である。すでに見たように、$$\begin{align} |n^{(0)};k\rangle \to |n,k\rangle &=|n^{(0)};k\rangle +\lambda|n^{(1)};k\rangle +\lambda^2|n^{(2)};k\rangle +…\\ E_n^{(0)}\to E_n &= E_{n}^{(0)}+\lambda E_{n,k}^{(1)}+\lambda^2 E_{n,k}^{(2)}+…\end{align}$$と書くことができ、これをSchrödinger方程式に代入することによって次々に状態とエネルギーを計算する。ただし、考えるのは縮退した状態$|n;k\rangle$だけで良い。というのも、縮退のない空間$\tilde V$についてはすでに議論が済んでいて、縮退のある場合に生じてきた問題を解決するのがここでの目標だからである。
さて、Schrödinger方程式に上記の冪級数を代入して$\lambda$について整理したものは、摂動のない場合と同様に$$\begin{align} \mathrm{O}(\lambda^0) &: (H^0-E_n^{(0)})|n^{(0)};k\rangle =0\\ \mathrm{O}(\lambda^1) &: (H^0-E_n^{(0)})|n^{(1)};k\rangle =(E_{n,k}^{(1)}-\delta H)|n^{(0)};k\rangle\\ \mathrm{O}(\lambda^2) &: (H^0-E_n^{(0)})|n^{(2)};k\rangle =(E_{n,k}^{(1)}-\delta H)|n^{(1)};k\rangle +E_{n,k}^{(2)}|n^{(0)};k\rangle\\ \vdots\end{align}$$とかける。具体的な計算ステップは次の通りである。

1. $\mathcal{O}(\lambda^1)$の式に左から$\langle n^{(0)};l|$を作用させて、エネルギーの1次摂動を計算する。
2. $\mathcal{O}(\lambda^1)$から$|n^{(1)};k\rangle$の$\tilde{V}$空間成分を計算する。
3. $\mathcal{O}(\lambda^2)$の式に左から$\langle n^{(0)};l|$を作用させて、エネルギーの2次摂動と$|n^{(1)};k\rangle$の$V_N$空間成分を計算する。

Step 1

$\mathcal{O}(\lambda^1)$の式に左から$\langle n^{(0)};l|$を作用させると、やはり左辺は$0$になる。一方で右辺について考えると$$\begin{align} \mathrm{RHS}&=\langle n^{(0)};l|(E_{n,k}^{(1)}-\delta H)|n^{(0)};k\rangle\\ &=E_{n,k}^{(1)}\delta_{l、k}-\langle n^{(0)};l|\delta H|n^{(0)};k\rangle\\ \therefore &\langle n^{(0)};l|\delta H|n^{(0)};k\rangle=E_{n,k}^{(1)}\delta_{l、k}\end{align}$$となる。つまり、$\delta H$の$V_N$空間での行列要素$\langle n^{(0)};l|\delta H|n^{(0)};k\rangle\equiv \delta H_{nl,nk}$は$l\neq k$の要素(非対角要素)が全て$0$になる、対角行列なのである*1。また、エネルギーの一次摂動は$$E_{n,k}^{(1)}=\delta H_{nk,nk}$$であることがわかった。

Step 2

$\mathcal{O}(\lambda^1)$の式に左から$\langle p^{(0)}|\in \tilde{V}$をかける。すると$$\begin{align} \langle p^{(0)}|(H^{(0)}-E_n^{(0)})|n^{(1)};k\rangle &=\langle p^{(0)}|(E_{n,k}^{(1)}-\delta H)|n^{(0)};k\rangle\\ (E_p^{(0)}-E_n^{(0)})\langle p^{(0)}|n^{(1)};k\rangle &=-\langle p^{(0)}|\delta H|n^{(0)};k\rangle\end{align}$$となる。ただし$\langle p^{(0)}|n^{(0)};k\rangle=0\ (\tilde{V}\perp V_N)$を用いた。従って$$(E_p^{(0)}-E_n^{(0)})\langle p^{(0)}|n^{(1)};k\rangle =-\delta H_{p,nk}$$を得る。なお、これは$|n^{(1)};k\rangle$の$\tilde V$空間の基底による展開である。従って、$V_N$空間の基底と$|n^{(1)};k\rangle$との内積については何も述べていない。これに注意して$|n^{(1)};k\rangle$の展開を考えると、$$\begin{align} |n^{(1)};k\rangle &=\sum_p |p^{(0)}\rangle \langle p^{(0)}|n^{(1)};k\rangle +\left.|n^{(1)};k\rangle\right|_{V_N}\\ &=-\sum_p \frac{\delta H_{p,nk}}{E_p^{(0)}-E_n^{(0)}}|p^{(0)}\rangle +\left.|n^{(1)};k\rangle\right|_{V_N}\end{align}$$となるのである。この段階では$|n^{(1)};k\rangle$の$V_N$空間にある状態について何もわかっていない。これを求めるのが次のStep 3である。

Step 3

$\mathrm{O}(\lambda^2)$の式に左から$\langle n^{(0)};l|$を作用させる。やはり左辺は$0$になる。右辺は$$\begin{align} \mathrm{RHS} &= \langle n^{(0)};l|(E_{n,k}^{(1)}-\delta H )|n^{(1)};k\rangle +E_{n,k}^{(2)}\langle n^{(0)};l|n^{(0)};k\rangle\\ &= \langle n^{(0)};l|(E_{n,k}^{(1)}-\delta H)\left(-\sum_p \frac{\delta H_{p,nk}}{E_p^{(0)}-E_n^{(0)}}|p^{(0)}\rangle +\left.|n^{(1)};k\rangle\right|_{V_N}\right)+E_{n,k}^{(2)}\delta _{l、k}\end{align}$$である。さらに、$\langle n^{(0)};l|\delta H$を展開すると$$\begin{align} \langle n^{(0)};l|\delta H &= \langle n^{(0)};l|E_{n,l}^{(1)}+\sum_p \langle n^{(0)};l|p^{{(0)}}\rangle \langle p^{(0)}|\end{align}$$となる(注1を参照)。従って$$\left.\langle n^{(0)};l|\delta H|n^{(1)};k\rangle\right|_{V_N}=\left.E_{n,l}^{(1)}\langle n^{(0)};l|n^{(1)};k\rangle\right|_{V_N}$$を得る。これらのことから、$\mathcal{O}(\lambda^2)$の式は展開して整理すると次のようになる。$$\sum_p \frac{\delta H_{p,nk}}{E_p^{(0)}-E_n^{(0)}}\underbrace{\langle n^{(0)};l|\delta H|p^{(0)}\rangle}_{\delta H_{nl,p}}+(E_{n,k}^{(1)}-E_{n,l}^{(1)})\left.\langle n^{(0)};l|n^{(1)};k\rangle \right|_{V_N}+E_{n,k}^{(2)}\delta _{l、k}=0$$$l=k$を考えれば$E_{n,k}^{(2)}$がわかる。$$E_{n,k}^{(2)}=-\sum_p \frac{|\delta H_{p,nk}|^2}{E_p^{(0)}-E_n^{(0)}}$$一方で$k\ne l$について考えると、$$\left.\langle n^{(0)};l|n^{(1)};k\rangle\right|_{V_N} =-\frac{1}{E_{n,k}^{(1)}-E_{n,l}^{(1)}}\sum_p\frac{\delta H_{p,nk}\delta H_{nl,p}}{E_p^{(0)}-E_n^{(0)}}$$となる。よって$\left.|n^{(1)};k\rangle\right|_{V_N}$がわかる。$$|\left.n^{(1)};k\rangle \right|_{V_N}=-\sum_{l\ne k}|n^{(0)};l\rangle \frac{1}{E_{n,k}^{(1)}-E_{n,l}^{(0)}}\sum_p \frac{\delta H_{p,nk}\delta H_{nl,p}}{E_p^{(0)}-E_n^{(0)}}$$以上から、状態の1次摂動は次のようにかける。$$|n^{(1)};k\rangle =\sum_p \frac{\delta H_{p。nk}}{E_p^{(0)}-E_n^{(0)}}|p^{(0)}\rangle --\sum_{l\ne k}|n^{(0)};l\rangle \frac{1}{E_{n,k}^{(1)}-E_{n,l}^{(0)}}\sum_p \frac{\delta H_{p,nk}\delta H_{nl,p}}{E_p^{(0)}-E_n^{(0)}}$$

*1:$\delta H$は$V_N$空間では対角化されているが、全体の状態空間$\mathcal{H}$では対角化されておらず、$\tilde{V}$空間では非対角要素が残っている。$\mathcal{H}$空間で$\delta H|n^{(0)};l\rangle$を計算すると、$\delta H|n^{(0)};l\rangle =E_{n,l}^{(1)}|n^{(0)};l\rangle+\sum_{p}|p^{(0)}\rangle\langle p^{(0)}|\delta H|n^{(0)};l\rangle$となって余分な項が出てきているのがわかる