Kapitel 4
Die Quantentheorie

7    Translationen in Raum und Zeit, Energie und Impuls



Translationen im Raum

Im letzten Kapitel haben wir viel darüber erfahren, wie Symmetrien in der Quantentheorie dargestellt werden. Nun wird es Zeit für eine erste konkrete Anwendung: Translationen (Verschiebungen) in Raum und Zeit. Sowohl die nichtrelativistische Galileigruppe als auch die relativistische Poincarégruppe enthalten beide solche Verschiebungen. Daher hängt die Darstellung von Translationen in Raum und Zeit nicht davon ab, ob wir eine nichtrelativistische oder eine relativistische Theorie betrachten.

Beginnen wir mit Translationen im Raum. Die Zeittranslationen gehen dann vollkommen analog (siehe unten). Die Idee ist, dass es für die Physik egal sein sollte, ob wir ein Experiment an einem Ort \(\boldsymbol{x}\) oder einige Meter weiter an einem dazu gleichwertigen Ort \(\boldsymbol{x} + \boldsymbol{a}\) durchführen. Wie bei Drehungen können wir auch Raumtranslationen durch ihre Wirkung auf den räumlichen Ortsvektor \(\boldsymbol{x}\) beschreiben: \[ g(\boldsymbol{a}) \, \boldsymbol{x} := \boldsymbol{x} + \boldsymbol{a} \] Man sieht in dieser Darstellung sofort, dass man jedes Gruppenelement \(g(\boldsymbol{a})\) mit Hilfe der Exponentialreihe darstellen kann: \[ g(\boldsymbol{a}) = e^{ \boldsymbol{a} \frac{d}{\boldsymbol{dx}} } \] mit \[ \boldsymbol{a} \frac{d}{\boldsymbol{dx}} = a^i \, \frac{d}{dx^i} =: a^i \, A_i \] (mit Summe über \(i\)), d.h. \[ A_i = \frac{d}{dx^i} \] in dieser Darstellung. In der Exponentialreihe tragen nämlich nur die ersten beiden Terme bei: \[ g(\boldsymbol{a}) \, \boldsymbol{x} = e^{ \boldsymbol{a} \frac{d}{\boldsymbol{dx}} } \, \boldsymbol{x} = \] \[ = \left( 1 + \boldsymbol{a} \frac{d}{\boldsymbol{dx}} + \frac{1}{2} \left( \boldsymbol{a} \frac{d}{\boldsymbol{dx}} \right)^2 + \, ... \right) \, \boldsymbol{x} = \] \[ = \boldsymbol{x} + \boldsymbol{a} \] Die Generatoren \(A_i = \frac{d}{dx^i}\) vertauschen miteinander. Die 3 reellen Komponenten \( a^i \) des Translationsvektors sind dabei die Parameter der Translationsgruppe, und die Gruppenstruktur ist eindeutig festgelegt über \[ g(\boldsymbol{a}) \, g(\boldsymbol{b}) = g(\boldsymbol{b}) \, g(\boldsymbol{a}) = g(\boldsymbol{a} + \boldsymbol{b}) \] Die Translationsgruppe ist also eine dreiparametrige abelsche Gruppe (d.h. die Gruppenelemente sind vertauschbar), und ihre Struktur entspricht der additiven Struktur im \( \mathbb{R}^3 \). Wie im letzten Kapitel gezeigt, kann man sie problemlos als Matrixgruppe mit 4-mal-4-Matrizen darstellen, die wir auf den 4-komponentigen Vektor \( (\boldsymbol{x}, 1) \) wirken lassen (die 4-te Dummy-Komponente (also die \(1\)) ändert sich dabei nicht). \[ g(\boldsymbol{a}) = \begin{pmatrix} 1 & \boldsymbol{a} \\ \boldsymbol{0} & 1 \end{pmatrix} \] denn dann ist \[ g(\boldsymbol{a}) \, \begin{pmatrix} \boldsymbol{x} \\ 1 \end{pmatrix} = \] \[ = \begin{pmatrix} 1 & \boldsymbol{a} \\ \boldsymbol{0} & 1 \end{pmatrix} \, \begin{pmatrix} \boldsymbol{x} \\ 1 \end{pmatrix} = \] \[ = \begin{pmatrix} \boldsymbol{x} + \boldsymbol{a} \\ 1 \end{pmatrix} \] Die Matrixmultiplikation ergibt dann genau den gewünschten Zusammenhang für die Gruppenmultiplikation.

Die obige Matrixdarstellung ergibt die folgende Darstellung für die Generatoren: \[ A_i = -i \frac{\partial g}{\partial a^i} \bigg|_{a = 0} = \] \[ = \begin{pmatrix} 0 & -i \boldsymbol{e}_i \\ \boldsymbol{0} & 0 \end{pmatrix} \] mit den drei Einheitsvektoren \( \boldsymbol{e}_i \) (das \(i\) davor ist die imaginäre Einheit).

Man sieht in dieser Darstellung ebenfalls, dass der Kommutator \( [A_i, A_j] = 0 \) ist. Es ist sogar \( A_i A_j = 0 \) (das muss aber für andere Darstellungen \(T(A_i)\) der Translations-Generatoren später nicht so sein – nur der Kommutator muss Null ergeben).



Strahldarstellung und Zentralladung

Als Mannigfaltigkeit (Raum der Gruppenelemente) ist die Translationsgruppe gleichwertig zu \( \mathbb{R}^3 \), d.h. die Gruppe ist einfach zusammenhängend (jeder geschlossene Weg lässt sich stetig zu einem Punkt zusammenziehen). Allerdings ist die Gruppe nicht kompakt (hat also gleichsam keinen endlichen Parameterraum wie beispielsweise die Drehgruppe).

Da die Gruppe bereits einfach zusammenhängend ist und das Einselement enthält, brauchen wir nicht zu einer Überlagerungsgruppe überzugehen – eine Sorge weniger.

Wie sieht es mit möglichen Zentralladungen in Strahldarstellungen der Lie-Algebra aus? In diesem Fall hätten wir \[ [T(A_i), T(A_j)] = i \, f^k_{\,ij} \, T(A_k) + i \, C_{ij} \, 1 \] Nun ist allgemein \[ [A_i, A_j] = i \, f^k_{\, ij} \, A_k \] und in unserem Fall sind wegen \( [A_i, A_j] = 0 \) die Strukturkonstanten \( f^k_{\, ij} \) alle gleich Null. Aus der Gleichung oben wird also \[ [T(A_i), T(A_j)] = i \, C_{ij} \, 1 \] Da der Kommutator antisymmetrisch in \(i\) und \(j\) ist, gilt dies auch für \(C_{ij}\) , d.h. nur 3 der 9 Zahlen \(C_{ij}\) sind unabhängig und ungleich Null. Wir können daher allgemein schreiben: \[ C_{ij} = \epsilon_{ijk} C_k \] mit geeigneten drei Zahlen \(C_k\) (und Summe über \(k\)) und dem total antisymmetrischen Levi-Civita-Symbol \( \epsilon_{123} = \epsilon_{231} = \epsilon_{312} = 1 \) sowie \( \epsilon_{132} = \epsilon_{213} = \epsilon_{321} = -1 \) und Null sonst. Beispielsweise ist demnach \( C_{12} = C_3 \). Halten wir fest: \[ [T(A_i), T(A_j)] = i \, \epsilon_{ijk} C_k \, 1 \] Diese Zentralladungen lassen sich nicht einfach durch Umdefinition der \(T(A_i)\) beseitigen. Es gibt also echte projektive Darstellungen (Strahldarstellungen) der Translationsgruppe auf dem Hilbertraum, bei denen eine Phase auftritt, die sich nicht wegdefinieren lässt.

Meist wird dieser Punkt in der physikalischen Literatur gar nicht erwähnt. Der Grund dafür liegt darin, dass man meist die Translationen als Untergruppe der Galileigruppe oder der Poincarégruppe betrachtet. In diesen Gruppen sind auch die Drehungen enthalten. Nimmt man die Drehungen hinzu und verlangt, dass Translationen und Drehungen zusammen eine Symmetriegruppe bilden sollen, dann können keine Zentralladungen bei den Translationen auftreten, d.h. die Phase in der Strahldarstellung ist Null und wir haben eine unitäre Darstellung der Translationsgruppe (siehe das nächste Kapitel sowie Steven Weinbergs Buch The Quantum Theory of Fields, Vol. 1, insbesondere in Kapitel 2.7).

Wenn aber beispielsweise ein äußeres homogenes Magnetfeld (z.B. in z-Richtung) vorhanden ist, dann liegt keine dreidimensionale Rotationsinvarianz mehr vor, aber immer noch eine Translationsinvarianz. In diesem Fall sind projektive Darstellungen der Translationen möglich und sogar unverzichtbar, denn nur so kann man den Einfluss des Magnetfeldes auf die Zustände und damit den korrekten klassischen Grenzfall richtig darstellen.

In der nichtrelativistischen Quantenmechanik erfüllen beispielsweise die Operatoren \[ T(A_i) := - ( \hat{P}_i - \frac{e}{2} \epsilon_{ijk} \, B_j \, \hat{x}_k ) \] genau die obige Vertauschungsrelation, wenn man \( [\hat{P}_i, \hat{P}_j] = 0 \) , \( [\hat{x}_i, \hat{x}_j] = 0 \) und \( [\hat{P}_i, \hat{x}_j] = 1/i \, \delta_{ij} \) voraussetzt (die \(\hat{P}_i\) und \(\hat{x}_i\) sind also Operatoren). Die \(B_j\) sind einfach reelle Zahlen, die z.B. die Komponenten des homogenen Magnetfeldes repräsentieren. Der Term \(\epsilon_{ijk} \, B_j \, \hat{x}_k\) ist das Vektorpotential des Magnetfeldes (in einer bestimmten Eichung) und \(e\) ist die elektrische Ladung (also eine reelle Zahl). Man rechnet leicht nach, dass \[ [T(A_i), T(A_j)] = i \, \epsilon_{ijk} \, e \, B_k \, 1 \] ist, d.h. die Zentralladungen sind durch das Magnetfeld (mal der elektrischen Ladung \(e\)) gegeben. Die \( T(A_i) \) (mit negativem Vorzeichen) bezeichnet man hier auch als kanonische Impulse und die von ihnen generierten Translationen als magnetische Translationen. Man kann zeigen, dass bei einer Translation entlang eines geschlossenen Rechtecks die dabei entstehende Phase proportional zum magnetischen Fluss durch das Rechteck ist.



Die Darstellung der Translationen auf dem Hilbertraum

Gehen wir im Folgenden davon aus, dass keine Zentralladungen auftreten können (z.B. weil zusätzlich zur Translationssymmetrie auch Drehsymmetrie herrscht). Dann sind die Voraussetzungen für den Satz von Wigner-Bargmann aus dem letzten Kapitel erfüllt: Die Translationen \(g(\boldsymbol{a})\) können durch unitäre Operatoren \( T_{g(\boldsymbol{a})} \) dargestellt werden, die eine lineare unitäre Darstellung der Gruppe bilden: \[ T_{g(\boldsymbol{a})} \, T_{g(\boldsymbol{b})} = T_{g(\boldsymbol{a}) \, g(\boldsymbol{b})} = \] \[ = T_{g(\boldsymbol{b}) \, g(\boldsymbol{a})} = T_{g(\boldsymbol{b})} \, T_{g(\boldsymbol{a})} \] d.h. die Translationsoperatoren auf dem Hilbertraum vertauschen miteinander. Dabei können wir sicher sein, dass wir keine Strahldarstellung übersehen haben.

Wir können nun direkt die Exponentialdarstellung \[ g(\boldsymbol{a}) = e^{ \boldsymbol{a} \frac{d}{\boldsymbol{dx}} } = e^{i \, a^i \, A_i} \] verwenden und diese in entsprechende Operatoren auf dem Hilbertraum übersetzen: \[ T_{g(\boldsymbol{a})} = e^{i \, a^i \, T(A_i)} \] Dabei sind die \( T(A_i) \) entsprechende Operatoren auf dem Hilbertraum, die wie die \(A_i\) miteinander vertauschen sollen (wir brauchen ja eine Darstellung der Lie-Algebra). Die Unitarität von \( T_{g(\boldsymbol{a})} \) führt dazu, dass die \( T(A_i) \) hermitesche Operatoren sind (siehe das vorherige Kapitel). Die Exponentialdarstellung ist hier völlig problemlos, denn da die Kommutatoren der \( T(A_i) \) verschwinden, können wir Produkte von Exponentialreihen immer zu einer einzigen Exponentialreihe zusammenfassen.

Meist schreibt man in der Literatur \[ \hat{P}_i := - T(A_i) \] und damit \[ T_{g(\boldsymbol{a})} = e^{-i \, \boldsymbol{a \hat{P}}} \] Die Operatoren \(\hat{P}_i\) nennt man Impulsoperatoren – daher die Schreibweise. Schauen wir uns an, warum man sie so nennt:

In Kapitel 4.5 hatten wir gesehen, dass eine messbare Größe (eine Observable) einem hermiteschen Operator im Hilbertraum entspricht. Nun sind die Operatoren \( \hat{\boldsymbol{P}} = (\hat{P}_i) \) hermitsch, d.h. sie haben reelle Eigenwerte (nennen wir sie \( \boldsymbol{p} = (p_i) \) ) und Eigenvektoren (nennen wir sie \( | \boldsymbol{p} \rangle \) ). Es gilt also \[ \hat{\boldsymbol{P}} \, | \boldsymbol{p} \rangle = \boldsymbol{p}\, | \boldsymbol{p} \rangle \] Diese Gleichung muss man komponentenweise lesen: \[ \hat{P}_i \, | \boldsymbol{p} \rangle = p_i \, | \boldsymbol{p} \rangle \] Wir gehen davon aus, dass die Eigenwerte beobachtbare Messwerte einer Observablen sind – nur so kommt man zu einer physikalischen Interpretation des mathematischen Formalismus.

Da die Operatoren \(\hat{P}_i\) miteinander vertauschen, gibt es keinerlei Einschränkungen für ihre Eigenwerte. Jede reelle Zahl ist erlaubt. Das ändert sich auch nicht, wenn wir zur Galileigruppe oder zur Poincarégruppe übergehen. Man sagt, die Operatoren \(\hat{P}_i\) haben ein kontinuierliches Eigenwertspektrum. Streng genommen muss man deshalb von uneigentlichen Eigenvektoren und Eigenwerten reden, aber diese Feinheit berücksichtigen wir, indem wir statt Summen immer Integrale über die kontinuierliche Menge der Eigenwerte bilden.

Damit haben wir bereits eine Darstellung der Lie-Algebra auf einem Hilbertraum konstruiert, der von den Eigenvektoren \( | \boldsymbol{p} \rangle \) aufgespannt wird. Einen allgemeinen Zustandsvektor in diesem Hilbertraum können wir konstruieren, indem wir diese Eigenvektoren superponieren, wobei wir wegen des kontinuierlichen Charakters des Eigenwertes ein Integral verwenden müssen: \[ | \psi \rangle = \int d^3p \, f(\boldsymbol{p}) \, | \boldsymbol{p} \rangle \] Die Rolle eines diskreten Eigenvektors \( | n \rangle \) (siehe Kapitel 4.5) wird gleichsam durch \( d^3p \, | \boldsymbol{p} \rangle \) übernommen, und \( d^3p \, f(\boldsymbol{p}) \) ist die Wahrscheinlichkeitsamplitude dafür, dass sich der Impuls in diesem infinitesimalen Volumenelement in Impulsraum befindet. Wir werden etwas verkürzt sagen, dass \( f(\boldsymbol{p}) \) die Wahrscheinlichkeitsamplitude für den Impuls \(\boldsymbol{p}\) ist (Wahrscheinlichkeitsamplituden-Dichte wäre korrekter).

Die Darstellung für den Impulsoperator ergibt nun automatisch eine Darstellung für den Translationsoperator \[ T_{g(\boldsymbol{a})} = e^{-i \, \boldsymbol{a \hat{P}}} \] indem wir diesen einfach auf den Zustand \( | \psi \rangle \) anwenden und in der Exponentialreihe verwenden, dass \[ \hat{\boldsymbol{P}} \, | \boldsymbol{p} \rangle = \boldsymbol{p}\, | \boldsymbol{p} \rangle \] ist: \[ T_{g(\boldsymbol{a})} \, | \psi \rangle = \] \[ = \int d^3p \, f(\boldsymbol{p}) \, T_{g(\boldsymbol{a})} \, | \boldsymbol{p} \rangle = \] \[ = \int d^3p \, f(\boldsymbol{p}) \, e^{-i \, \boldsymbol{a \hat{P}}} \, | \boldsymbol{p} \rangle = \] \[ = \int d^3p \, f(\boldsymbol{p}) \, e^{-i \, \boldsymbol{a p}} \, | \boldsymbol{p} \rangle = \] \[ =: \int d^3p \, [T_{g(\boldsymbol{a})} f](\boldsymbol{p}) \, | \boldsymbol{p} \rangle \] Dabei haben wir im letzten Schritt eine Darstellung des Translationsoperators auf den Impulsamplituden-Funktionen \( f \) definiert (ohne eine neue Bezeichnung dafür zu wählen). Die Funktion \( T_{g(\boldsymbol{a})} f \) ist dabei einfach die Impuls-Amplitudenverteilung für den Quantenzustand nach der Translation. Hier die Definition noch einmal explizit: \[ [T_{g(\boldsymbol{a})} f](\boldsymbol{p}) := f(\boldsymbol{p}) \, e^{-i \, \boldsymbol{a p}} \] Nun kann uns niemand daran hindern, eine dreidimensionale Fouriertransformation von \( f(\boldsymbol{p}) \) durchzuführen – diese ist ja eine komplexwertige Funktion. Den neuen Variablenvektor aus \( \mathbb{R}^3 \) nennen wir dabei \( \boldsymbol{x} \) (warum, werden wir noch sehen): \[ \psi(\boldsymbol{x}) := N \, \int d^3p \, f(\boldsymbol{p}) \, e^{i \, \boldsymbol{p x}} \] mit der Normierung \[ N = (2 pi)^{-3/2} \] Die Funktion \( \psi(\boldsymbol{x}) \) enthält alle Informationen über die Funktion \( f(\boldsymbol{p}) \), denn wir können jederzeit die Fouriertransformation umkehren und \( f(\boldsymbol{p}) \) aus \( \psi(\boldsymbol{x}) \) zurückgewinnen.

Nun könnte man sich fragen, wie die fouriertransformierte Funktion zur Funktion \( [T_{g(\boldsymbol{a})} f](\boldsymbol{p}) \) aussieht (das sind die Impuls-Amplituden nach der Translation). Nennen wir diese Funktion \( [T_{g(\boldsymbol{a})} \psi](\boldsymbol{x}) \) und rechnen wir sie aus: \[ [T_{g(\boldsymbol{a})} \psi](\boldsymbol{x}) = \] \[ = N \, \int d^3p \, [T_{g(\boldsymbol{a})} f](\boldsymbol{p}) \, e^{i \, \boldsymbol{p x}} = \] \[ = N \, \int d^3p \, f(\boldsymbol{p}) \, e^{-i \, \boldsymbol{a p}} \, e^{i \, \boldsymbol{p x}} = \] \[ = N \, \int d^3p \, f(\boldsymbol{p}) \, e^{i \, \boldsymbol{p} (\boldsymbol{x} - \boldsymbol{a})} = \] \[ = \psi(\boldsymbol{x} - \boldsymbol{a}) \]

Unser Ergebnis lautet für die fouriertransformierte Funktion also: \[ [T_{g(\boldsymbol{a})} \psi](\boldsymbol{x}) = \psi(\boldsymbol{x} - \boldsymbol{a}) \] Streng genommen hätten wir wieder einen neuen Buchstaben für den Operator einführen müssen. Der Translations-Operator macht aus der Impulsamplituden-Funktion \( f \) also eine neue Impulsamplituden-Funktion \( T_{g(\boldsymbol{a})} f \) bzw. aus deren Fouriertransformierten \( \psi \) eine neue Fouriertransformierte \( T_{g(\boldsymbol{a})} \psi \).

Interessant ist nun, dass \( T_{g(\boldsymbol{a})} \psi \) gerade die um \( \boldsymbol{a} \) verschobene ursprüngliche Funktion \( \psi \) ist, denn die neue Funktion hat an der Stelle \( \boldsymbol{x} + \boldsymbol{a} \) den Wert, den die alte Funktion an der Stelle \( \boldsymbol{x} \) hat. Das entspricht anschaulich genau dem räumlichen Verschieben einer Funktion, wie wir das bei einer Translation erwarten. Deshalb wollen wir den Vektor \( \boldsymbol{x} \) als räumlichen Ortsvektor interpretieren. In der nichtrelativistischen Quantenmechanik macht das unmittelbar Sinn, denn dort können wir \( \psi(\boldsymbol{x}) \) als Wahrscheinlichkeitsamplitude (genauer: Dichte) dafür interpretieren, ein Teilchen am Ort \(\boldsymbol{x}\) zu finden (natürlich muss man diese Aussage noch begründen, was wir hier nicht tun wollen).

In der relativistischen Quantentheorie ist das etwas schwieriger, denn dort gibt es keinen Ortsoperator und auch keine Wahrscheinlichkeitsamplitude für den Ort eines Teilchens. Hintergrund ist, dass sich der Ort eines Teilchens hier prinzipiell nicht beliebig genau bestimmen lässt. Um den Ort genau zu messen, bräuchte man nämlich z.B. Photonen mit sehr kurzer Wellenlänge, deren hohe Energie aber zur Erzeugung neuer Teilchen führt, so dass die Individualität des ursprünglichen Teilchens zerstört würde (zum physikalischen Hintergrund siehe Die Entdeckung des Unteilbaren, Kapitel 5.1 sowie Henrik van Hees: Unschärferelation und relativistische Quantentheorie ). Dennoch gibt die Funktion \( \psi \) immerhin ungefähr das Raumgebiet an, in dem das Teilchen zu finden ist (die Genauigkeit entspricht ungefähr der de-Broglie-Wellenlänge, siehe Die Entdeckung des Unteilbaren, Kapitel 2.4 ). Zumindest in diesem Sinn können wir den Vektor \(\boldsymbol{x}\) als Ortsvektor verstehen.

Nochmal zurück zur Gleichung \[ [T_{g(\boldsymbol{a})} \psi](\boldsymbol{x}) = \psi(\boldsymbol{x} - \boldsymbol{a}) \] die wir auch so schreiben können: \[ [T_{g(\boldsymbol{a})} \psi](\boldsymbol{x}) = \psi(g(\boldsymbol{a})^{-1} \, \boldsymbol{x}) \] Diese Gleichung ist ganz analog zum Push-Forward einer skalaren Funktion in der Differenzialgeometrie bei einem Fluss auf einer Mannigfaltigkeit (siehe Kapitel 5.1.10, der Fluss entspricht dabei der Darstellung einer einparametrigen Lie-Untergruppe, das generierende Vektorfeld entspricht der Darstellung der Generatoren und die Lie-Klammer entspricht dem Kommutator). Gleichungen von dieser Art verwendet man häufig, um auf den Funktionen von Raum und Zeit eine Darstellung von Raum-Zeit-Symmetrien zu definieren. Dabei ist die Wirkung von \( g(\boldsymbol{a}) \) auf Raum (oder Zeit) bekannt und man erhält durch die Gleichung automatisch eine Darstellung auf den Funktionen der Raumzeit, aus denen man dann einen Hilbertraum konstruieren kann. Man muss allerdings aufpassen: In der Quantentheorie braucht man Strahl-Darstellungen der Gruppe, die man z.B. durch Darstellungen der Überlagerungsgruppe erhalten kann. Daher muss eine Gleichung der obigen Form oft noch erweitert und verändert werden, um alle Strahldarstellungen der Gruppe erfassen zu können. Wir werden bald ein Beispiel kennenlernen. Bei den Translationen dagegen haben wir die obige Gleichung allgemein hergeleitet, sind also sicher, keine Darstellungen übersehen zu haben (wenn wir auf die Zentralladung verzichten, weil z.B. auch Drehsymmetrien eine Rolle spielen).



Der Impulsoperator im Detail

So wie wir den Translationsoperator \( T_{g(\boldsymbol{a})} \) oben auf den Impulsamplituden und deren Fouriertransformierten (den Ortsamplituden) definieren konnten, so können wir das analog auch für den Impulsoperator machen. Aus \[ T_{g(\boldsymbol{a})} = e^{-i \, \boldsymbol{a \hat{P}}} \] folgt nämlich \[ \frac{d}{d\boldsymbol{a}} \, T_{g(\boldsymbol{a})} \bigg|_{\boldsymbol{a} = 0} = - i \hat{\boldsymbol{P}} \] oder nach dem Impulsoperator freigestellt \[ \hat{\boldsymbol{P}} = i \, \frac{d}{d\boldsymbol{a}} \, T_{g(\boldsymbol{a})} \bigg|_{\boldsymbol{a} = 0} \] (diese Gleichung muss man wieder komponentenweise lesen). Also ist \[ [\hat{\boldsymbol{P}} f](\boldsymbol{p}) = \] \[ = i \, \frac{d}{d\boldsymbol{a}} \, [T_{g(\boldsymbol{a})} f](\boldsymbol{p}) \bigg|_{\boldsymbol{a} = 0} = \] \[ = i \, \frac{d}{d\boldsymbol{a}} \, f(\boldsymbol{p}) \, e^{-i \, \boldsymbol{a p}} \bigg|_{\boldsymbol{a} = 0} = \] \[ = \boldsymbol{p} \, f(\boldsymbol{p}) \] und \[ [\hat{\boldsymbol{P}} \psi](\boldsymbol{x}) = \] \[ = i \, \frac{d}{d\boldsymbol{a}} \, [T_{g(\boldsymbol{a})} \psi](\boldsymbol{x}) \bigg|_{\boldsymbol{a} = 0} = \] \[ = i \, \frac{d}{d\boldsymbol{a}} \, \psi(\boldsymbol{x} - \boldsymbol{a}) \bigg|_{\boldsymbol{a} = 0} = \] \[ = -i \, \frac{d}{d\boldsymbol{x}} \, \psi(\boldsymbol{x}) \]

Halten wir fest: \[ [\hat{\boldsymbol{P}} f](\boldsymbol{p}) = \boldsymbol{p} \, f(\boldsymbol{p}) \] \[ [\hat{\boldsymbol{P}} \psi](\boldsymbol{x}) = -i \, \frac{d}{d\boldsymbol{x}} \, \psi(\boldsymbol{x}) \] Die untere Gleichung kennen Sie vielleicht aus der nichtrelativistischen Quantenmechanik (vielleicht bis auf einen Faktor \( \hbar \), auf den wir gleich noch zurückkommen). Das bringt uns zurück zu der Frage, warum wir \(\hat{\boldsymbol{P}}\) als Impulsoperator und \(\boldsymbol{p}\) als Impuls interpretieren können.

Bisher hatten wir den Impuls nur in der klassischen Mechanik eines Massenpunktes (Teilchens) definiert. Man müsste also zeigen, dass sich der Impuls \(\boldsymbol{p}\) eines Quantenzustandes im klassischen Limes wie der Impuls eines Teilchens verhält. Es genügt dazu letztlich, zu zeigen, dass sich die Kommutatoren der Operatoren wie die Poissonklammern der zugehörigen klassischen Größen verhalten, um die Operatoren mit den klassischen Größen in Verbindung bringen zu können. Es ist dann nämlich gesichert, dass sich die quantenmechanischen Erwartungswerte (Mittelwerte) wie die zugehörigen klassischen Größen verhalten, so dass sie im klassischen Grenzfall in diese klassischen Größen übergehen. Details dazu siehe z.B. Die Quantisierung der klassischen Mechanik ). In diesem Kapitel sind wir allerdings für eine solche Analyse noch nicht gerüstet, da wir bisher nur einige wenige Symmetrieüberlegungen angestellt haben. Vielleicht ergeben sich aus der weiteren Analyse von Galileigruppe und Poincarégruppe genauere Anhaltspunkte. Immerhin: Auch in der klassischen Mechanik ist nach dem Noether-Theorem der Impuls diejenige Größe, die mit Translationen zusammenhängt.

Man kann auch eine experimentelle Beobachtung nutzen (siehe z.B. Die Entdeckung des Unteilbaren, Kapitel 2.4). Eine solche Beobachtung braucht man generell, um Teilcheneigenschaften wie den Impuls mit Welleneigenschaften wie der Wellenlänge verknüpfen zu können, wobei das Planck'sche Wirkungsquantum ins Spiel kommt. Die Beobachtung lautet:

Die Wellenlänge kann man dabei z.B. durch Interferenzexperimente bestimmen und den Teilchenimpuls durch Stoßvorgänge. Man schreibt den obigen Zusammenhang auch explizit als \[ \lambda = \frac{h}{|\boldsymbol{p}|} \] und nennt \( \lambda \) die de Broglie-Wellenlänge. Dabei bezeichnet man den Proportionalitätsfaktor \(h\) als Planck'sches Wirkungsquantum. Die Richtung von \(\boldsymbol{p}\) entspricht der Ausbreitungsrichtung der Welle, die man auch durch einen Wellenzahlvektor \(\boldsymbol{k}\) mit \(|\boldsymbol{k}| = \frac{2 \pi}{\lambda} \) beschreibt, so dass \[ \boldsymbol{p} = \hbar \boldsymbol{k} \] ist. Eine ebene Welle hat dann die Form \[ e^{-i (\omega t - \boldsymbol{k x})} = e^{-i (\omega t - \frac{1}{\hbar}\boldsymbol{p x})} \] Die Ortsabhängigkeit ist also durch \[ e^{\frac{i}{\hbar}\boldsymbol{p x}} \] gegeben. In sogenannten natürlichen Einheiten misst man den Impuls nun einfach durch den zugehörigen Wellenzahlvektor und setzt daher \( \hbar = 1 \), so dass die Ortsabhängigkeit durch \( e^{i\boldsymbol{p x}} \) gegeben ist. Das ist aber genau die Ortsabhängigkeit der ebenen Wellen, die wir oben in \(psi(\boldsymbol{x})\) Fourier-überlagert haben. Daher können wir darin \( \boldsymbol{p} \) als Impuls interpretieren, denn auf diese Weise stellen wir sicher, dass Impuls und Wellenzahl in unserer Theorie proportional sind. Übrigens: Die Vorzeichen hatten wir oben gerade passend gewählt, so dass wir an dieser Stelle kein störendes Vorzeichen zwischen Impuls und Wellenzahl bekommen. Gut, wenn man vorher schon weiß, was am Schluss 'rauskommt.

Anmerkung: Wer natürliche Einheiten nicht mag, der braucht in diesem Kapitel lediglich überall in den Formeln oben \(\boldsymbol{p}\) und \(\hat{\boldsymbol{P}}\) durch \(\hbar\) zu dividieren, um die gewohnte Darstellung zu erhalten. Da dies jedoch sehr unhandlich ist, macht es meist Sinn, sich an natürliche Einheiten zu gewöhnen.



Translationen in der Zeit

Die obige Vorgehensweise können wir eins-zu-eins auf Translationen in der Zeit übertragen. Lediglich bei den Vorzeichen ist es in der Physik üblich, einige davon anders als oben zu wählen, damit die Interpretation mit der Energie ohne störende Vorzeichen möglich ist. Hier in Kürze die wesentlichen Schritte:

Die Gruppe der Zeittranslationen ist eine einparametrige Gruppe mit \[ g(\tau) \, t := t + \tau = e^{\tau \frac{d}{dt}} \, t \] Die Gruppenstruktur ist also die additive Struktur der reellen Zahlen, und es gibt nur einen Generator der Gruppe – nennen wir ihn \( A_0 \). In einer Darstellung auf einem Hilbertraum ist dann \[ T_{g(\tau)} = e^{i \tau \, T(A_0)} \] und wir schreiben \[ \hat{H} := T(A_0) \] (diesmal ohne negatives Vorzeichen), so dass \[ T_{g(\tau)} = e^{i \tau \hat{H}} \] ist. Man nennt \( \hat{H} \) den Hamiltonoperator. Er ist hermitesch, da \(T_{g(\tau)}\) wie oben unitär gewählt werden kann. Wieder gibt es (zumindest bisher) keine Einschränkungen für die reellen Eigenwerte (nennen wir sie \(E\)) und wir schreiben \[ \hat{H} \, | E \rangle = E \, | E \rangle \] Wir könnten sogar gleichzeitige Eigenvektoren \( |E, \boldsymbol{p} \rangle \) von \( \hat{H} \) und \( \hat{\boldsymbol{P}} \) wählen, da \( \hat{H} \) und \( \hat{\boldsymbol{P}} \) miteinander vertauschen (das setzen wir voraus, da es keine Rolle spielt, ob wir erst eine Raumtranslation und dann eine Zeittranslation durchführen oder umgekehrt).

Einen allgemeinen Zustand können wir nun wieder schreiben als \[ | \psi \rangle = \int dE \, g(E) \, |E\rangle \] mit der Energieamplitude \(g(E)\) (nicht mit einem Gruppenelement verwechseln). Sollten sich später Zusatzbedingungen für die Energie ergeben, so kann man das Integral ggf. immer noch durch eine Summe über die erlaubten Werte ersetzen. Analog zu oben können wir schreiben: \[ [T_{g(\tau)} g] (E) := g(E) \, e^{i E \tau} \] Die Fouriertransformierte definieren wir diesmal mit dem umgekehrten Vorzeichen im Exponenten (ist später nützlich): \[ \phi(t) := N \, \int dE \, g(E) \, e^{-i E t} \] und erhalten \[ [T_{g(\tau)} \phi] (t) := \] \[ = N \, \int dE \, [T_{g(\tau)} g](E) \, e^{-i E t} = \] \[ = N \, \int dE \, g(E) \, e^{i E \tau} \, e^{-i E t} = \] \[ = N \, \int dE \, g(E) e^{-i E (t - \tau)} = \] \[ = \phi(t - \tau) \] also \[ [T_{g(\tau)} \phi] (t) = \phi(t - \tau) \] Diese Gleichung rechtfertigt unsere Interpretation der Fourier-Transformationsvariablen \(t\) als die Zeit, denn unsere Transformation soll ja eine Zeittranslation sein.



Hamiltonoperator und Schrödingergleichung

Rechnen wir nun wieder \( \hat{H} \) explizit auf den Amplituden aus: \[ [\hat{H} g](E) = \] \[ = -i \frac{d}{d\tau} \, [T_{g(\tau)} g](E) \, \bigg|_{\tau = 0} = \] \[ = -i \frac{d}{d\tau} \, g(E) \, e^{i E \tau} \bigg|_{\tau = 0} = \] \[ = E \, g(E) \] und \[ [\hat{H} \phi](t) = \] \[ = -i \frac{d}{d\tau} \, [T_{g(\tau)} \phi](t) \, \bigg|_{\tau = 0} = \] \[ = -i \frac{d}{d\tau} \, \phi(t - \tau) \bigg|_{\tau = 0} = \] \[ = i \frac{d}{dt} \phi(t) \] Halten wir fest: \[ [\hat{H} g](E) = E \, g(E) \] \[ [\hat{H} \phi](t) = i \frac{d}{dt} \phi(t) \] Die beiden Gleichungen sind aus der nichtrelativistischen Quantenmechanik gut bekannt als zeitunabhängige (oben) und zeitabhängige Schrödingergleichung (unten, auf den Faktor \( \hbar \) kommen wir gleich zurück). Die Diskussion ist aber bisher ganz allgemein und gilt auch in der relativistischen Quantentheorie!

Man kann die Gleichung \[ [T_{g(\tau)} \phi] (t) = \phi(t - \tau) \] auch als Zeitentwicklungs-Gleichung interpretieren. Dazu setzen wir \( t = 0 \) und \( t' := -\tau \). Es ergibt sich: \[ [T_{g(-t')} \phi] (0) = \phi(t') \] Formal können wir noch \( T_{g(-t')} = e^{-i \hat{H} t'} \) schreiben und den Strich bei \(t'\) weglassen mit dem Ergebnis: \[ \phi(t) = e^{-i \hat{H} t} \phi(0) \] Die Gleichung ist die formale Integration der Gleichung \( [\hat{H} \phi](t) = i \frac{d}{dt} \phi(t) \) von oben. Sie ist so zu lesen, dass wir \[ \phi(0) = N \, \int dE \, g(E) \] schreiben können und dann \[ [\hat{H} g](E) = E \, g(E) \] verwenden, also \( \hat{H} \) durch \(E\) ersetzen mit dem Ergebnis \[ \phi(t) = e^{-i \hat{H} t} \, \phi(0) = \] \[ = N \, \int dE \, g(E) \, e^{-i E t} \] Das ist genau unsere Fouriertransformation von oben. Manchmal schreibt man übrigens auch formal \[ | \psi(t) \rangle = e^{-i \hat{H} t} \, | \psi(0) \rangle \] und meint damit genau die vorherige Gleichung.

Die Schreibweise legt nahe, dass wir \(E\) als Energie des quantenmechanischen Systems interpretieren wollen. Die Begründung ist analog zum Impuls:

In der klassischen Mechanik ist nach dem Noether-Theorem die Energie diejenige Größe, die mit Zeit-Translationen zusammenhängt – ein Hinweis, dass das hier auch so sein könnte. Weitere Hinweise folgen in den nächsten Kapiteln.

Die folgende experimentelle Beobachtung verknüpft die Teilcheneigenschaft Energie mit der Welleneigenschaft Frequenz:

Man schreibt den obigen Zusammenhang auch explizit als \[ E = h f = h/T \] mit der Frequenz \[ f = \frac{1}{T} \] und der Schwingungsdauer \(T\). Wieder ist das Planck'sche Wirkungsquantum \(h\) der Proportionalitätsfaktor – ein Hinweis darauf, dass es einen Zusammenhang zwischen Energie und Impuls gibt, auf den wir noch stoßen werden. Meist definiert man noch die Kreisfrequenz \[ \omega = 2 \pi f = \frac{2 \pi}{T} \] so dass \[ E = \hbar \omega \] ist mit \(\hbar = \frac{h}{2 \pi} \).

Setzen wir dies wieder in die ebene Welle ein: \[ e^{-i ( \omega t - \boldsymbol{k x} )} = \] \[ = e^{- \frac{i}{\hbar} ( E t - \boldsymbol{p x} )} \] Die Zeitabhängigkeit ist also durch \[ e^{-\frac{i}{\hbar} E t} \] gegeben. In natürlichen Einheiten ist wieder \(\hbar = 1\), so dass die Zeitabhängigkeit durch \( e^{-i E t} \) gegeben ist. Das ist genau die Zeitabhängigkeit der Amplituden, die wir oben in \( \phi(t) \) überlagert haben. Daher können wir darin \( E \) als Energie interpretieren.



Erhaltungsgrößen

Der Impuls ist eine Erhaltungsgröße, da Impulsoperator und Hamiltonoperator kommutieren. Die Energie selbst ist natürlich auch eine Erhaltungsgröße, da der Hamiltonoperator mit sich selbst kommutiert.

Kurze Begründung: Wir starten zur Zeit \(t=0\) mit einem Zustand zum Impuls \(\boldsymbol{p}\), d.h. es gilt \[ \hat{\boldsymbol{P}} \, | \boldsymbol{p} \rangle = \boldsymbol{p} \, | \boldsymbol{p} \rangle \] Die Zeitentwicklung dieses Zustandes lautet \[ e^{-i \hat{H} t} \, | \boldsymbol{p} \rangle \] Da der Impulsoperator \(\hat{\boldsymbol{P}}\) mit \(\hat{H}\) vertauscht, vertauscht er auch mit \( e^{-i \hat{H} t} \) (sieht man, wenn man das als Reihe ausschreibt). Also ist \[ \hat{\boldsymbol{P}} \, e^{-i \hat{H} t} \, | \boldsymbol{p} \rangle = \] \[ = e^{-i \hat{H} t} \, \hat{\boldsymbol{P}} \, | \boldsymbol{p} \rangle = \] \[ = e^{-i \hat{H} t} \, \boldsymbol{p} \, | \boldsymbol{p} \rangle = \] \[ = \boldsymbol{p} \, e^{-i \hat{H} t} \, | \boldsymbol{p} \rangle \] d.h. auch der zeitentwickelte Zustand \( e^{-i \hat{H} t} \, | \boldsymbol{p} \rangle \) hat denselben Impuls wie der Zustand \( | \boldsymbol{p} \rangle \) zur Zeit Null – der Impuls hat sich also durch die Zeitentwicklung nicht geändert.

Einen Zusammenhang zwischen Energie und Impuls können wir alleine aufgrund der Raum-Zeit-Translationen nicht herleiten. Noch stehen Energie und Impuls vollkommen unabhängig nebeneinander – sogar negative Energiewerte sind möglich. Erst die Analyse der Boosts wird dies ändern, wobei es einen Unterschied zwischen nichtrelativistischen und relativistischen Boosts geben wird. Doch zunächst wollen wir uns im nächsten Kapitel einer anderen Symmetrie zuwenden: der Drehsymmetrie. Wie die Diskussion der Raum-Zeit-Translationen wird auch die Diskussion der Drehungen allgemeingültig sein, ist also sowohl im nichtrelativistischen als auch im relativistischen Fall anwendbar.



zurück zum Inhaltsverzeichnis

© Jörg Resag, www.joerg-resag.de
last modified on 26 July 2023