Tensoren relativ erklärt
Man kann darüber schmunzeln, wie oft Leute behaupten, sie hätten den “Satz des Pythagoras” seit der Schule nie wieder gebraucht. Dabei braucht man den doch andauernd, bildet er doch die Metrik unseres dreidimensionalen Anschauung, dem Euklidischen Raum. Moment! Euklid kennt man vielleicht noch. Aber Metrik und Raum? Wir wollen uns diese Begriffe noch einmal reinziehen mit einer kleinen Gratwanderung, die noch genug Mathe enthält, aber sich an genügend Beispielen entlang hangelt, so dass man es noch verstehen kann.
Der Vektorraum – unendliche Weiten
Wir dringen dabei in Galaxien vor, die nie ein Mensch sich vorzustellen gewagt hätte, jedenfalls nicht vor Einstein. Aber beginnen wir mit dem einfachsten von allen. Ein Vektorraum ist eine mathematische Struktur, in der man mit Vektoren rechnen kann. Vektoren sind dabei nicht nur die bekannten Pfeile im Raum, sondern allgemein mathematische Objekte, die man addieren und mit Zahlen (so genannten Skalaren) multiplizieren kann.
Ein Vektorraum besteht aus:
- Vektoren ($\boldsymbol{v},\boldsymbol{w},\ldots$), die man addieren kann.
- Skalaren ($a,b,c,\ldots$), meist aus $\mathbb{R}$ oder $\mathbb{C}$), mit denen man Vektoren multiplizieren kann.
- Regeln (Axiome), die sicherstellen, dass die Addition und Multiplikation sinnvoll definiert sind.
Dabei muss der Vektorraum folgende Eigenschaften haben:
- Zwei Vektoren können addiert werden. Das Ergebnis ist wieder ein Vektor: $$\boldsymbol{v} + \boldsymbol{w} = \boldsymbol{u}$$
- Es gibt einen Nullvektor $\boldsymbol{0}$, der nichts verändert.
- Jeder Vektor hat ein Gegenteil ($\boldsymbol{-v}$), so dass$\boldsymbol{v} + (-\boldsymbol{v}) = \boldsymbol{0}$.
- Ein Vektor kann mit einer Zahl (Skalar) multipliziert werden. Das Ergebnis ist wieder ein Vektor und es gelten Rechenregeln wie $$a(b \boldsymbol{v}) = b(a \boldsymbol{v})$$
Mathematisch gesehen bildet man einen Vektorraum über einem Körper, im Folgenden meistens den der reellen Zahlen $\mathbb{R}$. Wichtigstes Kriterium ist, dass das Ergebnis der Operation wieder im Vektorraum ist.1
Beispiele
Die klassischen Vektoren in der Ebene oder im Raum sind Beispiele für Vektorräume
$$\vec{v} = \begin{pmatrix} a \\ b \end{pmatrix}, \vec{u} = \begin{pmatrix} x \\ y \\ z \end{pmatrix}$$Unendliche Zahlenfolgen können ebenfalls einen Vektorraum bilden:
$$(a_1,a_2,a_3,\ldots)$$Ein gutes Beispiel für einen Vektorraum von Funktionen ist der Raum der stetigen Funktionen auf einem Intervall, z. B.:
$$V = C([a, b])$$Das ist die Menge aller stetigen Funktionen $f: [a, b] \to \mathbb{R}$, also aller Funktionen, die auf dem Intervall $[a, b]$ keine Sprünge oder Unstetigkeiten haben. Damit eine Menge von Objekten ein Vektorraum ist, müssen die grundlegenden Rechenoperationen Addition und Skalarmultiplikation definiert sein und die Vektorraum-Axiome erfüllen.
Wenn $f(x)$ und $g(x)$ zwei Funktionen in $C([a, b])$ sind, dann ist ihre Summe:
$$ (f + g)(x) = f(x) + g(x) $$wieder eine stetige Funktion. Also bleibt man im Vektorraum. Für eine Zahl $\lambda \in \mathbb{R}$ ist auch das Produkt:
$$(\lambda f)(x) = \lambda f(x)$$wieder eine stetige Funktion, wieder bleibt man im Vektorraum. Ein beliebtes Gegenbeispiel für eine Basis ist die Menge der natürlichen Zahlen $\mathbb{N} = {1,2,3,\ldots}$ – hier kann das Ergebnis einer Rechnung außerhalb des Raums sein:
$$2 \in \mathbb{N} \rightarrow 2 + (-2) = 0 \notin \mathbb{N}$$Basis und Dimension des Vektorraums
In endlichdimensionalen Vektorräumen (z. B. $\mathbb{R}^3$) kann man eine Basis aus endlich vielen Vektoren angeben, die Anzahl bezeichnet man als Dimension. In einem Funktionenraum ist die Dimension oft unendlich, weil es unendlich viele Basisfunktionen gibt.
Ein möglicher Basis-Satz für \( C([a,b]) \) kann z. B. die Menge der Monome sein:
$$\{1, x, x^2, x^3, \dots\}$$oder für periodische Funktionen die Fourierreihen-Basis:
$$\{1, \sin x, \cos x, \sin 2x, \cos 2x, \dots\}$$Diese Basis ermöglicht es, jede stetige Funktion als eine Linearkombination dieser Funktionen darzustellen. Linearkombinationen sind Summen von Vektoren, die mit Skalaren mutlipliziert werden, z.B. seien
$$\mathbf{v}_1 = \begin{pmatrix} 2 \\ 1 \end{pmatrix}, \quad \mathbf{v}_2 = \begin{pmatrix} -1 \\ 3 \end{pmatrix}$$Eine Linearkombination dieser Vektoren wäre:
$$\mathbf{w} = a \mathbf{v}_1 + b \mathbf{v}_2$$Wenn wir z. B. \( a = 3 \) und \( b = -2 \) wählen, dann berechnen wir:
$$\mathbf{w} = 3 \begin{pmatrix} 2 \\ 1 \end{pmatrix} + (-2) \begin{pmatrix} -1 \\ 3 \end{pmatrix} = \begin{pmatrix} 6 \\ 3 \end{pmatrix} + \begin{pmatrix} 2 \\ -6 \end{pmatrix} = \begin{pmatrix} 8 \\ -3 \end{pmatrix}$$Das Ergebnis ist also wieder ein Vektor.
Anwendung
- Fourier-Analyse: Funktionen können als Summe von Sinus- und Kosinus-Funktionen geschrieben werden.
- Lösungen von Differentialgleichungen: Viele physikalische Probleme (z. B. Wellen- und Schrödinger-Gleichungen) verwenden Vektorräume von Funktionen.
- Maschinelles Lernen: Funktionenräume spielen eine Rolle bei neuronalen Netzen und Approximationstechniken.
Vektorräume sind überall in Mathematik und Physik wichtig, weil sie das Grundgerüst für viele Konzepte bilden: in der Physik für Kräfte, Geschwindigkeiten, elektrische Felder – alles kann mit Vektorräumen beschrieben werden, in der Computergrafik für Farben, Bildpunkte, 3D-Modelle, im maschinellen Lernen werden Daten als Vektoren dargestellt und verarbeitet und in der Quantenmechanik; Zustände eines Teilchens sind Vektoren in einem speziellen Raum (Hilbertraum).
Das Maß aller Dinge
Eine Frage, die sich bei der Arbeit mit Vektorräumen stellt, ist die nach dem Abstand zwischen zwei Punkten. Diese Frage beantwortet uns die Metrik des Raums. Sie definiert ein Skalarprodukt, das zwei Vektoren auf einen Skalar abbildet. In einem klassischen euklidischen Raum (z. B. $\mathbb{R}^n$) definiert die Metrik das innere Produkt zwischen zwei Vektoren $\mathbf{A}, \mathbf{B}$:
$$\langle A, B \rangle = g_{ij} A^i B^j$$Die Norm eines Vektorraums ist dann:
$$\| A \| = \sqrt{g_{ij} A^i A^j}$$also für die Standard-Metrik im dreidimensionalen Raum $g_{ij} = \delta_{ij}$2:
$$\| A \| = \sqrt{A_x^2 + A_y^2 + A_z^2}$$Hier entspricht die Metrik also der bekannten euklidischen Norm. Viel spannender sind aber pseudo-euklidische Metrik, wie man sie z.B. im Minkowski-Raum der speziellen Relativitätstheorie definiert:
$$\langle A, B \rangle = g_{\mu\nu} A^\mu B^\nu$$mit der Minkowski-Metrik:
$$g_{\mu\nu} = \begin{pmatrix} -1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix}$$Die Norm eines Vierervektors $A^\mu = (A^0, A^1, A^2, A^3)$ ist dann:
$$\| A \|^2 = g_{\mu\nu} A^\mu A^\nu = - (A^0)^2 + (A^1)^2 + (A^2)^2 + (A^3)^2$$Achtung: Diese “Norm” kann negativ, null oder positiv sein:
- Zeitartig: $| A |^2 < 0$
- Raumartig: $| A |^2 > 0$
- Lichtartig: $| A |^2 = 0$
In der Relativitätstheorie wird daher oft von einem Intervall oder einer Pseudo-Norm gesprochen.
Die Metrik definiert die Norm eines Vektors, aber in der relativistischen Physik ist es nicht immer eine echte Norm im klassischen Sinn, weil sie negativ oder null sein kann. Dadurch wird sichergestellt, dass die Lichtgeschwindigkeit in allen Bezugssystemen konstant bleibt.
Die Raumzeit-Intervalle sind nicht euklidisch:
$$s^2 = - (ct)^2 + x^2 + y^2 + z^2$$Diese Formel ersetzt den klassischen euklidischen Abstandsbegriff und ist entscheidend für das Verständnis von Zeitdilatation und Längenkontraktion.
Tensoren
Verallgemeinert man den Begriff des Vektors, kommt man auf den Begriff des Tensors. Schreiben wir also
$$T^i = \begin{vmatrix} T^1 \\ T^2 \\ T^3 \end{vmatrix} \text{Tensor mit Rang = 1}$$ $$T^{ij} = \begin{vmatrix} T^{11} & T^{12} & T^{13} \\ T^{21} & T^{22} & T^{23} \\ T^{31} & T^{32} & T^{33} \end{vmatrix} \text{Tensor mit Rang = 2}$$Für $T^{ijk}$, also einem Tensor vom Rang 3, wird es dann schon unübersichtlich und ab Rang 4 nicht mehr anschaulich darstellbar. Ein Tensor vom Rang 0 ist dann einfach ein Skalar.
Die Elemente des Tensors können z.B. Zahlen sein, man spricht dann von kontravarianten Tensoren. Kontravarianten Tensoren transformieren invers zur Basis der Koordinaten. Das bedeutet, dass sie sich wie Vektoren verhalten, die entlang der Koordinatenachsen orientiert sind. Man schreibt sie mit Index oben (z.B. $T^{ij}$).
Kovariante Tensoren transformieren gleich wie die Basis der Koordinaten. Sie verhalten sich wie 1-Formen (Dualvektoren) und messen Projektionen auf Basisvektoren. Man schreibt sie mit Index unten (z.B. $T_i$). Ein Beispiel für einen solchen Tensor wäre der Gradient
$$\omega_i = \frac{\partial}{\partial x^i}$$Multiplizieren wir ko- und kontravariante Vektoren miteinander, erhalten wir Skalare, im Beispiel also die Bildung des Gradienten
$$\omega_i v^i = \frac{\partial }{\partial x^i} v^i$$Die beiden Arten von Tensoren hängen über die Metrik zusammen. Für die Metrik des Euklidischen Raums gilt
$$\|\mathbf{A}\| = A^i A_i$$Und wie man leicht nachrechnet:
$$A_1 = 1 A^1 + 0 A^2 + 0 A^3 \\ A_2 = 0 A^1 + 1 A^2 + 0 A^3 \\ A_3 = 0 A^1 + 0 A^2 + 1 A^3 \\ \Rightarrow A_i = A^i$$Alles relativ
Kommen wir zurück auf die Minkowski-Metrik. Sie bestimmt das so genannte Raumzeit-Intervall:
$$ds^2 = g_{\mu\nu} dx^\mu dx^\nu = -dt^2 + dx^2 + dy^2 + dz^2$$Die Folgerungen daraus sind:
- Der Zeitanteil $-dt^2$ ist negativ, was Relativitätseffekte wie Zeitdilatation beschreibt,
- die räumlichen Anteile entsprechen dem euklidischen Abstand und
- lichtartige Intervalle $ds^2=0$ beschreiben die Bewegung von Licht.
Hintergrund
Christoffel-Symbole
Die Christoffel-Symbole sagen aus, wie sich Vektoren in einem gekrümmten Raum verändern, wenn du sie parallel verschiebst. Sie sind wie eine Gravitationskraft für Geometrie – sie sagen dir, wie sich die Raumkrümmung auf Bewegung auswirkt.
In einem flachen Raum (z.B. im euklidischen Raum) ist die Ableitung eines Vektors einfach:
$$\frac{dv^i}{dx^j}$$Aber in einem gekrümmten Raum ist es nicht so einfach, weil sich die Basisvektoren$e_i$selbst ändern können. Die Zusatzkorrektur für diese Veränderung gibt uns die Christoffel-Symbole $\Gamma^i_{jk}$:
$$\frac{dv^i}{dx^j} + \Gamma^i_{jk} v^k$$$\Gamma^i_{jk}$sagt uns, wie sehr sich die Basis ändert, wenn wir uns in Richtung$x^j$bewegen. Dadurch bestimmt es, wie sich Vektoren in einem gekrümmten Raum verhalten.
Analogie: Auto auf einer kurvigen Straße
Stell dir vor, du fährst ein Auto auf einer kurvigen Straße:
- In einer geraden Straße (flacher Raum) gilt: Wenn du das Lenkrad nicht bewegst, fährt das Auto geradeaus.
- In einer kurvigen Straße (gekrümmter Raum) gilt: Selbst wenn du das Lenkrad festhältst, folgt dein Auto der Straßenkrümmung –- die Straße selbst verändert deine Richtung!
Die Christoffel-Symbole sind wie die Krümmung der Straße – sie sagen dir, wie du deine Bewegung anpassen musst, um “geradeaus” zu fahren.
Jetzt ist der Raum nach der Auffassung der allgemeinen Relativitätstheorie nicht euklidisch, sondern krümmt sich um einen massereichen Körper, z.B. einem schwarzen Loch. Dem trägt die Schwarzschild-Metrik Rechnung:
$$g_{\mu\nu} = \begin{pmatrix} - \left( 1 - \frac{2GM}{r} \right) c^2 & 0 & 0 & 0 \\ 0 & \left( 1 - \frac{2GM}{r} \right)^{-1} & 0 & 0 \\ 0 & 0 & r^2 & 0 \\ 0 & 0 & 0 & r^2 \sin^2\theta \end{pmatrix}$$Dabei ist
- $g_{00}$: Zeitkomponente, mit dem Gravitationspotential $(1 - 2GM/r)$.
- $g_{11}$: Radialer Term, mit dem inversen Faktor $(1 - 2GM/r)^{-1}$.
- $g_{22}$: Winkelkoordinate $\theta$ mit $r^2$.
- $g_{33}$: Winkelkoordinate $\phi$ mit $r^2 \sin^2\theta$.
- Alle anderen $g_{\mu\nu}$ sind null.
Die Inverse dieser Matrix ergibt den kontravarianten Metrik-Tensor $g^{\mu\nu}$:
$$g^{\mu\nu} = \begin{pmatrix} - \left( 1 - \frac{2GM}{r} \right)^{-1} / c^2 & 0 & 0 & 0 \\ 0 & \left( 1 - \frac{2GM}{r} \right) & 0 & 0 \\ 0 & 0 & \frac{1}{r^2} & 0 \\ 0 & 0 & 0 & \frac{1}{r^2 \sin^2\theta} \end{pmatrix}$$Besondere Eigenschaften der Schwarzschild-Metrik
- Bei \( r = 2GM/c^2 \) verschwindet \( g_{00} \) und \( g_{11} \) wird unendlich; das ist der Schwarzschildradius.
- Für große $r\to\infty$ geht die Metrik gegen die Minkowski-Metrik (Flacher Raum).
- Geodäten bestimmen Planetenbahnen und Lichtkrümmung; die Schwarzschild-Metrik führt zu Effekten wie der Periheldrehung und der Lichtablenkung durch Gravitation.
Fazit
Tensoren sind eine universelle mathematische Struktur, die sich von einfachen Vektoren und Matrizen zu komplexeren mehrdimensionalen Objekten erweitert. Sie sind unverzichtbar in Bereichen wie der Differentialgeometrie, Relativitätstheorie, Elastizitätstheorie und Maschinellem Lernen.
- Allgemeiner als Vektoren und Matrizen: Tensoren beschreiben physikalische Größen unabhängig vom Koordinatensystem.
- Fundamental in der Physik: In der Allgemeinen Relativitätstheorie definieren sie die Struktur der Raumzeit.
- Flexibel in der Anwendung: Ob in der Ingenieurwissenschaft, Bildverarbeitung oder neuronalen Netzen – Tensoren sind überall.
- Ko- und Kontravarianz sind essenziell: Die Transformationseigenschaften von Tensoren ermöglichen eine einheitliche Beschreibung gekrümmter Räume.
Tensoren sind mehr als abstrakte mathematische Objekte – sie sind das Werkzeug, um komplexe Systeme und ihre Wechselwirkungen präzise und elegant zu formulieren.
Quellen und Links
- Physics – problems and solutions (ab 4:45)
Diese Betrachtung hier sind grob vereinfacht; eine mathematisch korrekte Definition findet sich z.B. in der Wikipedia, aber wir wollen das Ganze hier etwas pragmatischer angehen. ↩︎
Das Kronecker-Symbol$\delta_{ij}$ist eine Kurzschreibweise für die Einheitsmatrix, bei der die Diagonalelemente 1 und alle anderen 0 sind. ↩︎