Definition
Eine stetige Zufallsvariable
mit der
Wahrscheinlichkeitsdichte
-
heißt
-
-normalverteilt, auch geschrieben als
oder
-normalverteilt, wobei
der
Erwartungswert und
die
Standardabweichung sind.
Die Verteilungsfunktion der Normalverteilung ist gegeben durch
- .

Dichtefunktion der Standardnormalverteilung
So sieht die Dichtefunktion der Standardnormalverteilung () aus. Angegeben sind die Intervalle im Abstand 1, 2 und 3 Standardabweichungen vom Erwartungswert 0, die rund 68 %, 95,5 % und 99,7 % der Fläche unter der Glockenkurve umfassen. Die gleichen Prozentsätze gelten für alle Normalverteilungen in Bezug auf die entsprechenden Erwartungswerte und Standardabweichungen. Man beachte, dass die Dichte der Normalverteilung nie den Wert Null annimmt, das heißt es gilt für alle reellen .
Die Normalverteilung ist eine Grenzverteilung, die nicht direkt beobachtet werden kann. Die Annäherung verläuft aber mit wachsendem n sehr schnell, so dass schon die Verteilung einer Summe von 30 oder 40 unabhängigen, identisch verteilten Zufallsgrößen einer Normalverteilung recht ähnlich ist.
Die Glockenkurve schmückte, neben dem Portrait von Carl Friedrich Gauß platziert, von 1989 bis 2001 die 10-DM-Banknote der Bundesrepublik Deutschland.
Eigenschaften
Symmetrie
Der Graph der Wahrscheinlichkeitsdichte
ist eine Gauß'sche Glockenkurve, welche
symmetrisch zum Wert von
ist und deren Höhe und Breite von
abhängt.
Mathematisch ausgedrückt wird diese Symmetrie durch
-
und
- .
Maximalwert und Wendepunkte der Dichtefunktion
Mit Hilfe der ersten und zweiten Ableitung lassen sich der Maximalwert und die Wendepunkte
bestimmen. Die erste Ableitung ist
-
Das Maximum der Dichtefunktion der Normalverteilung liegt demnach bei
und
beträgt dort
Die zweite Ableitung lautet
Somit liegen die
Wendepunkte der Dichtefunktion bei
.
Normierung
Wichtig ist, dass die gesamte Fläche unter der
Kurve gleich 1 ist, also der Wahrscheinlichkeit eines fast sicheren
Ereignisses entspricht. Somit folgt, dass, wenn zwei gaußsche Glockenkurven dasselbe
, aber unterschiedliche
-Werte haben, jene Kurve mit dem größeren
breiter und niedriger ist (da ja beide zugehörigen Flächen jeweils den Wert von 1 haben und nur die Standardabweichung (oder „
Streuung“) höher ist). Zwei Glockenkurven mit dem gleichen
, aber unterschiedlichen
haben gleich aussehende Graphen, die jedoch auf der
-Achse um die Differenz der
-Werte zueinander verschoben sind.
Die Normierung lässt sich wie folgt nachweisen:
Wir definieren
-
Ist die Verteilung
normiert, so muss
gelten.
Um das Integral zu vereinfachen, verwenden wir die lineare
Substitution und erhalten dann wegen
A &= \frac 1{\sqrt{2\pi}} \int_{-\infty}^\infty \exp\left(-\frac 12 \tau(t)^2\right) \tau'(t) \mathrm dt\\
&= \frac 1{\sqrt{2\pi}} \int_{-\infty}^\infty \exp\left(-\frac 12 \tau^2\right) \mathrm d\tau.
\end{align}
Wie erwartet ist
unabhängig von den Parametern
und
.
Für die Normiertheit dieses Integrals siehe den Artikel
Fehlerintegral.
Berechnung
Da sich das
Integral der Wahrscheinlichkeitsdichtefunktion nicht auf eine elementare
Stammfunktion zurückführen lässt, wurde für die Berechnung früher meist auf Tabellen zurückgegriffen (siehe dazu die Tabelle der Verteilungsfunktion der Standardnormalverteilung); heutzutage sind entsprechende Zellenfunktionen in üblichen Tabellenkalkulationsprogrammen stets verfügbar. Tabellen wie Zellenfunktionen gelten aber in der Regel nicht für beliebige
- und
-Werte, sondern nur für die Standardnormalverteilung, bei der
und
ist (man spricht auch von einer
0-1-Normalverteilung oder
normierten Normalverteilung).
Die Tabellen sind also für die Wahrscheinlichkeitsfunktion (auch Gauß'sches Fehlerintegral genannt) mit
-
ausgelegt. Analog dazu wird die zugehörige normierte Wahrscheinlichkeitsdichtefunktion
mit
bezeichnet.
Ist nun eine beliebige --Verteilung gegeben, so muss diese nur in eine Standardnormalverteilung transformiert werden.
Erwartungswert
Die Normalverteilung besitzt den
Erwartungswert
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\operatorname{d}x
= \mu.
Varianz und Standardabweichung
Die
Varianz ergibt sich analog zu
\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\operatorname{d}x
= \sigma^2.
Für die
Standardabweichung ergibt sich
- .
Variationskoeffizient
Aus
Erwartungswert und Standardabweichung erhält man unmittelbar den Variationskoeffizienten
- .
Schiefe
Die
Schiefe besitzt unabhängig von den Parametern
und
immer den Wert 0.
Charakteristische Funktion
Die
charakteristische Funktion für
hat die Form
= \operatorname E(\mathrm e^{is\sigma Z}\mathrm e^{is\mu})
= \mathrm e^{is\mu}\operatorname E(\mathrm e^{is\sigma Z})
= \mathrm e^{is\mu}\varphi_Z(\sigma s)
= \exp\left(is\mu-\frac{\sigma^2 s^2}2\right)
mit
.
Für die Standardnormalverteilung vereinfacht sich die charakteristische Funktion zu
\phi_X(s) &= \frac 1{\sqrt{2\pi}}\int\limits_{-\infty}^\infty \mathrm e^{isx} \mathrm e^{-\frac{x^2}2} \operatorname dx\\
&= \frac 1{\sqrt{2\pi}}\int\limits_{-\infty}^\infty \mathrm e^{-\frac{(x-is)^2}2} \mathrm e^{-\frac{s^2}2} \operatorname dx\\
&= \frac 1{\sqrt{2\pi}}\mathrm e^{-\frac{s^2}2} \int\limits_{-\infty}^\infty \mathrm e^{-\frac{x^2}2} \operatorname dx\\
&= \mathrm e^{-\frac{s^2}2}.
\end{align}
Momenterzeugende Funktion
Die
momenterzeugende Funktion der Normalverteilung ist
- .
Invarianz gegenüber Faltung
Die Normalverteilung ist invariant gegenüber der
Faltung, d. h. die Faltung einer Gaußkurve der
Halbwertsbreite mit einer Gaußkurve der
Halbwertsbreite ergibt wieder eine Gaußkurve mit der Halbwertsbreite
.
Anders gesprochen, die Summe unabhängiger normalverteilter Zufallsgrößen ist wieder normalverteilt. Das lässt sich sehr einfach dadurch beweisen, dass die charakteristische Funktion der Summe das Produkt der charakteristischen Funktionen der Summanden ist.
Speziell ist das arithmetische Mittel unabhängiger und normalverteilter Zufallsgrößen wieder eine normalverteilte Zufallsgröße mit .
Nach dem Satz von Cramér gilt sogar die Umkehrung: Ist eine normalverteilte Zufallsgröße die Summe von unabhängigen Zufallsgrößen, dann sind die Summanden ebenfalls normalverteilt.
Die Dichtefunktion der Normalverteilung ist ein Fixpunkt der Fourier-Transformationen, d.h. die Fourier-Transformierte einer Gaußkurve ist wieder eine Gaußkurve. Das Produkt der Standardabweichung dieser korrespondierenden Gaußkurven ist konstant; es gilt die heisenbergsche Unschärferelation.
Entropie
Die Normalverteilung hat die
Entropie:
.
Da sie für eine gegebene Varianz die größte Entropie unter allen Verteilungen hat, wird sie in der Maximum-Entropie-Methode oft als a-priori-Wahrscheinlichkeit verwendet.
Mehrdimensionale Verallgemeinerung

Dichte der zweidimensionalen Normalverteilung; die Standardabweichung der zweiten Koordinate Y ist 2, die Korrelation zwischen den Koordinaten 0.7
Das Wahrscheinlichkeitsmaß
auf
, das durch die Dichtefunktion
{1 \over \sqrt{(2\pi)^n}} \cdot \exp\left( -{1 \over 2} \sum_{i=1}^n x_i^2 \right)
definiert wird, heißt Standardnormalverteilung der Dimension . Ein Zufallsvektor ist genau dann standardnormalverteilt auf , wenn seine Komponenten standardnormalverteilt und stochastisch unabhängig sind.
Ein Wahrscheinlichkeitsmaß auf heißt
-dimensionale Normalverteilung, wenn eine Matrix
und ein Vektor existieren, so dass mit der affinen Abbildung gilt:
.
Die multivariate Normalverteilung ist die einzige rotationssymmetrische multivariate Verteilung,
deren Komponenten stochastisch unabhängig sind.
Die Dichtefunktion der zweidimensionalen Normalverteilung mit einem Korrelationskoeffizienten ist
und schließlich im
-dimensionalen Fall
f_X(x_1, \ldots, x_n)
=
\frac
{1}
{(2\pi)^{n/2} \left|\Sigma\right|^{1/2}} \cdot
\exp
\left(
-\frac 12
(x-\mu)^\top \Sigma^{-1} (x-\mu)
\right)
mit als der Determinante der Kovarianzmatrix .
Beziehungen zu anderen Verteilungsfunktionen
Transformation zur Standardnormalverteilung (z-Transformation)
Ist eine Normalverteilung mit beliebigen
und
gegeben, so kann diese durch eine Transformation auf eine
-Normalverteilung zurückgeführt werden. Dazu wird die Verteilungsfunktion
der allgemeinen Normalverteilung mit
substituiert und die Integralgrenzen werden angepasst:
| Nebenrechnung für die Substitution
|
|
F(x) &= \frac 1{\sigma \cdot \sqrt{2\pi}} \cdot \int_{-\infty}^x \mathrm e^{-\frac 12 \cdot \left( \frac{t-\mu}{\sigma}\right)^2} \mathrm dt\\
&= \frac 1{\sigma \cdot \sqrt{2\pi}} \cdot \int_{\frac{-\infty-\mu}\sigma}^{\frac{x-\mu}\sigma} \mathrm e^{-\frac 12 u^2} \mathrm du \cdot \sigma\\
&= \frac 1{\sqrt{2\pi}} \cdot \int_{-\infty}^{\frac{x-\mu}\sigma} \mathrm e^{-\frac 12 u^2} \mathrm du\\
&= \Phi \left(\frac{x-\mu}{\sigma}\right)
\end{align}
Wird nun definiert und durch ersetzt, so erhält man die Verteilungsfunktion der Standardnormalverteilung:
Geometrisch betrachtet entspricht die durchgeführte Substition einer flächentreuen Transformation der Glockenkurve von
zur Glockenkurve von
.
Approximation der Binomialverteilung durch die Normalverteilung
Die Normalverteilung kann zur Approximation der
Binomialverteilung verwendet werden, wenn der Stichprobenumfang
hinreichend groß und in der Grundgesamtheit der Anteil
der gesuchten Eigenschaft nicht zu klein ist. Als Faustregeln dafür gelten:
, was für die Standardabweichung bedeutet:
Falls diese Bedingung nicht erfüllt sein sollte, ist die Näherung immer noch vertretbar genau, wenn gilt: und zugleich .
Allgemeines
Um 1900
postulierte Max Planck das
Energiequantum , um die
Energieverteilung der
Schwarzkörperstrahlung erklären zu können und es wurde daraufhin in vielen anderen
Erscheinungen der Natur wiederentdeckt. Der bis dahin geltende Satz '
natura non facit saltus' - die Natur macht keine Sprünge - wurde wirksam widerlegt und zeigt auch, dass viele Phänomene, die oberflächlich für stetig gehalten werden, bei sehr genauer Betrachtung doch nichtstetig bzw. sprunghaft sind.
Die Normalverteilung liefert für diese Vorgänge eine sehr gute Approximation, denn viele endliche Zufallsvariablen sind näherungsweise normalverteilt. Eine in der Natur oft anzutreffende Wahrscheinlichkeitsverteilung ist die Binomialverteilung. Auch sie lässt sich in sehr guter Näherung mit der Normalverteilung beschreiben. Mathematisch wird dies durch den zentralen Grenzwertsatz belegt. Er besagt in diesem Fall, dass sich die nichtstetige Wahrscheinlichkeitsverteilung, die sich aus voneinander unabhängigen Zufallsgrößen ergibt, mit steigenden immer besser an die Normalverteilung angleicht. ist dabei die Anzahl der voneinander unabhängigen Zufallsversuche, von denen jeder einzelne eine Zufallsgröße ergibt.
Ein Beispiel für diese Angleichung der Häufigkeitsverteilung an die Normalverteilung ist folgender Würfelversuch:
Gegeben seien zwei normale Würfel, wobei jeder eine Augenzahl von eins bis sechs aufweist. Sie sollen nun mal geworfen werden, d. h. es werden voneinander unabhängige Zufallsversuche durchgeführt. Bei jedem Versuch berechnet sich das Ergebnis aus der Gesamtanzahl der geworfenen Augen. Insgesamt werden einige hundert Würfe gemacht, wobei die Anzahl der gleichen Ergebnisse gezählt wird. Diese Häufigkeit kann anschließend in ein Diagramm eingetragen werden. Die resultierende Verteilung ist bei sehr wenigen Würfen rein zufällig, bei sehr hohen wird sie hingegen der Gauß'schen Glockenkurve (mit dem Erwartungswert von 7) immer ähnlicher, trotzdem ist sie immer noch diskret verteilt (d. h. der Graph besteht aus kleinen Stufen).
Approximation
Ist eine
Binomialverteilung (Bernoulli-Versuch) mit
voneinander unabhängigen Stufen (bzw. Zufallsversuchen) mit einer Erfolgswahrscheinlichkeit
gegeben, so lässt sich die Wahrscheinlichkeit für
Erfolge allgemein durch
für
berechnen.
Für sehr große Werte von kann diese Binomialverteilung durch eine Normalverteilung approximiert werden (zentraler Grenzwertsatz). Dabei ist
- der Erwartungswert
- und die Standardabweichung
Ist nun
, dann ist folgende Näherung brauchbar:
Bei der Normalverteilung wird die untere Grenze um 0,5 verkleinert und die obere Grenze um 0,5 vergrößert, um eine bessere Approximation bei einer geringen Standardabweichung
gewährleisten zu können. Dies nennt man auch
Stetigkeitskorrektur. Nur wenn
einen sehr hohen Wert besitzt, kann auf sie verzichtet werden.
Da die Binomialverteilung diskret ist, muss auf einige Punkte geachtet werden:
- oder (und auch größer und größer gleich) müssen beachtet werden (was ja bei der Normalverteilung nicht der Fall ist). Deshalb muss bei
einer
F-Verteilung mit
((n_{1}-1,n_{2}-1)) Freiheitsgraden. Dabei sind
- \bar{X}^{(1)}=\frac{1}{n_{1}}\sum_{i=1}^{n_{1}}X_{i}^{(1)}\quad
\bar{X}^{(2)}=\frac{1}{n_{2}}\sum_{i=1}^{n_{2}}X_{i}^{(2)}.
Beziehung zur Students-t-Verteilung
Wenn die unabhängigen Zufallsvariablen
X_1, X_2, \dots , X_n identisch normalverteilt sind mit den Parametern
\mu und
\sigma, dann unterliegt die stetige Zufallsgröße
- Y_{n-1}=\frac{\bar{X}-\mu}{\displaystyle\sqrt{\frac{\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}}{n-1}}}\sqrt{n}
einer
Students t-Verteilung mit
(n-1) Freiheitsgraden.
Die Students t-Verteilung wird zur Konfidenzschätzung für den Erwartungswert einer normalverteilten Zufallsvariable bei unbekannter Varianz verwendet.
Rechnen mit der Standardnormalverteilung
Bei Aufgabestellungen, bei denen die Wahrscheinlichkeit für normalverteilte Zufallsvariablen durch die Standardnormalverteilung ermittelt werden soll, ist es nicht nötig, die oben angegebene Transformation jedesmal durchzurechnen. Stattdessen wird einfach das Ergebnis der Transformation verwendet, um die Grenzen x_1 , x_2 und die Zufallsvariable X auf die Grenzen z_1 , z_2 und die Zufallsvariable Z anzugleichen. Somit kann eine \mathcal{N}(\mu;\sigma^2) Verteilung durch
- z=\frac {x-\mu}{\sigma} beziehungsweise Z=\frac {X-\mu}{\sigma}
zu
\mathcal{N}(0;1) transformiert werden.
Die Wahrscheinlichkeit für ein Ereignis, welches z. B. innerhalb der Werte x_1 und x_2 (für den Erwartungswert \mu und die Standardabweichung \sigma ) liegt, ist durch folgende Umrechnung gleich der Wahrscheinlichkeit der Standardnormalverteilung mit den neuen Grenzen z_1 und z_2 :
- P( x_1 \leq X \leq x_2 ) = P\left( \frac {x_1-\mu}{\sigma} \leq Z= \frac {X-\mu}{\sigma} \leq \frac {x_2-\mu}{\sigma}\right)= P(z_1 \leq Z \leq z_2)
P steht für die englische Bezeichnung „probability“ oder das französische Wort „probabilité“ der Wahrscheinlichkeit.
Grundlegende Fragestellungen
Allgemein gibt die Verteilungsfunktion die Fläche unter der Glockenkurve bis zum Wert
x an, d. h. es wird das bestimmte Integral von
-\infty bis
x berechnet.
Dies entspricht in Aufgabenstellungen einer gesuchten Wahrscheinlichkeit, bei der die Zufallsvariable X kleiner oder kleiner gleich einer bestimmten Zahl x ist. Durch die Verwendung der reellen Zahlen und der Stetigkeit der Normalverteilung macht es keinen Unterschied, ob nun < oder \leq verlangt ist,
- weil P(X = 3) = \int_3^3 f(x)dx = 0 und somit P(X<3) = P(X \leq 3) .
Dasselbe gilt für
größer und
größer gleich.
Dadurch, dass X nur kleiner oder größer einer Grenze (oder innerhalb oder außerhalb zweier Grenzen) liegen kann, ergeben sich für Aufgaben bei normalverteilten Wahrscheinlichkeitsberechnungen folgende zwei grundlegende Fragestellungen:
- Wie hoch ist die Wahrscheinlichkeit, dass bei einem Zufallsversuch die normalverteilte Zufallsvariable Z höchstens den Wert z annimmt?
- P(Z \leq z)=\Phi(z)
In der Schulmathematik wird für diese Aussage auch die Bezeichnung Linker Spitz verwendet, da die Fläche unter der Gaußkurve von links bis zur Grenze verläuft. Für z sind auch negative Werte erlaubt, trotzdem haben viele Tabellen der Standardnormalverteilung nur positive Einträge. Durch die Symmetrie der Kurve und der Negativitätsregel des linken Spitz stellt dies aber keine Einschränkung dar:
| (Anm.: Das Minus von z wird im folgenden explizit
|
| ausgedrückt, d.h. -z = ->z|, wenn z<0 )
|
- \Phi(-z)=1-\Phi(z)
- Wie hoch ist die Wahrscheinlichkeit, dass bei einem Zufallsversuch die normalverteilte Zufallsvariable Z mindestens den Wert z annimmt?
P(Z \geq z) = 1 - \Phi(z)
Analog wird hier oft die Bezeichnung Rechter Spitz verwendet. Ebenso gibt es eine Negativitätsregel:
- P(Z \geq -z)= 1- \Phi(-z)= 1-(1-\Phi(z)) = \Phi(z)
(Da jede Zufallsvariable
X der allgemeinen Normalverteilung sich in die Zufallsgröße
Z der Standardnormalverteilung umwandeln lässt, gelten die Fragestellungen für beide Größen gleichbedeutend.)
Streubereich und Antistreubereich
Der
Streubereich gibt die Wahrscheinlichkeit wieder, dass die normalverteilte Zufallsvariable
Z Werte zwischen
z_1 und
z_2 annimmt:
- P(z_1 \le Z \le z_2) = \Phi(z_2) - \Phi(z_1)
Beim Sonderfall des symmetrischen Streubereiches (
z_1=-z_2, mit
z_2>0) gilt
- \begin{align}
P(-z\le Z\le z ) &= P (|Z|\le z)\\
&= \Phi(z)-\Phi(-z)\\
&= \Phi(z)-(1-\Phi(z))\\
&= 2\Phi(z)-1.
\end{align}
Hingegen gibt der Antistreubereich die Höhe der Wahrscheinlichkeit an, dass die normalverteilte Zufallsvariable Z Werte außerhalb des Bereichs zwischen z_1 und z_2 annimmt:
- P(Z\le z_1\text{ oder }Z\ge z_2) = \Phi(z_1) + (1-\Phi(z_2)).
Somit folgt bei einem symmetrischen Antistreubereich
- \begin{align}
P(Z\le -z\text{ oder }Z\ge z) &= P(|Z|\ge z)\\
&=\Phi(-z)+1-\Phi(z)\\
&= 1-\Phi(z)+1-\Phi(z)\\
&=2-2 \Phi(z)
\end{align}
Streubereiche am Beispiel der Qualitätssicherung
Besondere Bedeutung haben beide Streubereiche z. B. bei der
Qualitätssicherung von technischen oder wirtschaftlichen
Produktionsprozessen. Hier gibt es einzuhaltende
Toleranzgrenzen x_1 und
x_2 , wobei es meist einen größten noch akzeptablen Abstand
\epsilon vom Erwartungswert
\mu (= dem optimalen Sollwert) gibt.
\sigma kann hingegen
empirisch aus dem Produktionsprozess gewonnen werden.
Wurde [x_1;x_2]=[\mu-\epsilon;\mu+\epsilon] als einzuhaltendes Toleranzintervall angegeben, so liegt (je nach Fragestellung) ein symmetrischer Streu- oder Antistreubereich vor.
Im Falle des Streubereiches gilt:
- P(x_1 \leq X \leq x_2) = P(|X-\mu|\leq\epsilon)=
- =P(\mu-\epsilon \leq X \leq \mu+\epsilon) = P\left(\frac{-\epsilon}{\sigma} \leq Z \leq \frac{\epsilon}{\sigma}\right)=
- =\Phi\left(\frac{\epsilon}{\sigma}\right)-\Phi\left(\frac{-\epsilon}{\sigma}\right)=
- = 2 \cdot \Phi\left(\frac{\epsilon}{\sigma}\right)-1 =\gamma
Der Antistreubereich ergibt sich dann aus
- P(|X-\mu|\geq \epsilon )= 1-\gamma
oder wenn kein Streubereich berechnet wurde durch
- P(|X-\mu|\geq \epsilon )=2\cdot\left(1-\Phi\left(\frac{\epsilon} {\sigma}\right)\right)=\alpha .
Das Ergebnis
\gamma ist also die Wahrscheinlichkeit für verkaufbare Produkte, während
\alpha die Wahrscheinlichkeit für Ausschuss bedeutet, wobei beides von den Vorgaben von
\mu ,
\sigma und
\epsilon abhängig ist.
Ist bekannt, dass die maximale Abweichung \epsilon symmetrisch um den Erwartungswert liegt, so sind auch Fragestellungen möglich, bei denen die Wahrscheinlichkeit vorgegeben und eine der anderen Größen zu berechnen ist.
Testen auf Normalverteilung

Quantile einer Normalverteilung und einer Chi-Quadrat-Verteilung
Um zu testen, ob vorliegende Daten normalverteilt sind, können unter Anderem der
Kolmogorov-Smirnov-Test und der Shapiro-Wilk-Tests herangezogen werden. Mit Hilfe von
Normal-Quantil-Plot (auch Quantil-Quantil-Plot oder Q-Q-Plot) ist eine einfache grafische Überprüfung auf Normalverteilung möglich.
Simulation normalverteilter Zufallsvariablen
Box-Muller-Methode
Nach der
Box-Muller-Methode lässt sich eine standardnormalverteilte Zufallsvariable
X aus zwei
gleichverteiltenenen Zufallsvariablen
u_1,u_2 \sim U(0,1), sogenannten
Standardzufallszahl, simulieren:
- X=\sqrt{(-2\ln u_1)}\;\cos(2\pi u_2)
Polar-Methode
Die
Polar-Methode von
Marsaglia ist auf einem Computer noch schneller, da sie nur einen Logarithmus benutzt:
- Generiere zwei gleichverteilte Zufallsvariablen u_1,u_2=U(0,1)
- Berechne v=(2u_1-1)^2+(2u_2-1)^2. Falls v \ge 1 wiederhole 1.
- x=(2u_1-1)(-2\log v /v)^{1/2}
Durch lineare Transformation lassen sich hieraus auch beliebige normalverteilte Zufallszahlen generieren: Ist die Zufallsvariable
X \sim \mathcal{N}(0,1)-verteilt, so ist aX+b schließlich
\mathcal{N}(b,a^2)-verteilt.
Zwölferregel
Der
zentrale Grenzwertsatz besagt, dass sich die Verteilung der Summe unabhängiger identisch verteilter Zufallszahlen einer Normalverteilung nähert.
Ein Spezialfall ist die Zwölferregel, die sich auf die Summe von 12 Zufallszahlen aus einer Gleichverteilung auf dem Intervall [0,1] beschränkt und bereits zu passablen Verteilungen führt.
Stark ins Gewicht fällt die Forderung der Unabhängigkeit der zwölf X_i, die von normalen Pseudozufallszahlen (LKG) nicht garantiert wird. Im Gegenteil wird vom Spektraltest meist nur die Unabhängigkeit von maximal vier bis sieben der X_i garantiert. Für numerische Simulationen ist die Zwölferregel daher sehr bedenklich. Andere sogar leichter zu programmierende Verfahren sind daher vorzuziehen.
Verwerfungsmethode
Normalverteilungen lassen sich mit der
Verwerfungsmethode (s. dort) simulieren.
Inversionsmethode
Selbstverständlich lässt sich die Normalverteilung auch mit der
Inversionsmethode berechnen. Da das
Fehlerintegral leider nicht explizit mit elementaren Funktionen integrierbar ist, muss man auf Reihenentwicklungen der inversen Funktion für einen Startwert (
a_1 ... a_{14} weiter unten) und anschließende Korrektur mit dem Newtonverfahren zurückgreifen. Dazu werden erf(x) und erfc(x) benötigt, die ihrerseits mit Reihenentwicklungen und Kettenbruchentwicklungen berechnet werden können - insgesamt ein relativ hoher Aufwand. Die notwendigen Entwicklungen sind in der Literatur zu finden
[William B. Jones, W. J. Thron; Continued Fractions: Analytic Theory and Applications; Addison Wesley, 1980].
Entwicklung des inversen Fehlerintegrals (wegen des Pols nur als Startwert für das Newtonverfahren verwendbar):
- \operatorname{erf}^{-1} \left(\frac{\sqrt\pi}2 x\right) = x\Bigl(a_1 + x^2 \bigl(a_2 + x^2 (\dots)\bigr)\Bigr)
mit den Koeffizienten
- \begin{align}
a_i &= 1,
\frac 13,
\frac 7{30},
\frac {127}{630},
\frac {4369}{22680},
\frac {34807}{178200},
\frac {20036983}{97297200},
\frac {2280356863}{10216206000},
\frac {49020204823}{198486288000},\\
& {65967241200001\over 237588086736000},
{15773461423793767\over 49893498214560000},
{655889589032992201\over 1803293578326240000},\\
& {94020690191035873697\over 222759794969712000000},
{655782249799531714375489\over 1329207696584271504000000},\ldots
\end{align}
Simulation mehrdimensionaler normalverteilter Zufallsvektoren
Die Komponenten des Zufallsvektors
X^* werden durch standardnormalverteilte Zufallsvariable gefüllt (diese lassen sich mit einem der obigen Verfahren erzeugen). Dann ist der Zufallsvektor
- X = U X^* + \mu
eine Realisierung der Normalverteilung mit Erwartungswertvektor
\mu und Kovarianzmatrix
\Sigma=U*U^T.
U wird dabei durch die
Cholesky-Zerlegung berechnet.
Plausibilisierung:
Erwartungswert:
- E(X) = E(U X^* + \mu) = \underbrace{E(UX^*)}_{=0} + E(\mu) = \mu
Kovarianz:
- \begin{align}
\operatorname{cov}(X) &= \frac 1n \sum_{i=1}^n (X_i-\mu) (X_i-\mu)^T\\
&= \frac 1n \sum_{i=1}^n U X_i^* X_i^{*T} U^T\\
&= U\underbrace{\left(\frac 1n \sum_{i=1}^n X_i^* X_i^{*T} \right)}_{=\operatorname{cov}(X^*)=I} U^T\\
&= U U^T\\
&= \Sigma
\end{align}
Anwendungen außerhalb der Wahrscheinlichkeitsrechnung
Die Normalverteilung lässt sich auch zur Beschreibung nicht direkt stochastischer Sachverhalte verwenden, etwa in der Physik für das Amplitudenprofil der Gaußstrahlen und andere Verteilungsprofile.
Zudem findet sie Verwendung in der Gabor-Transformation.
Siehe auch
Quellen
Weblinks