www.all2know.com Google WWW All2know fr
  Accueil Accueil | À propos À propos 
  Navigation
» Accueil
» Page des catégories
» Liste des listes
» Alphabétique indexes
» Biographies
» Une page au hasard
» Éditer Liens externes
Dernière modification: 2007-10-19
  Autres langues 
daNormalfordeling
fiNormaalijakauma
noNormalfordeling
svNormalfördelning
Catégorie: Statistiques Loi de probabilité Fonctions spéciales

Loi normale

\; \exp\left(-\frac{\left(x-\mu\right)^2}{2\sigma^2} \right) \!|
 cdf        =\frac12 \left(1 + \mathrm{erf}\,\frac{x-\mu}{\sigma\sqrt2}\right) \!|
 mean       =\mu|
 median     =\mu|
 mode       =\mu|
 variance   =\sigma^2|
 skewness   = 0|
 kurtosis   = 3 (0 si normalisé)|
 entropy    =\ln\left(\sigma\sqrt{2\,\pi\,e}\right)\!|
 mgf        =M_X(t)= \exp\left(\mu\,t+\sigma^2 \frac{t^2}{2}\right)|
 char       =\phi_X(t)=\exp\left(\mu\,i\,t-\frac{\sigma^2 t^2}{2}\right)|
}} En probabilité, une variable aléatoire suit une loi normale (ou loi normale gaussienne, loi de Laplace-Gauss) d'espérance m et d'écart type σ si elle admet une densité de probabilité f telle que :

f(x)=\frac{1}{\sigma \sqrt{2\pi}}\mathrm{e}^{-\frac{1}{2}\left(\frac{x-m}{\sigma}\right)^2}

Une telle variable aléatoire est dite variable gaussienne.

La loi normale est une des principales distributions de probabilité. Elle a été mise en évidence par Gauss au XIX siècle et permet de modéliser de nombreuses études biométriques. Sa densité de probabilité dessine une courbe dite courbe en cloche ou courbe de Gauss.

Le Théorème de Moivre-Laplace affirme la convergence d'une loi binomiale vers une loi de Gauss quand le nombre d'épreuves augmente.

1 La loi normale centrée réduite
2 La loi normale générale
3 Champ d'application
4 Critères de normalité
5 Stabilité de la loi normale par la somme
6 Stabilité de la loi normale par la moyenne
7 Stabilité de la loi normale par la combinaison
8 Mélange de populations
9 Simulation
10 Le calcul de l'intégrale de Gauss
11 Voir aussi

La loi normale centrée réduite

La fonction \varphi : \R \to \R^+ définie par :

\varphi(t)=\frac{1}{\sqrt{2\;\pi}}\, \mathrm{e}^{-\frac{t^2}{2}}

est une densité de probabilité : elle est continue, et son intégrale sur \ \R est égale à 1.

On sait en effet que \ \int_{-\infty}^{+\infty}\mathrm{e}^{-\frac{t^2}{2}}\ dt = \sqrt{2\, \pi} (intégrale de Gauss).

On démontre (voir plus bas) que la loi définie par cette densité de probabilité admet une espérance nulle et une variance égale à 1.

Remarques :

  • la densité \varphi est paire ;
  • elle est indéfiniment dérivable et vérifie, pour tout \ t \in \R, l'identité \varphi'(t) = - t\, \varphi(t).

Définition

On appelle loi normale (ou gaussienne) centrée réduite la loi définie par la densité de probabilité \varphi.

La représentation graphique de cette densité est une courbe en cloche (ou courbe de Gauss).

Moments

Les moments de cette loi existent tous. Pour tout \ n \in \mathbb{N}, le moment d'ordre n par rapport à l'origine est :

\ m_n = \int_{-\infty}^{+\infty} t^n\, \varphi(t)\, dt.
  • En raison de la parité de l'intégrande, tous les moments d'ordre impair sont nuls :
m_{2\, k+1} = 0
  • Supposons à présent n pair : \ n = 2\, k, où \ k \in \mathbb{N}.

Si \ k \geq 1, une intégration par parties (non détaillée ici) donne :

m_{2\, k} = \int_{-\infty}^{+\infty} t^{2\, k - 1}\, t\, \varphi(t)\, dt =-\int_{-\infty}^{+\infty} t^{2\, k - 1}\, \varphi'(t)\, dt = (2\, k - 1) \int_{-\infty}^{+\infty} t^{2\, k - 2}\, \varphi(t)\, dt

ce qui fournit la relation de récurrence :
m_{2\, k} = (2\, k - 1)\, m_{2\, k - 2} .

De cette relation, on déduit, comme \ m_0 = 1\,, que :
m_{2\, k} = 1 \cdot 3 \cdots (2\, k - 1) = \frac{(2\, k)\, !}{2^k\, k\,!}
  • En particulier, \ m_1 = 0 (l'espérance est nulle : la loi est donc dite centrée) et \ m_2 = 1\, (la variance vaut \ \ m_2 - m_1^2 = 1\,\! : la loi est donc dite réduite).

Ceci justifie l'appellation de loi normale centrée réduite.
  • Des formules précédentes, on déduit encore :
m_3 = 0\,  et  m_4 = 3\,
  • La loi étant réduite, les moments centrés sont tous égaux aux moments par rapport à l'origine de même rang ; en particulier :
\mu_2 = \sigma^2 = 1\,,  \mu_3 = 0\, et \mu_4 = 3\,.
On en déduit l'asymétrie (skewness) : \gamma_1 = \frac{\mu_3}{\sigma^3} = 0\, et l'aplatissement (kurtosis) : \beta_2 = \frac{\mu_4}{\sigma^4} = 3\,.

Fonction de répartition

On note \Phi la fonction de répartition de la loi normale centrée réduite. Elle est définie, pour tout réel x, par :

\ \Phi(x) = \int_{-\infty}^x \varphi(t)\, dt = \int_{-\infty}^x\frac{1}{\sqrt{2\,\pi}}\,\mathrm{e}^{-\frac{t^2}{2}}\, dt .

C'est la primitive de \varphi qui tend vers 0 en -\infty ; elle ne s'exprime pas à l'aide des fonctions usuelles (exponentielle, etc.) mais devient elle-même une fonction usuelle, importante, pour quiconque pratique le calcul des probabilités ou les statistiques.

Citons les propriétés suivantes de la fonction \Phi :

  • Elle est indéfiniment dérivable, et \Phi' = \varphi
  • Elle est strictement croissante, tend vers 0 en -\infty et vers 1 en +\infty

(c'est donc une bijection \R \to\, ]0,\, 1[\, : pour tout p \in\, ]0,\, 1[\,, il existe x \in \R unique, noté \ \Phi^{-1}(p), tel que \ \Phi(x) = p)
  • Pour tout x \in \R, \Phi(-x) = 1 - \Phi(x) (ceci résulte de ce que la densité est paire) ; en particulier, \ \Phi(0) = 0,5

Remarque : les notations \varphi et \ \Phi pour désigner « la » densité et la fonction de répartition de la loi normale centrée réduite sont usuelles.

Approximation de la fonction de répartition

Il n'existe pas d'expression pour \Phi mais on peut exploiter avec profit son aspect régulier pour en donner une approximation grâce à un développement en série de Taylor. Par exemple, voici une approximation (à l'ordre 5) autour de 0: \Phi(x) \approx \frac{1}{2} + 0,3989423 \left[x-\frac{x^3}{6}+\frac{x^5}{40}\right]. Cette approximation est performante pour |x|<2.

Tables numériques

Il existe des tables de la fonction de répartition, donnant des valeurs approchées de \ \Phi(x) ; on se limite à des x positifs ou nuls : en effet, si par exemple on connaît l'approximation \Phi(0,5) \simeq 0,6915, on en déduit \Phi(-0,5) \simeq 1 - 0,6915 = 0,3085.

Au lieu des précédentes, on utilise souvent des tables de la fonction qu'on notera ici \ \Phi_0, définie sur \ \R^+ par :

\Phi_0(x) =\int_0^x \varphi(t)\, dt

Voici une table de cette fonction \ \Phi_0 (où les valeurs de x vont de 0,0 jusqu'à 3,4 par pas de 0,1) :

x ,0 ,1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9
0 0 0,0398 0,0793 0,1179 0,1554 0,1915 0,2257 0,2580 0,2881 0,3159
1 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713
2 0,4772 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981
3 0,4987 0,4990 0,4993 0,4995 0,4998

On dispose des relations simples suivantes entre \ \Phi et \ \Phi_0 (découlant de la formule de Chasles pour les intégrales) :

  • si \ x \geq 0, alors \ \Phi(x) = 0,5 + \Phi_0(x)
  • si \ x < 0, alors \ \Phi(x) = 0,5 - \Phi_0(-x)

Soit T une variable aléatoire suivant la loi normale centrée réduite :
  • pour tout \ x \in \R,\, P(T \leq x) = \Phi(x) et pour tout \ x \in \R^+,\, P(0 \leq T \leq x) = \Phi_0(x)

  • pour tout couple \ x_1,\, x_2 de réels tels que \ x_1 \leq x_2, \ P(x_1 \leq T \leq x_2) = \Phi(x_2)- \Phi(x_1).

Exemples numériques

À l'aide de la table ci-dessus, on obtient, pour la variable aléatoire précédente :

  • \ P(0 \leq T \leq 1,7) = \Phi_0(1,7) \simeq 0,4554

  • \ P(T \leq 1,7) = \Phi(1,7) = 0,5 + \Phi_0(1,7) \simeq 0,9554

  • \ P(-0,3 \leq T \leq 1,7) = \Phi(1,7)- \Phi(-0,3) = 0,5 + \Phi_0(1,7) - 0,5 + \Phi_0(0,3) \simeq 0,5733

La loi normale générale

Soient \ T une variable aléatoire suivant la loi normale centrée réduite, et deux réels \mu,\, \sigma, où \ \sigma > 0.

On définit la variable aléatoire X = \sigma\, T + \mu, dont on note \ F la fonction de répartition.

On a \mathrm{E}(X) = \sigma\, \mathrm{E}(T) + \mu = \mu et \mathrm{V}(X) = \sigma^2\, \mathrm{V}(T) = \sigma^2 puisque \ \mathrm{E}(T) = 0 et \ \mathrm{V}(T) = 1.

Cherchons la loi de \ X : pour tout x \in \R,

F(x) = P(X \leq x) = P(\sigma\, T + \mu \leq x) = P\left(T \leq \frac{x - \mu}{\sigma}\right) = \Phi\left(\frac{x - \mu}{\sigma}\right),

puisque la fonction de répartition de \ T est \ \Phi.

Ainsi, \ F est continûment (et même indéfiniment) dérivable : \ X suit une loi à densité, et la dérivée \ f de \ F est une densité de probabilité de cette variable aléatoire ; pour tout x \in \R,

f(x) = F'(x) = \frac{1}{\sigma}\, \Phi' \left(\frac{x - \mu}{\sigma}\right) = \frac{1}{\sigma}\, \varphi \left(\frac{x - \mu}{\sigma}\right) = \frac{1}{\sigma \sqrt{2\,\pi}}\, \mathrm{e}^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}.

Ceci légitime la définition suivante :

Définition

On appelle loi normale (ou gaussienne, ou de Laplace-Gauss) de paramètres \ \mu,\, \sigma^2 (où \ \sigma > 0) la loi de probabilité définie par la densité \ f : \R \to \R^+, telle que pour tout x \in \R :

f(x) = \frac{1}{\sigma}\, \varphi \left(\frac{x - \mu}{\sigma}\right) = \frac{1}{\sigma \sqrt{2\,\pi}}\, \mathrm{e}^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}.

Notation: cette loi est notée \mathcal{N}(\mu,\, \sigma^2) (on a aussi utilisé \mathcal{N}(\mu,\, \sigma), mais cette dernière tend à céder la place à l'autre, d'autant plus qu'elle n'est pas cohérente avec la notation habituelle de la loi (multi-)normale sur \ \R^n). La loi normale centrée réduite est \mathcal{N}(0,\, 1).

On peut énoncer plusieurs propriétés, compte tenu de ce qui précède (le dernier point se démontrant de manière analogue).

Propriétés

Soit une variable aléatoire \ X qui suit la loi normale \mathcal{N}(\mu,\, \sigma^2). Alors :

  • son espérance et sa variance existent et \ \mathrm{E}(X) = \mu, \ \mathrm{V}(X) = \sigma^2 > 0
  • sa fonction de répartition \ F est telle que pour tout x \in \R,

F(x) = \Phi\left(\frac{x - \mu}{\sigma}\right)
  • la variable aléatoire X^\star = \frac{X - \mathrm{E}(X)}{\sqrt{\mathrm{V}(X)}}, c'est-à-dire X^\star = \frac{X - \mu}{\sigma}, suit la loi normale centrée réduite
  • si \ \alpha,\, \beta sont deux réels (\ \alpha \neq 0), alors la variable aléatoire \ \alpha\, X + \beta suit la loi normale \mathcal{N}(\alpha\, \mu + \beta,\, \alpha^2\, \sigma^2)

Largeur à mi-hauteur

Lorsque l'on travaille sur une représentation graphique, on estime fréquemment la largeur de la gaussienne par sa largeur à mi-hauteur H (en anglais full width at half maximum, FWHM), qui est la largeur de la courbe à une altitude qui vaut la moitié de l'altitude du sommet. La largeur à mi-hauteur est proportionnelle à l'écart type :

H = 2 \sqrt{2\ ln(2)}\ \sigma \simeq 2,3548 \sigma
Le facteur 2 sert à prendre en compte l'extension de la Gaussienne dans les valeurs négatives.

Calcul de P(a ≤ X ≤ b)

Les résultats précédents permettent de ramener tout calcul de probabilité relatif à la loi normale \mathcal{N}(\mu,\, \sigma^2) à un calcul de probabilité relatif à la loi normale centrée réduite. On a vu qu'on dispose de tables donnant des approximations de valeurs de la fonction \ \Phi, tables qu'on utilise encore fréquemment, même si certaines calculatrices ou certains tableurs peuvent maintenant les remplacer.

Si la variable aléatoire \ X suit la loi normale \mathcal{N}(\mu,\, \sigma^2), et si \ a,\, b sont deux réels tels que \ a \leq b, on a :

\ P(a \leq X \leq b) = F(b) - F(a) = \Phi\left(\frac{b - \mu}{\sigma}\right) - \Phi\left(\frac{a - \mu}{\sigma}\right)

Cas d'un intervalle centré à la moyenne, plages de normalité

  • Si t est un réel positif,

\ P(\mu - t\, \sigma \leq X \leq \mu + t\, \sigma) = \Phi(t) - \Phi(-t) = \Phi(t) - (1 - \Phi(t)) = 2\, \Phi(t) - 1

  • lorsque \ P(\mu - t\, \sigma \leq X \leq \mu + t\, \sigma) = \alpha, où \ \alpha \in\, ]0,\, 1[,

ce qui équivaut à \ 2\, \Phi(t) - 1 = \alpha, ou \ \Phi(t) = \frac{\alpha + 1}{2},

l'intervalle \ [\mu - t\, \sigma,\, \mu + t\, \sigma] = [\mathrm{E}(X) - t\, \sigma,\, \mathrm{E}(X) + t\, \sigma] est appelé plage de normalité au niveau de confiance \alpha

(si par exemple, \alpha = 0, 95, on dit : 'plage de normalité au niveau de confiance 95%' : en statistique, c'est un intervalle dans lequel se trouve 95% de la population lorsque la distribution est gaussienne).

Exemples numériques

Grâce à la table précédente, on obtient :

  • \ P(\mu - \sigma \leq X \leq \mu + \sigma) \simeq 0,6826 ;
l'intervalle [\mathrm{E}(X) - \sigma,\, \mathrm{E}(X) + \sigma] est la plage de normalité au niveau de confiance 68 %

  • \ P(\mu - 0,5H \leq X \leq \mu + 0,5H) \simeq 0,76.. ;
l'intervalle [\mathrm{E}(X) - 0,5H,\, \mathrm{E}(X) + 0,5H] (H étant la largeur à mi-hauteur) est la plage de normalité au niveau de confiance 76 %

  • \ P(\mu - 2\, \sigma \leq X \leq \mu + 2\, \sigma) \simeq 0,9544 ;
l'intervalle [\mathrm{E}(X) - 2\, \sigma,\, \mathrm{E}(X) + 2\, \sigma] est la plage de normalité au niveau de confiance 95 %

  • \ P(\mu - 3\, \sigma \leq X \leq \mu + 3\, \sigma) \simeq 0,9974 ;
l'intervalle [\mathrm{E}(X) - 3\, \sigma,\, \mathrm{E}(X) + 3\, \sigma] est la plage de normalité au niveau de confiance 99 %

Champ d'application

La loi normale s'utilise notamment comme approximation d'une loi binomiale de paramètres (n ; p) pour n grand et p, 1 - p de même ordre de grandeur ; on approche alors cette loi binomiale par la loi normale ayant même espérance np et même variance np(1-p).

On a dessiné ci-dessous :
  • un diagramme en bâtons de la loi binomiale de paramètres (12 ; 1/3) et la loi normale correspondante d'espérance 4 et de variance 8/3

  • un diagramme en bâtons de la loi binomiale de paramètres (60 ; 1/3), et la loi normale correspondante d'espérance 20 et de variance 40/3

Image:Bernoulli60.png

Le mathématicien Carl Friedrich Gauss a introduit cette loi pour le calcul d'erreurs.

En statistiques, de nombreux phénomènes suivent des distributions gaussiennes : données biométriques des individus (Adolphe Quételet).

Critères de normalité

Le recours à une distribution gaussienne est si fréquent qu'il peut finir par être abusif. Il faut alors rechercher des critères de normalité.

Le premier critère, le plus simple, consiste à tracer l'histogramme ou le diagramme en bâtons de la distribution et à vérifier si le diagramme est en forme de « cloche ». Ce critère, subjectif, permet cependant d'éliminer une partie des distributions jugées alors non gaussiennes.

Le critère suivant consiste à utiliser les plages de normalité ou intervalles de confiance. On a vu que si une distribution est gaussienne :

  • 68% de la population est dans l'intervalle [\overline{x} -\sigma\, ;\, \overline{x}+\sigma],

  • 76% de la population est dans l'intervalle [\overline{x} -0,5H\, ;\, \overline{x}+0,5H],

  • 95% de la population est dans l'intervalle [\overline{x} -2\, \sigma\, ;\, \overline{x} + 2\, \sigma],

  • 99% de la population est dans l'intervalle [\overline{x} - 3\, \sigma\, ;\, \overline{x} + 3\, \sigma].

Lorsque ces pourcentages ne sont pas respectés, il est fort à parier que la distribution n'est pas gaussienne.

On peut aussi utiliser la droite de Henry, en particulier quand on possède peu de renseignements sur la distribution. La droite de Henry va permettre de porter un diagnostic sur la nature non gaussienne de la distribution, et, dans le cas où celle-ci a des chances d'être gaussienne, elle permet d'en déterminer la moyenne et l'écart type.

Le dernier critère est l'application d'un test d'adéquation, le Test de Jarque Bera, (test du χ²) qui valide ou non l'hypothèse de normalité.

Néanmoins, l'utilisation d'un test automatique est délicate. En effet, dans le cas de petits effectifs, le test manquera de puissance et ne détectera pas la non normalité, même en cas de non normalité évidente. Réciproquement, dans le cas d'effectifs importants, le test sera surpuissant et détectera la moindre petite variation. Il rejettera donc des variables presque normales.

Stabilité de la loi normale par la somme

La somme de deux variables gaussiennes indépendantes est elle-même une variable gaussienne. Plus explicitement :

Soient X_1,\, X_2 deux variables aléatoires indépendantes suivant respectivement les lois \mathcal{N}(m_1,\, \sigma_1^2) et \mathcal{N}(m_2,\, \sigma_2^2).

Alors, la variable aléatoire \ X_1 + X_2 suit la loi normale \mathcal{N}(m_1 + m_2,\, \sigma_1^2 + \sigma_2^2).

Cette propriété se démontre directement (par convolution), ou indirectement (au moyen des fonctions caractéristiques).

Exemple

On prend ici le gramme comme unité de masse. Si la masse du contenu d'une boîte de conserve suit la loi normale d'espérance 400 et de variance 25, et si celle du contenant suit la loi normale d'espérance 60 et de variance 4, alors (avec l'hypothèse, naturelle, d'indépendance) la masse totale de la boîte de conserve suit la loi normale d'espérance 460 et de variance 29 ; son écart type est environ 5, 4 grammes.

Stabilité de la loi normale par la moyenne

Stabilité de la loi normale par la combinaison

Mélange de populations

Il ne faut pas confondre la somme de deux variables gaussiennes indépendantes, qui reste une variable gaussienne, et le mélange de deux populations gaussiennes, qui n'est pas une population gaussienne (voir aussi modèle de mixture gaussienne).

Un mélange constitué de

  • 2/3 d'individus dont la taille suit une loi normale de moyenne 160 cm et d'écart type 15 cm, de densité f
  • 1/3 d'individus dont la taille suit une loi normale de moyenne 130 cm et d'écart type 10 cm, de densité g

suit une loi de moyenne (2/3)×160+(1/3)×130 = 150 cm, mais non gaussienne, de densité

h = (2/3) f + (1/3) g.

Sur la représentation graphique de la densité h, on peut apercevoir une double bosse : la distribution est bimodale.

Simulation

Il est possible de simuler, par exemple par ordinateur, un tirage aléatoire dont la loi est normale.

Les logiciels ou les langages de programmation possèdent en général un générateur de nombres pseudo-aléatoires ayant une distribution uniforme sur ]0,1[. On cherche donc une fonction transformant ces nombres. De manière générale, on peut prendre la fonction réciproque de la fonction de répartition : en l'occurrence, si la variable aléatoire U suit la loi uniforme sur ]0,1[, alors la variable aléatoire \ \Phi^{-1}(U) suit la loi normale centrée réduite ; cependant, cette méthode est tout à fait malcommode, faute d'expressions simples des fonctions \ \Phi et \ \Phi^{-1}. En revanche, on peut facilement utiliser la méthode décrite ci-dessous.

Cas de la loi normale à une dimension

Pour simuler la loi normale à une dimension (celle qui a été étudiée jusqu'ici), on peut utiliser la méthode de Box-Muller dont voici le principe :
Si U_1 et U_2 sont des variables aléatoires indépendantes qui suivent la loi uniforme sur ]0,1[, alors on démontre assez aisément que les variables aléatoires :

T_{1}=\sqrt{-2\ln U_{1}}\, \cos (2\pi U_{2})
T_{2}=\sqrt{-2\ln U_{1}}\, \sin (2\pi U_{2})
suivent toutes deux la loi normale centrée réduite (et sont indépendantes).

Les variables aléatoires X_1 = \mu + \sigma\, T_1 et X_2 = \mu + \sigma\, T_2 suivent donc toutes deux la loi normale \, \mathcal{N}(\mu,\, \sigma^2), et indépendamment l'une de l'autre.

; Voir ausi

Cas de la loi multinormale

La loi multinormale ou loi normale sur \R^n étend la loi normale à un vecteur aléatoire X = (X_1,\, X_2,\dots,\, X_n) à valeurs dans \R^n.

Elle est caractérisée par deux paramètres : un vecteur m de moyennes, et une matrice de variance-covariance V (carrée d'ordre n).

Pour simuler une loi multinormale non dégénérée de paramètres m et V, on utilise la méthode suivante :

  1. Soit T un vecteur aléatoire à n composantes gaussiennes centrées réduites et indépendantes (la loi de T, multinormale, a pour moyenne le vecteur nul et pour matrice de variance-covariance la matrice identité).
  2. Soit L la matrice résultant de la factorisation de Cholesky de la matrice V.
  3. Alors, le vecteur aléatoire X=m+L T suit la loi multinormale de moyenne m et de variance-covariance V

(on convient dans cette dernière relation d'identifier chaque élément de \R^n avec la matrice colonne de ses composantes en base canonique).

Le calcul de l'intégrale de Gauss

On trouvera ce calcul (utilisant une intégrale double) dans l'article sur l'intégrale de Gauss.

Voir aussi

Articles connexes

Un article de Wikipédia, l‘encyclopédie libre. Liens externes. Tous les textes sont disponibles sous les termes de la GNU Free Documentation License Liens externes.