Notes sur la fonction de Gauss-Laplaceloi normale - 2° partie, Notes de Logique mathématique
Caroline_lez
Caroline_lez14 January 2014

Notes sur la fonction de Gauss-Laplaceloi normale - 2° partie, Notes de Logique mathématique

PDF (330.4 KB)
8 pages
371Numéro de visites
Description
Notes de mathématique sur la fonction de Gauss-Laplace/loi normale - 2° partie. Les principaux thèmes abordés sont les suivants: la somme de deux variables aléatoires, le produit de deux variables aléatoires, la loi norm...
20points
Points de téléchargement necessaire pour télécharger
ce document
Télécharger le document
Aperçu3 pages / 8
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document

multinationales qui recourent aux outils statistiques pour la gestion du risque, la gestion de

projets et la simulation lorsqu'un grand nombre de variables aléatoires sont en jeu. Le meilleur

exemple d'application en étant le logiciel CrystalBall ou @Risk de Palisade (mon préféré...).

Dans ce cadre d'application (gestion de projets), il est par ailleurs très souvent fait usage de la

somme (durée des tâches) ou le produit de variables aléatoires (facteur d'incertitude du client)

suivant des lois de Gauss-Laplace. Voyons comment cela se calcule :

SOMME DE DEUX VARIABLES ALÉATOIRES

Soit X, Y deux variables aléatoires indépendantes. Supposons que X suit la loi et

que Y suit la loi . Alors, la variable aléatoire aura une densité égale au

produit de convolution de . C'est-à-dire:

(7.296)

ce qui équivaut à faire le produit conjoint (cf. chapitre de Probabilités) des probabilités

d'apparition des deux variables continues (se rappeler le même genre de calcul sous forme

discrète!)

Pour simplifier l'expression, faisons le changement de variable et

posons , .

Comme:

(7.297)

Nous obtenons:

(7.298)

Nous posons :

(7.299)

Alors :

(7.300)

Sachant que :

(7.301)

et:

(7.302)

notre expression devient :

(7.303)

Nous reconnaissons l'expression de la loi de Gauss-Laplace de moyenne et d'écart

type .

Par conséquent, suit la loi :

(7.304)

Ce résultat est ce que nous nommons en statistiques la "stabilité par la somme" de la loi de

Gauss-Laplace. Nous retrouverons ce type de propriétés pour d'autres lois que nous étudierons

plus loin. PRODUIT DE DEUX VARIABLES ALÉATOIRES

Soit X, Y deux variables aléatoires indépendantes réelles. Nous désignerons par et les

densités correspondantes et nous cherchons à déterminer la densité de la variable .

Notons f la fonction de densité du couple (X,Y). Vu que X, Y sont indépendantes (cf. chapitre de

Probabilités) :

(7.305)

La fonction de répartition de Z est:

(7.306)

où .

D peut se réécrire comme union disjointe (nous faisons cette opération pour anticiper lors du futur

changement de variables une division par zéro) :

(7.307)

avec :

(7.308)

Nous avons :

(7.309)

La dernière intégrale vaut zéro car est de mesure (épaisseur) nulle pour l'intégrale selon x.

Nous effectuons ensuite le changement de variable suivant :

(7.310)

Le jacobien de la transformation est:

(7.311)

Donc:

(7.312)

Notons la densité de la variable Z. Par définition :

(7.313)

D'un autre côté :

(7.314)

comme nous venons de le voir. Par conséquent :

(7.315)

Ce qui est un peu triste c'est que dans le cas d'une loi de Gauss-Laplace (loi Normale), cette

intégrale ne peut être calculée simplement que numériquement... il faut alors faire appel à des

méthodes d'intégration du type Monte-Carlo (cf. chapitre de Méthodes Numériques).

D'après quelques recherche faites sur Internet cependant, mais sans certitude, cette intégrale

pourrait être calculée et donnerait une nouvelle loi appelée "loi de Bessel". LOI NORMALE CENTRÉE RÉDUITE

La fonction de Gauss-Laplace n'est pas tabulée puisqu'il faudrait autant de tables numériques que

de valeurs possibles pour la moyenne et l'écart-type (qui sont donc des paramètres de la

fonction comme nous l'avons vu).

C'est pourquoi, en opérant un changement de variable, la loi Normale devient la "loi Normale

centrée réduite" où :

1. "Centrée" signifie soustraire la moyenne (la fonction à alors pour axe de symétrie l'axe des

ordonnées)

2. "Réduite" signifie, diviser par l'écart-type

Par ce changement de variable, la variable k est remplacée par la variable aléatoire centrée réduite

:

(7.316)

Si la variable k a pour moyenne et pour écart- type alors la variable a pour

moyenne 0 et pour écart-type 1.

Donc la relation :

(7.317)

s'écrit alors (trivialement) plus simplement :

(7.318)

qui n'est d'autre que l'expression de la loi Normale centrée réduite souvent notée N(0,1) que nous

retrouverons très fréquemment dans les chapitres relatifs à la physique, la finance, la gestion et

l'ingénierie!

Remarque: Calculer l'intégrale de la relation précédente entre n'importe quelle bornes n'est pas possible

formellement parlant de manière exacte. Une idée possible et simple consiste alors à exprimer

l'exponentielle en série de Taylor et de faire ensuitre l'intégration terme par terme de la série (en

s'assurant de prendre suffisamment de termes pour la convergence!).

DROITE DE HENRY

Souvent, dans les entreprises c'est la loi de Gauss-Laplace (Normale) qui est analysée mais des

logiciels courants et facilement accessibles comme MS Excel sont incapables de vérifier que les

données mesurées suivent une loi Normale lorsque nous faisons de l'analyse fréquentielle (aucun

outil intégré par défaut ne permet de le faire) et que nous n'avons pas les données d'origines non

groupées.

L'astuce consiste alors à utiliser la variable centré réduite qui se construit comme nous l'avons

démontré plus haut avec la relation suivante:

(7.319)

L'idée de la droite d'Henry est alors d'utiliser la relation linéaire entre k et k* donnée par l'équation

de la droite:

(7.320)

et qui peut être tracée pour déterminer la moyenne et l'écart-type de la loi Normale.

Exemple:

Supposons que nous ayons l'analyse fréquentielle suivante de 10'000 tickets de caisse dans un

supermarché :

Montant des

tickets Nombre de tickets Nombre cumulés de

tickets

Fréquences

relatives cumulées

[0;50[ 668 668 0.068

[50,100[ 919 1'587 0.1587

[100,150[ 1'498 3'085 0.3085

[150,200[ 1'915 5000 0.5000

[200,250[ 1'915 6'915 0.6915

[250,300[ 1'498 8'413 0.8413

[300,350[ 919 9'332 0.9332

[350,400[ 440 9'772 0.9772

[400 et + 228 10'000 1

Tableau: 7.5 - Intervalles de classe pour la détermination de la droite de Henry

Si nous traçons maintenant cela sous MS Excel nous obtenons:

(7.321)

Ce qui ressemble terriblement à une loi Normale d'où l'autorisation, sans trop de risques, d'utiliser

dans cet exemple la technique de la droite d'Henry.

Mais que faire maintenant? Eh bien connaissant les fréquences cumulées, il ne nous reste plus qu'à

calculer pour chacune d'entre elles k* à l'aide de tables numériques ou avec la fonction

NORMSINV( ) de MS Excel (car rappelons que l'intégration formelle de la fonction gaussienne n'est

pas des plus faciles...).

Ceci nous donnera les valeurs de la loi Normale centrée réduite N(0,1) de ces mêmes fréquences

respectives cumulées (fonction de répartition). Ainsi nous obtenons (nous laissons le soin au

lecteur de chercher sa table numérique ou d'ouvrir son logiciel préféré...):

Borne supérieure de

l'intervalle

Fréquences relatives

cumulées

Correspondance

pourk* de N(0,1)

50 0.068 -1.5

100 0.1587 -1

150 0.3085 -0.5

200 0.5000 0

250 0.6915 0.5

300 0.8413 1

350 0.9332 1.5

400 0.9772 2

- 1 -

Tableau: 7.6 - Fréquences relatives cumulées pour la droite de Henry

Signalons que dans le type de tableau ci-dessus, dans MS Excel, les valeurs de fréquences

cumulées nulles et unitaires (extrêmes) posent problèmes. Il faut alors jouer un petit peu...

Comme nous l'avons spécifié plus haut, nous avons sous forme discrète:

(7.322)

Donc graphiquement sous MS Excel nous obtenons grâce à notre tableau le graphique suivant :

(7.323)

Donc à l'aide de la régression donnée par MS Excel (ou calculée par vos soins selon les techniques

de régressions linéaires vues dans le chapitre de Méthodes Numériques). Il vient :

(7.324)

dont nous déduisons immédiatement :

(7.325)

Il s'agit donc d'une technique particulière pour une distribution particulière! Des techniques

similaires plus ou moins simples (ou compliquées suivant les cas) existent pour nombre de

distributions.

commentaires (0)
Aucun commentaire n'a été pas fait
Écrire ton premier commentaire
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Docsity n'est pas optimisée pour le navigateur que vous utilisez. Passez à Google Chrome, Firefox, Internet Explorer ou Safari 9+! Téléchargez Google Chrome