Notes sur les intervalles de Confiance - 2° partie., Notes de Mathématiques
Caroline_lez
Caroline_lez14 January 2014

Notes sur les intervalles de Confiance - 2° partie., Notes de Mathématiques

PDF (286.3 KB)
5 pages
172Numéro de visites
Description
Notes de mathématique sur les intervalles de Confiance - 2° partie. Les principaux thèmes abordés sont les suivants: les i.c. sur la variance avec moyenne empirique connue, les i.c. sur la moyenne avec moyenne empirique...
20points
Points de téléchargement necessaire pour télécharger
ce document
Télécharger le document
Aperçu3 pages / 5
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document

(7.91)

Or, puisque les variables aléatoires sont indépendantes et identiquement distribuées

selon une loi Normale, alors les variables aléatoires :

(7.92)

sont aussi indépendantes et identiquement distribuées mais selon une loi Normale centrée

réduite.

Puisque:

(7.93)

en réarrangeant nous obtenons:

(7.94)

Donc sur la population de mesures, l'écart-type vrai suit la relation donnée ci-dessus. Il est donc

possible de faire de l'inférence statistique sur l'écart-type lorsque la moyenne théorique est

connue (...).

Puisque la fonction du khi-deux n'est pas symétrique, la seule possibilité pour faire l'inférence

c'est de faire appel au calcul numérique et nous noterons alors l'intervalle de confiance à 95% (par

exemple...) de la manière suivante:

(7.95)

Soit en notant :

(7.96)

le dénominateur étant alors bien évidemment la probabilité cumulée. Cette relation est rarement

utilisée dans la pratique car la moyenne théorique n'est pas connue. Voyons donc le cas le plus

courant:

6.3. I.C. SUR LA VARIANCE AVEC moyenne empirique connue

Cherchons maintenant à faire de l'inférence statistique lorsque la moyenne théorique de la

population n'est pas connue. Pour cela, considérons maintenant la somme:

(7.97)

où pour rappel est la moyenne empirique (arithmétique) de l'échantillon:

(7.98)

En continuant le développement nous avons:

(7.99)

Or, nous avons démontré au début de ce chapitre que la somme des écarts à la moyenne était

nulle. Donc:

(7.100)

et reprenons l'estimateur sans biais de la loi Normale (nous changeons de notation pour respecter

les traditions et bien différencier la moyenne empirique de la moyenne théorique):

(7.101)

Dès lors:

(7.102)

ou autrement écrit:

(7.103)

Puisque le deuxième terme (au carré) suit une loi Normale centrée réduite aussi, alors si nous le

supprimons nous obtenons de par la propriété démontrée plus haut de la loi du Khi-deux:

(7.104)

Ces développements nous permettent cette fois-ci de faire aussi de l'inférence sur la

variance d'une loi lorsque les paramètres et sont tous les deux inconnus pour

l'ensemble de la population. C'est ce résultat qui nous donne, par exemple, l'intervalle de

confiance:

(7.105)

lorsque la moyenne théorique est donc inconnue.

6.4. I.C. SUR LA MOYENNE AVEC moyenne empirique connue

Nous avons démontré beaucoup plus haut que la loi de Student provenait de la relation suivante:

(7.106)

si Z et U sont des variables aléatoires indépendantes et si Z suit une loi Normale centrée

réduite N(0,1) et U une loi du khi-deux tel que:

(7.107)

Voici une application très importante du résultat ci-dessus:

Supposons que constituent un échantillon aléatoire de taille n issu de la loi .

Alors nous pouvons déjà écrire que selon les développements faits plus haut:

(7.108)

Et pour U qui suit une loi , si nous posons alors selon les résultats obtenus plus

haut:

(7.109)

Nous avons alors après quelques simplifications triviales:

(7.110)

Donc puisque:

(7.111)

suit une loi de Student de paramètre k alors nous obtenons le "independant one-sample t-test":

(7.112)

suit aussi une loi de Student de paramètre n-1.

Ce qui nous donne aussi :

(7.113)

Ce qui nous permet de faire de l'inférence sur la moyenne d'une loi Normale d'écart-type

inconnu mais dont l'estimateur sans biais de l'écart-type est connu (donc l'écart-type théorique

est inconnu!). C'est ce résultat qui nous donne l'intervalle de confiance:

(7.114)

où nous retrouvons les mêmes indices que pour l'inférence statistique sur la moyenne d'une

variable aléatoire d'écart-type connu puisque la loi de Student est symétrique! Nous pouvons bien

évidemment dès lors aussi déterminer la probabilité avec laquelle la moyenne est dedans ou en

dehors d'un certain intervalle... (l'un comme l'autre étant beaucoup utilisés dans l'industrie).

Remarque: Le résultat précédent fut obtenu par William S. Gosset aux alentours de 1910. Gosset qui avait

étudié les mathématiques et la chimie, travaillait comme statisticien pour la brasserie Guinness en

Angleterre. À l'époque, on savait que si sont des variables aléatoires indépendantes et

identiquement distribuées alors:

(7.115)

Toutefois, dans les applications statistiques on s'intéressait bien évidemment plutôt à la quantité:

(7.116)

on se contentait alors de supposer que cette quantité suivait à peu près une loi Normale centrée

réduite ce qui n'était pas une mauvais approximation comme le montre l'image ci-dessous (

):

(7.117)

Suite à de nombreuses simulations, Gosset arriva à la conclusion que cette approximation était

valide seulement lorsque n est suffisamment grand (donc cela lui donnait l'indication comme quoi il

devait y avoir quelque part derrière le théorème central limite). Il décida de déterminer l'origine de

la distribution et après avoir suivi un cours de statistique avec Karl Pearson il obtint son fameux

résultat qu'il publia sous le pseudonyme de Student. Ainsi, on appelle loi de Student la loi de

probabilité qui aurait dû être appelée la loi ou fonction de Gosset.

Signalons enfin que le test de student est très utilisée pour identifier si des variations

(progressions ou l'inverse) de la moyenne de chiffres de deux populations identiques sont

significatives.

commentaires (0)
Aucun commentaire n'a été pas fait
Écrire ton premier commentaire
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Docsity n'est pas optimisée pour le navigateur que vous utilisez. Passez à Google Chrome, Firefox, Internet Explorer ou Safari 9+! Téléchargez Google Chrome