Notes sur les intervalles de Confiance - 1° partie, Notes de Mathématiques
Caroline_lez
Caroline_lez14 January 2014

Notes sur les intervalles de Confiance - 1° partie, Notes de Mathématiques

PDF (276.3 KB)
6 pages
99Numéro de visites
Description
Notes de mathématique sur les intervalles de Confiance - 1° partie. Les principaux thèmes abordés sont les suivants: les i.c. sur la moyenne avec variance theorique connue, les i.c. sur la variance avec moyenne theoriqu...
20points
Points de téléchargement necessaire pour télécharger
ce document
Télécharger le document
Aperçu3 pages / 6
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document

Intervalles de Confiance.

Jusqu'à maintenant nous avons toujours déterminé les différents estimateurs de vraisemblance ou

estimateurs simples (variance, écart-type) à partir de lois (fonctions) statistiques théoriques ou

mesurées sur toute une population de données.

Nous allons maintenant aborder une approche un peu différente et importante dans l'industrie en

se demandant maintenant quelles doivent être les tailles d'échantillons pour avoir une certaine

validité (intervalle de confiance I.C.) pour les données mesurées ou encore quel écart-type ou

fractile dans une loi Normale centrée réduite (grand nombre d'échantillons), du Khi-deux, de

Student ou de Fisher correspond à un certain intervalle de confiance (nous verrons ces deux

derniers cas de faibles échantillons dans la partie traitant de l'analyse de la variance ou ANOVA)

lorsque la variance ou la moyenne est connue ou respectivement inconnue sur l'ensemble ou une

partie de la population de donnée.

Indiquons que ces intervalles de confiance utilisent le théorème central limite démontré plus loin

(afin d'éviter toute frustration) et que les développements que nous allons faire maintenant nous

seront également utiles dans le domaine des Tests d'Hypothèse qui ont une place majeure en

statistique!

6.1. I.C. SUR LA MOYENNE AVEC VARIANCE théorique CONNUE

Commençons par le cas le plus simple et le plus courant qui est la détermination du nombre

d'échantillons pour avoir une certaine confiance dans la moyenne des mesures effectuées d'une

variable aléatoire supposée suivre une loi Normale.

D'abord rappelons que nous avons démontré au début de ce chapitre que l'erreur-type (écart-type

à la moyenne) était :

(7.55)

Maintenant, avant d'aller plus loin, considérons X comme une variable aléatoire suivant une loi

Normale de moyenne et d'écart-type . Nous souhaiterions déterminer à combien de sigma

correspond un intervalle de confiance de 95%. Pour déterminer cela, nous écrivons d'abord:

(7.56)

Remarque: Donc avec un intervalle de confiance de 95% vous aurez raison 19 fois sur 20, ou n'importe quel

autre niveau de confiance ou niveau de risque (1-niveau de confiance, soit 5%) que vous vous serez fixé à

l'avance. En moyenne, vos conclusions seront donc bonnes, mais nous ne pourrons jamais savoir si une

décision particulière est bonne! Si le niveau de risque est très faible mais que l'événement a quand même

lieu, les spécialiste parlent alors de "grande déviation".

En centrant et réduisant la variable aléatoire :

(7.57)

Notons maintenant Y la variable centrée réduite :

(7.58)

Puisque la loi Normale centrée réduite est symétrique :

(7.59)

D'où :

(7.60)

A partir de là en lisant dans les tables numériques de la loi Normale centrée réduite, nous avons

pour satisfaire cette égalité que :

(7.61)

Ce qui s'obtient facilement avec MS Excel en utilisant la fonction: -NORMSINV((1-0.95)/2).

Donc :

(7.62)

Ce qui est noté de façon traditionnelle dans le cas général autre que 95% par (Z n'est pas une

variable aléatoire c'est juste le facteur qui est la variable suivante) :

(7.63)

Or, considérons que la variable X sur la quelle nous souhaitons faire de l'inférence statistique est

justement la moyenne (et nous démontrerons plus loin que celle-ci suit une loi Normale centrée

réduite). Dès lors :

(7.64)

nous en tirons :

(7.65)

Ainsi, nous pouvons maintenant savoir le nombre d'échantillons à avoir pour s'assurer un

intervalle de précision (marge d'erreur) autour de la moyenne et pour qu'un pourcentage donné

des mesures se trouvent dans cet intervalle et en supposant l'écart-type expérimental connu

(ou imposé) d'avance (typiquement utilisé dans l'ingénierie de la qualité ou les instituts de

sondages).

Autrement dit, nous pouvons calculer le nombre n d'échantillons à mesurer pour s'assurer un

intervalle de confiance donné (associé à Z) de la moyenne mesurée en supposant l'écart-type

expérimental connu (ou imposé) et en souhaitant un précision de en valeur absolue sur la

moyenne.

Cependant... en réalité, la variable Z provient du théorème central limite (voir plus bas) qui donne

pour un échantillon de grande taille (approximativement):

(7.66)

En réarrangeant nous obtenons:

(7.67)

et comme Z peut être négatif ou positif alors il est plus censé d'écrire cela sous la forme:

(7.68)

Soit:

(7.69)

que les ingénieurs notent parfois:

(7.70)

avec LCL étant la lower confidence limit et UCL la upper confidence limit. C'est de la terminologie

Six Sigma (cf. chapitre de Génie Industriel).

Et nous venons de voir plus avant que pour avoir un intervalle de confiance à 95% nous devions

avoir Z=1.96. Et puisque la loi Normale est symétrique:

(7.71)

Cela se note finalement:

(7.72)

soit dans le cas d'un I.C. (intervalle de confiance) à 95%:

(7.73)

Nous sommes ainsi capables maintenant d'estimer des tailles de population nécessaires à obtenir

un certain niveau de confiance dans un résultat, soit d'estimer dans quel intervalle de confiance se

trouve la moyenne théorique par rapport à la moyenne expérimentale (empirique). Nous pouvons

bien évidemment dès lors aussi déterminer la probabilité avec laquelle la moyenne est en dehors

d'un certain intervalle... (l'un comme l'autre étant beaucoup utilisés dans l'industrie).

6.2. I.C. SUR LA VARIANCE AVEC moyenne théorique CONNUE

Commençons à démontrer une propriété fondamentale de la loi du khi-deux :

Si une variable aléatoire X suit une loi Normale centrée réduite alors son carré suit

une loi du khi-deux de degré de liberté 1 :

(7.74)

Démonstration:

Pour démontrer cette propriété, il suffit de calculer la densité de la variable

aléatoire avec . Or, si et si nous posons , alors pour

tout nous obtenons:

(7.75)

Puisque la loi Normale centrée réduite est symétrique par rapport à 0 pour la variable aléatoire X,

nous pouvons écrire :

(7.76)

En notant la fonction de répartition de la loi Normale centrée réduite (sa probabilité cumulée en

d'autres termes pour rappel...), nous avons :

(7.77)

et comme :

(7.78)

alors :

(7.79)

La fonction de répartition de la variable aléatoire (probabilité cumulée) est donne donnée

par :

(7.80)

si y est supérieur ou égal à zéro, nulle si y inférieur à zéro. Nous noterons cette

réparation pour la suite des calculs.

Puisque la fonction de distribution est la dérivée de la fonction de répartition et que X suit une loi

Normale centrée réduite alors nous avons pour la variable aléatoire X :

(7.81)

alors nous avons pour la loi de distribution de Y (qui est donc le carré de X pour rappel!) :

(7.82)

cette dernière expression correspond exactement à la relation que nous avions obtenu lors de

notre étude de la loi du khi-deux en imposant un degré de liberté unité.

Le théorème est donc bien démontré tel que si X suit une loi Normale centrée réduite alors son

carré suit une loi du khi-deux à 1 degré de liberté tel que :

(7.83)

C.Q.F.D.

Ce type de relation est utilisé dans les processus industriels et leur contrôle (cf. chapitre de Génie

Industriel).

Nous allons maintenant utiliser un résultat démontré lors de notre étude de la loi Gamma. Nous

avons effectivement vu plus haut que la somme de deux variables aléatoires suivant une loi

Gamma suit aussi une loi Gamma dont les paramètres s'additionnent :

(7.84)

Comme la loi du khi-deux n'est qu'un cas particulier de la loi Gamma, le même résultat s'applique.

Pour être plus précis, cela revient à écrire :

Si sont des variables aléatoires indépendantes (!) et identiquement

distribuées N(0,1) alors par extension de la démonstration précédente où nous avons montré que:

(7.85)

et de la propriété d'addition de la loi Gamma, la somme de leurs carrés suit alors une loi du khi-

deux de degré ktel que:

(7.86)

Ainsi, la loi du à k degrés de liberté est la loi de probabilité de la somme des carrés

de k variables normales centrées réduites linéairement indépendantes entre elles. Il s'agit de la

propriété de linéarité de la loi du Khi-deux (implicitement de la linéarité de la loi Gamma)!

Maintenant voyons une autre propriété importante de la loi du khi-deux : Si sont des

variables aléatoires indépendantes et identiquement distribuées (donc de même

moyenne et même écart-type et suivant une loi Normale) et si nous notons l'estimateur de

maximum de vraisemblance de la variance:

(7.87)

alors, le rapport de la variable aléatoire sur l'écart-type supposé connu de l'ensemble de la

population (dit "écart-type vrai" ou "écart-type théorique" pour bien différencier!) multiplié par le

nombre d'échantillons n de la population suit une loi du khi-deux de degré n telle que :

(7.88)

Remarques:

R1. En laboratoire, les peuvent être vues comme une classe d'échantillons d'un même

produit étudié identiquement par différentes équipes de recherche avec des instruments de même

précision (écart-type de mesure nul).

R2. est la "variance interclasse" également appelée "variance expliquée". Donc elle donne la

variance d'une mesure ayant eu lieu dans les différents laboratoires.

Ce qui est intéressant c'est qu'à partir du calcul de la loi du khi-deux en connaissant n et l'écart-

type il est possible d'estimer cette variance (écart-type) interclasse.

Pour voir que cette dernière propriété est une généralisation élémentaire de la relation :

(7.89)

il suffit de constater que la variable aléatoire est une somme de n carrés de N(0,1)

indépendants les uns des autres. Effectivement, rappelons qu'une variable aléatoire centrée

réduite (voir notre étude de la loi Normale) est donnée par :

(7.90)

Dès lors :

commentaires (0)
Aucun commentaire n'a été pas fait
Écrire ton premier commentaire
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Docsity n'est pas optimisée pour le navigateur que vous utilisez. Passez à Google Chrome, Firefox, Internet Explorer ou Safari 9+! Téléchargez Google Chrome