Notes sur les types de variables - 1° partie, Notes de Trigonométrie
Caroline_lez
Caroline_lez14 January 2014

Notes sur les types de variables - 1° partie, Notes de Trigonométrie

PDF (319.9 KB)
9 pages
715Numéro de visites
Description
Notes de mathématique sur les types de variables - 1° partie Les principaux thèmes abordés sont les suivants: Les variables discrètes, Les variables continues, Les variables par attribut, démonstration des variables dis...
20points
Points de téléchargement necessaire pour télécharger
ce document
Télécharger le document
Aperçu3 pages / 9
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document

Types de variables.

Lorsque nous avons parlé des échantillons au début de ce chapitre, nous avons fait mention de

deux types d'informations : les variables quantitatives et qualitatives. Nous n'avons cependant pas

précisé qu'il existait trois types de variables quantitatives très importantes qu'il convient

absolument de différencier :

1. Les variables discrètes (par comptage): Sont analysées avec des loi stastistiques basées un

domaine de définition dénombrable toujours strictement positif (loi de Poisson typiquement dans

l'industrie). Sont quasiment toujours représentées sous forme graphique par des histogrammes.

2. Les variables continues (par mesure): Sont analysées avec des loi stastistiques basées un

domaine de définition non dénombrable strictement positif ou pouvant prendre toute valeur

positive ou négative (loi Normale typiquement dans l'industrie). Sont également quasiment

toujours représentées sous forme graphique par des histogrammes avec des intervalles de classe.

3. Les variables par attribut (de classification): Il ne s'agit pas de données numériques mais de

données qualitatives de type {Oui, Non}, {Réussi, Échec}, {A temp, En retard}, etc. Les données de

type attribut suivent une loi Binômiale.

Comprendre les différents types de données est une disciples important de l'ingénieur parce que

cela a des conséquences importantes sur le type d'analyse, les outils et et technique qui seront

employées.

Il y a une question fréquente concernant la collecte de données est de savoir la quantité qui

devrait être collecter. Au fait cela dépend du niveau de précision souhaité. Nous verrons beaucoup

plus loin dans ce chapitre (avec démonstration) comment déterminer mathématiquement la

quantité de données à collecter en faisant de la précision souhaitée pour un process Normal.

Voyons de près de quoi il s'agit car maintenant que le concept de moyenne nous est relativement

bien connu, nous allons pouvoir aborder des calculs plus formels et qui prendront tout leur sens.

VARIABLES DISCRÈTES

Soit X un variable indépendante (un élément d'un échantillon dont la propriété est indépendante

des autres éléments) qui peut prendre les valeurs aléatoires discrètes dans avec les

probabilités respectives où, de par l'axiomatique des probabilités:

(7.76)

Alors nous définissons "l'espérance mathématique" de la variable Xpar la relation:

(7.77)

appelée aussi "règle des parties".

En d'autres termes, nous savons qu'à chaque événement de l'espace des échantillons est associé

une probabilité à laquelle nous associons également une valeur (donnée par la variable aléatoire).

La question étant alors de savoir quelle valeur, à long terme, nous pouvons obtenir. La valeur

espérée, (l'espérance mathématique donc...) est alors la moyenne pondérée, par la probabilité, de

toutes les valeurs des événements de l'espace des échantillons.

Si la probabilité est donnée par une fonction de distribution (voir les définitions des fonctions de

distribution plus bas) de la variable aléatoire, nous avons:

(7.78)

Remarques:

R1. peut être notée s'il n'y pas de confusion possible.

R2. Si nous considérons chaque valeur comme les composantes d'un vecteur et

chaque probabilité (ou pondération) comme les composantes d'un vecteur alors

nous pouvons écrire l'espérance de manière technique sous la forme d'un produit scalaire souvent

noté:

(7.79)

Voici les propriétés mathématiques les plus importantes de l'espérance pour toute variable

aléatoire (quelque soit sa loi!) ou pour toute série de variables aléatoires et que nous utiliserons

souvent tout au long de ce chapitre:

P1. Multiplication par une constante:

(7.80)

P2. Somme de deux variables aléatoires:

(7.81)

où nous avons utilisé dans la 4ème ligne, la propriété vue dans le chapitre de Probabilités:

Nous en déduisons que pour n variables aléatoires , définies sur une même loi de distribution:

(7.82)

P3. Espérance d'une constante:

(7.83)

Après avoir traduit la tendance par l'espérance, il est intéressant de traduire la dispersion ou

"déviation standard" autour de l'espérance par une valeur appelée "variance de X",

notée V(X) ou (lire "sigma-deux") et donnée sous sa forme discrète par:

(7.84)

La variance n'est cependant pas comparable directement à la moyenne, car l'unité de la variance

est le carré de l'unité de la variable, ce qui découle directement de sa définition. Pour que

l'indicateur de dispersion puisse être comparé aux paramètres de tendance centrale (moyenne,

médiane et... mode), il suffit d'en prendre la racine carrée.

Par commodité, nous définissons ainsi "l'écart-type" de X, noté , par:

(7.85)

L'écart-type est donc la moyenne quadratique des écarts entre les observations et leur moyenne.

Remarques:

R1. L'écart-type de la variable aléatoire X peut être noté s'il n'y pas de confusion possible.

R2. L'écart-type et la variance sont, dans la littérature, souvent appelés "paramètres de dispersion" à

l'opposé de la moyenne, mode et médiane qui sont appelés des "paramètres de position".

Définition: Le rapport (exprimé en %) parfois utilisé dans les entreprises comme

comparaison de la moyenne et de l'écart-type est appelée le "coefficient de variation" (C.V.).

Pourquoi trouvons-nous un carré (réciproquement une racine) dans cette définition de la variance?

La raison intuitive est simple (la rigoureuse l'est nettement moins...). Nous avons démontré plus

haut que la somme des écarts à la moyenne pondéré par les effectifs, est toujours nulle :

(7.86)

Or, si nous assimilons les effectifs par la probabilité en normalisant ceux-ci par rapport à n, nous

tombons sur une relation qui est la même que la variance à la différence que le terme entre

parenthèse n'est pas au carré. Et nous voyons alors immédiatement le problème... la mesure de

dispersion serait toujours nulle d'où la nécessité de porter cela au carré.

Nous pourrions imaginer cependant d'utiliser la valeur absolue des écarts à la moyenne, mais pour

un certain nombre de raisons que nous verrons plus loin lors de notre étude des estimateurs le

choix de porter au carré intervient s'impose assez naturellement.

Signalons cependant quand même l'utilisation courante dans l'industrie de l'écart-moyen:

qui est un indicateur élémentaire très utilisé lorsque nous ne souhaitons pas faire de l'inférence

statistique sur une série de mesures. Cet écart peut être facilement calculé dans MS Excel à l'aide

de la fonction ECART.MOYEN( ).

Dans le cas où nous avons à disposition une série de mesures, nous pouvons estimer la valeur

expérimentale de la moyenne (l'espérance) et de la variance des mesures par les estimateurs

suivants (il s'agit simplement au fait de l'espérance et l'écart-type d'un échantillon dont les

événements sont tous équiprobables) dont la notation est particulière :

et (7.87)

Démonstration:

(7.88)

C.Q.F.D.

Le terme de la somme se trouvant dans l'expression de la variance (écart-type) est appelée

"somme des carrés des écarts à la moyenne". Nous l'appelons aussi la "somme des carrés totale",

ou encore la "variation totale" dans le cadre de l'étude de l'ANOVA (voir la fin de ce chapitre).

Remarque: Il est important que le lecteur comprenne que dans ce cas l'espérance se calcule simplement en

utilisant la moyenne arithmétique!

La variance peut également s'écrire sous la forme de la "formule de Huyghens" que nous

réutiliserons plusieurs fois par la suite. Voyons de quoi il s'agit:

(7.89)

Faisons maintenant un petitr crochet relativement à un scénario fréquent générateur d'erreurs

dans les entreprises lorsque plusieurs séries statistiques sont manipulées (cas très fréquent dans

l'industrie ainsi que dans les assurances ou la finance).

Considérons deux séries statistiques portant sur le même caractère:

- , effectif total n, moyenne , écart-type

- , effectif total m, moyenne , écart-type

Nous noterons la série statistique obtenue en regroupant les deux séries. Nous avons

alors:

(7.90)

Donc la moyenne des moyennes n'est pas égale à la moyenne globale (première erreur fréquente

dans les entreprises) exceptée si les deux séries statistiques ont le même nombre d'effectifs!!!

Concernant l'écart-type, rappelons d'abord que nous avons:

(7.91)

Pour la suite, rappelons que nous avons démontré précédemment la relation de Huyghens:

(7.92)

Il vient alors:

(7.93)

Donc nous voyons que l'écart-type global n'est pas égal à la somme des écarts-types (deuxième

erreur courante dans les entreprises) excepté si les effectifs et les moyennes sont les mêmes dans

les deux séries!!!

Considérons maintenant X une variable aléatoire d'espérance (valeur constante et déterminée)

et de variance (valeur constante et déterminée), nous définissons la "variable centrée réduite"

par la relation:

(7.94)

et l'on démontre de façon très simple (contactez-nous si vous souhaitez que nous ajoutions la

démonstration) en utilisant la propriété de linéarité de l'espérance et la propriété de multiplication

par un scalaire de la variance (voir de suite après) que:

(7.95)

Démonstration:

(7.96)

et en utilisant la formule de Huyghens:

(7.97)

C.Q.F.D.

Ainsi, toute répartition statistique définie par une moyenne et un écart-type peut être transformée

en une autre distribution statistique souvent plus simple à analyser.

Voici quelques propriétés mathématiques importantes de la variance :

P1. Multiplication par une constante :

(7.98)

P2. Somme de deux variables aléatoires:

(7.99)

où nous introduisons le concept de "covariance" dont nous verrons une expression plus commode

un peu plus bas.

Introduisons une forme plus générale et extrêmement importante dans de nombreux domaines:

(7.100)

Donc dans le cas général:

(7.101)

En utilisant la linéarité de l'espérance et le fait que:

(7.102)

nous avons pour la covariance :

(7.103)

et donc nous obtenons la relation très utilisée en statistiques et finance appelée "formule de la

covariance"... :

(7.104)

Indiquons également que si , nous retrouvons la formule de Huyghens:

(7.105)

Ainsi, le terme de covariance est défini par l'expression:

(7.106)

appelée "forme bilinéaire de la variance" ou "forme multivariée".

Remarque: Les statistiques peuvent être découpées selon le nombre de variables aléatoires que nous

étudions. Ainsi, lorsqu'une seule variable aléatoire est étudiée, nous parlons de "statistique univariée",

pour deux variables aléatoires de "statistique bivariée" et en général, de "statistique multivariée".

Si la covariance est univariée, nous avons dès lors:

(7.107)

Si et seulement si les variables sont équiprobables, nous la retrouvons la covariance dans la

littérature sous la forme suivante qui découle de calculs que nous avons déjà fait ultérieurement

avec l'espérance :

(7.108)

La covariance est un indicateur de la variation simultanée de X et Y. En effet si, en

général X et Y croissent simultanément, les produits seront positifs (corrélés

positivement), tandis que si Y décroît lorsque X croît, ces même produits seront négatifs (corrélés

négativement).

Soit un vecteur de composantes et un autre vecteur de

composantes , tous deux étant des variables aléatoires, le calcul de la covariance des

commentaires (0)
Aucun commentaire n'a été pas fait
Écrire ton premier commentaire
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Docsity n'est pas optimisée pour le navigateur que vous utilisez. Passez à Google Chrome, Firefox, Internet Explorer ou Safari 9+! Téléchargez Google Chrome