Travaux pratiques de mathématique 6 - 1° partie, Exercices de Mathématiques primaires
Eusebe_S
Eusebe_S15 May 2014

Travaux pratiques de mathématique 6 - 1° partie, Exercices de Mathématiques primaires

PDF (384.3 KB)
7 pages
151Numéro de visites
Description
Travaux pratiques de mathématique sur les statistiques - 1° partie. Les principaux thèmes abordés sont les suivants: Définitions, Données Gaussiennes, Médiane et quartiles.
20points
Points de téléchargement necessaire pour télécharger
ce document
Télécharger le document
Aperçu3 pages / 7
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document

Première L

Statistiques Cours

1. Définitions 1 2. Données Gaussiennes 4 3. Médiane et quartiles 5 4. Diagramme en boîte 8 5. Exercices corrigés 11

1. Définitions

Une série statistique est la donnée d’objets (items) auxquels sont associés des nombres (par exemple dans une élection le candidat A (item A) a obtenu 51210 voix, le candidat B a obtenu 43821 voix, etc.)

Les résultats sont souvent présentés sous forme de tableau.

Candidat A B C D

Nombre de voix obtenues

51 210 43 821 23 212 8 597

A partir de ce tableau on a l’effectif total : 51 210 + 43 821 + 23 212 + 8 597 = 126 840

Et on peut calculer les fréquences associées à chaque terme de la série : effectif item

fréquence effectif total  .

Ces fréquences peuvent être mises sous forme de pourcentage en multipliant par 100.

On rajoute souvent une colonne total qui permet de vérifier en partie les calculs.

Candidat A B C D Total

Nombre de voix obtenues

51 210 43 821 23 212 8 597 126840

Fréquence (en décimal)

0,404 0,345 0,183 0,68 1

Fréquence (en pourcentage)

40,4% 34,5% 18,3% 6,8% 100

On représente parfois les données dans un diagramme circulaire (communément appelé camembert…) où la mesure angulaire de chaque secteur correspond à la fréquence. C’est une simple question de proportionnalité.

Le cercle complet correspond à un angle au centre de 360°,

le secteur du candidat A aura pour mesure angulaire 360° x 0,404 = 145°

le secteur du candidat B aura pour mesure angulaire 360° x 0,345 = 124°

le secteur du candidat C aura pour mesure angulaire 360° x 0,183 = 66°

le secteur du candidat D aura pour mesure angulaire 360° x 0,68 = 25°

Remarque : pour représenter les données sur un diagramme semi-circulaire, il suffira de calculer les mesures des secteurs angulaires par rapport à 180°.

Plus fréquemment on représente les données dans un diagramme à barres ou en batonsou histogramme : dans un diagramme à barres, la hauteur de la barre représente l'effectif.

Exemple

Le tableau ci-dessous donne le nombre moyen de longs métrages réalisés par les dix plus gros producteurs mondiaux, entre 1990 et 1995 (source Unesco).

Brésil Chine Etats- Unis

France Inde Italie Japon Philippines Royaume- Uni

Thaïlande

86 154 420 141 838 96 251 456 78 194

Si les données d'une série sont discrètes, le mode est la ou les valeurs qui ont le plus grand effectif.

Si les données ont été réparties en classes, on parle alors plutôt de classe modale.

L'étendue d'une série est la différence entre la plus grande valeur et la plus petite.

Exemple

Données discrètes : 9, 11, 8, 10, 13, 12, 10, 11, 10.

Faisons le tableau des effectifs :

valeur 8 9 10 11 12 13

effectif 1 1 3 2 1 1

Le mode est la valeur qui a le plus gros effectif, c'est à dire 10. L’étendue est 13 − 8 = 5.

Ici, vu le petit nombre de données, faire un tableau des effectifs est un peu artificiel. Par contre, dès que l'on travaille sur un nombre important de données, il devient vite très utile pour mettre en évidence le mode et l'étendue de la série.

Données réparties par classes :

classe [0 ; 5[ [5 ; 10[ [10 ; 15[ [15 ; 20]

effectif 0 5 14 2

La classe modale est la classe qui a le plus gros effectif, c'est à dire la classe [10 ; 15[.

L'étendue de cette série est 20 – 5 = 15. Par simplification, on dira que l'étendue est 15 mais c'est un abus de langage. En effet, dans le tableau des données ci dessus, rien ne permet d'affirmer que les valeurs extrêmes sont 5 et 20.

Dans une série statistique lorsqu’on a des valeurs numériques pour les items (ou qu’on leur attribue des valeurs numériques), on peut calculer une moyenne (coefficientée, comme au bac) :

Exemple

Par exemple on a relevé le prix de vente d'un CD et le nombre de CD vendus chez différents fournisseurs.

Les résultats sont donnés dans le tableau suivant :

Prix de vente en euros, P 15 16 17 18 19

Nombre de CD vendus 97 34 43 20 6

Le prix de vente moyen de ce CD est alors 15 97 16 34 17 43 18 20 19 6

16,02 97 34 43 20 6

P         

     

(la

moyenne se note avec une barre au-dessus). Dans ce calcul, les notes (du bac) sont représentées par les prix, les coefficients par les nombres de CD.

Les écarts de la série par rapport à la moyenne sont mesurés à l’aide de deux nombres :

* la variance : on élève au carré la valeur des items et on refait une moyenne de ces carrés :

P 15 16 17 18 19

P2 225 256 289 324 361

effectifs 97 34 43 20 6

2 225 97 256 34 289 43 324 20 361 6 258,01 97 34 43 20 6

P         

     

,

puis on soustrait le carré de la moyenne 2 256P  : 2 2 1,37P P  , c’est la variance : var( ) 1,37P  .

* Enfin on calcule l’écart-type ( ) var( ) 1,17P P   .

L'écart-type permet d'avoir une idée de la façon dont les valeurs de la série s'écartent par rapport à la moyenne. C'est une mesure de dispersion.

Un écart-type faible correspond à une série concentrée autour de la moyenne.

Les calculs de moyenne, de variance et d'écart-type sont, pour des séries prenant un grand nombre de valeurs, des calculs compliqués. Les calculatrices utilisées en mode statistique et les ordinateurs rendent alors de grands services pour ces calculs.

Exercice 1

A un test de mathématique, noté sur 10 points, les élèves de 2 classes ont obtenu les notes suivantes :

Classe A : 4 5 3 4 5 4 3 4 6 7 7 6 3 6 4 5 8 7 6 5 4 9 3 5 6 4 1 5 4 7 5

Classe B : 2 4 3 2 5 6 5 1 3 8 3 6 8 7 2 3 7 10 5 7 7 2 10 0 1 0 4 7 8 9 10

1. Compléter les tableaux suivants :

Pour la classe A :

Note : X 0 1 2 3 4 5 6 7 8 9 10 Total

Effectif : n

Fréquences

Pour la classe B :

Note : Y 0 1 2 3 4 5 6 7 8 9 10 Total

Effectif : m

Fréquences

2. Représenter pour chaque classe la série de notes par un diagramme en bâtons.

3. Calculer la moyenne de chacune des classes.

4. Compléter pour chacune des classes le tableau suivant :

Pour la classe A :

Note : X 0 1 2 3 4 5 6 7 8 9 10 Total

Effectif : n

X²n

Pour la classe B :

Note : Y 0 1 2 3 4 5 6 7 8 9 10 Total

Effectif : m

Y²m

Calculer la variance et l'écart-type de chacune des séries.

5. A partir des résultats précédents, faire une comparaison des deux classes.

6. Pour chacune des classes, donner la note du 16ème élève.

2. Données Gaussiennes

(du nom de Karl Friedrich Gauss, grand mathématicien allemand du 19ème siècle)

Le recueil d'un grand nombre de données dans certains domaines (données industrielles, données biologiques …) conduit souvent à des diagrammes (diagrammes à barres, histogrammes) ayant sensiblement la même forme dite « en cloche ».

Exemples : sur chacun des diagrammes a été superposé la courbe dite "courbe en cloche"

Fréquence des battements cardiaques Circonférence du biceps

Dans un tel cas, les données recueillies sont qualifiées de données gaussiennes.

Si on calcule pour de telles données la moyenne  (mu) et l'écart-type  (sigma), on peut noter que :

     68% 95%

- la série est à peu près symétrique autour de la moyenne  ,

- environ 68 % des données se trouvent dans l'intervalle  ;     ; cet intervalle est appelé plage de normalité pour le niveau de confiance 0,68 ;

- environ 95% des données se trouvent dans l'intervalle  2 ; 2     ; cet intervalle est appelé plage de normalité pour le niveau de confiance 0,95 ;

- environ 99% des données se trouvent dans l'intervalle  3 ; 3     ; cet intervalle est appelé plage de normalité pour le niveau de confiance 0,99.

les observations ci-dessus n'ont aucun sens pour les séries qui traduisent des phénomènes non gaussiens ainsi que pour les séries gaussiennes où l'échantillon est trop petit (effectif < 30).

Exemple

Les études statistiques portant sur un grand nombre d'enfants ont conduit à des données gaussiennes.

Ces études ont permis d'établir des courbes de croissance (taille, poids, périmètre cranien …) que l'on trouve sur le « Carnet de santé » remis aux parents à la naissance d'un enfant.

Ces courbes sont construites à partir de la plage de normalité  2 ; 2     .

Elles permettent aux parents et aux médecins de surveiller la croissance d'un enfant.

Extraits d'un Carnet de santé

3. Médiane et quartiles

On considère une série dont les valeurs sont ordonnées (rangées dans l'ordre croissant). Si la série comporte un nombre pair 2n de termes, la médiane de cette série est la demi-somme de la valeur du terme de rang n et de la valeur du terme de rang n + 1.

Si la série comporte un nombre impair 2n + 1 de termes, la médiane de cette série est la valeur du terme de rang n + 1 (c'est-à-dire le terme partageant la série en deux groupes de même effectif). C’est le 50/50…

Exemple 1

La série : 101 101 105 105107 108 108 110 a un nombre pair (8) de termes.

La médiane de cette série est la demi-somme du 4ème et du 5ème terme, c'est-à-dire 106.

La série : 87 88 89 89 90 92 92 93 97 99 99 a un nombre impair (11) de termes.

La médiane de cette série est la valeur du 6ème terme, c'est-à-dire 92.

On appelle premier quartile d'une série la plus petite valeur q des termes de la série pour laquelle au moins un quart (25%) des données sont inférieures ou égales à q.

Le deuxième quartile est la médiane.

On appelle troisième quartile d'une série la plus petite valeur q’ des termes de la série pour laquelle au moins trois quarts (75%) des données sont inférieures ou égales à q’.

On appelle intervalle interquartile l'intervalle [q ; q’].

On appelle écart interquartile l'amplitude de l'intervalle [q ; q’], c'est-à-dire le nombre q’ − q.

Exemple 2

La recherche des quartiles sera plus facile si les termes de la suite sont ordonnés.

La série 11 , 12 , 12 , 13 , 15 , 16 , 16 , 17 , 17 , 18 , 19 , 20 , 22 , 23 a 14 termes. Un quart (25%) des données correspond à : 14  0,25 = 3,5.

Le premier quartile est alors, par définition, la plus petite valeur q pour laquelle les valeurs de 4 termes de la série sont inférieurs ou égales à q. Le premier quartile est donc la valeur du 4ème terme de la série c'est-à-dire 13.

Trois quarts (75%) des données correspondent à : 14  0,75 = 10,5.

Le troisième quartile est alors, par définition, la plus petite valeur q’ pour laquelle les valeurs de 11 termes de la série sont inférieurs ou égales à q’. Le troisième quartile est donc la valeur du 11ème terme de la série c'est-à-dire 19.

L'intervalle interquartile est [13 ; 19] ; l'écart interquartile est 19 − 13 = 6.

On appelle premier décile d'une série la plus petite valeur d des termes de la série pour laquelle au moins un dixième (10%) des données sont inférieures ou égales à d.

On appelle neuvième décile d'une série la plus petite valeur d' des termes de la série pour laquelle au moins neuf dixièmes (90%) des données sont inférieures ou égales à d'.

On appelle intervalle interdécile l'intervalle [d ; d'].

On appelle écart interdécile l'amplitude de l'intervalle [d ; d'], c'est-à-dire le nombre d' − d.

Exemple 3

La recherche des quartiles sera plus facile si les termes de la suite sont ordonnés.

La série 4, 5, 5, 5, 6, 6, 7, 8, 8, 9, 9, 9, 9, 10, 10, 11, 11, 11, 12, 13, 13, 13, 14, 14, 15, 15, 17 a 27 termes. Un dixième (10%) des données correspond à : 27  0,10 = 2,7.

Le premier décile est alors, par définition, la plus petite valeur d pour laquelle les valeurs de 3 termes de la série sont inférieurs ou égales à d. Le premier décile est donc la valeur du 3ème terme de la série c'est- à-dire 5.

Neuf dixièmes (90%) des données correspondent à : 27  0,9 = 24,3. Le neuvième décile est alors, par définition, la plus petite valeur d' pour laquelle les valeurs de 25 termes de la série sont inférieurs ou égales à d'. Le neuvième décile est donc la valeur du 25ème terme c'est-à-dire 15.

L'intervalle interdécile est [5 ; 15]. L'écart interdécile est 15 − 5 = 10.

Exercice 2

Le graphique ci-dessous représente la série des tailles en cm pour des enfants de 68 mois.

(Source : Pr. M. Tauber, CHU Toulouse)

1. En utilisant ce graphique, compléter le tableau suivant.

Taille 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111

Effectif

Effectif cumulé

Taille 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126

Effectif

Effectif cumulé

2. Vérifier que l'effectif total de la série est 259.

3. Déterminer la médiane de cette série.

4. Déterminer le 1er quartile et le 3ème quartile de cette série. Donner l'intervalle interquartile et l'écart interquartile.

5. Déterminer le 1er décile et le 9ème décile de cette série. Donner l'intervalle interdécile et l'écart interdécile.

6. Les données semblent presque gaussiennes : calculer moyenne et écart-type de cette série. La plage de normalité est-elle respectée ?

Exercice 3

Lors d'une étude sur 3023 personnes, on a noté le nombre de personnes infectées ou non par le VIH (sida). On a d'autre part classé ces mêmes personnes en fonction du nombre total de leurs partenaires. Les résultats sont donnés dans le tableau suivant :

Nombre de partenaires 0 1 2 3 4 5 6 7 8 9 10 11

commentaires (0)
Aucun commentaire n'a été pas fait
Écrire ton premier commentaire
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Docsity n'est pas optimisée pour le navigateur que vous utilisez. Passez à Google Chrome, Firefox, Internet Explorer ou Safari 9+! Téléchargez Google Chrome