Travaux pratiques - Probabilités et Statistiques - 3° partie, Exercices de Calcul avancé
Eusebe_S
Eusebe_S20 May 2014

Travaux pratiques - Probabilités et Statistiques - 3° partie, Exercices de Calcul avancé

PDF (731.7 KB)
12 pages
260Numéro de visites
Description
Travaux pratiques de sciences mathématique sur les probabilités et les statistiques - 3° partie. Les principaux thèmes abordés sont les suivants: Etude théorique, Fluctuations d'une fréquence, Simulation de 100 expérienc...
20points
Points de téléchargement necessaire pour télécharger
ce document
Télécharger le document
Aperçu3 pages / 12
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document

d. Recopier la formule de G1 en H1 et I1. Qu’a-t-on simulé dans les cellules F1 à I1 ?

e. Recopier la ligne 1 jusqu’à la ligne 2000.

f. Dans les cellules A2002 à A2007 mettre les titres suivants :

Garçons

Filles

Total

Prop Garçons (pour proportion de garçons)

Prop Filles (pour proportion de filles)

Enf / famille (pour nombre moyen d’enfants par famille)

g. Dans la cellule B2002, mettre la formule : =NB.SI(F1:I2000;’’G’’)

Dans la cellule B2003, mettre la formule donnant le nombre total de filles dans les 2000 familles.

Dans la cellule B2004, mettre la formule donnant le nombre total d’enfants

Dans la cellule B2005, mettre la formule donnant la proportion de garçons

Dans la cellule B2006, mettre la formule donnant la proportion de filles dans la ville.

Observer les résultats en faisant plusieurs tests avec la touche « F9 ».

Les proportions de garçons et de filles semblent-elles égales ?

Dans la cellule B2007, mettre la formule donnant le nombre moyen d’enfants par couple.

Etude théorique

1. a. 2000 couples ont un premier enfant. A quel nombre théorique de naissances de filles peut-on s’attendre pour ce premier enfant ?

b. A quel nombre de couples avec un enfant peut-on s’attendre dans notre ville ?

c. 1000 couples ayant déjà un garçon ont un deuxième enfant. A quel nombre théorique de naissances de filles peut- on s’attendre pour ce 2ème enfant ?

d. quel nombre de couples ayant deux enfants peut-on s’attendre dans notre ville ?

2.a. Compléter le schéma suivant, indiquant la répartition théorique des naissances pour les 2000 couples de notre ville :

2000

Couples

1000

Filles

1er

enfant

1000

Garçons

Filles

2ème

enfant

Garçons

Filles

3ème

enfant

Garçons

Filles

4ème

enfant

Garçons

b. Pour 2000 couples, donner la répartition théorique attendue :

Enfants F GF GGF GGGF GGGG

Effectifs

c. Déterminer :

- le nombre théorique de filles pour les 2000 couples ;

- le nombre théorique de garçons pour les 2000 couples ;

- le nombre théorique moyen d’enfants pour les 2000 couples.

Comparer la simulation faite au 2. à ces résultats théoriques.

4. Refaire la simulation et l’étude théorique en supposant maintenant que les couples de la ville ont un autre enfant tant qu’ils n’ont pas une fille ou cinq garçons.

(Pour la simulation, dans le menu « Edition ; Déplacer ou copier une feuille », on peut cocher « Créer une copie » puis modifier la copie obtenue.)

1.6.34. Probabilité d’avoir le même anniversaire

1. Lister toutes les dates anniversaires des élèves de la classe. Y’en a-t-il deux identiques ? Pensez-vous que cela soit fréquent ?

2. Comme c’est difficile à calculer avec 30 élèves (ou plus) et 365 jours on va commencer avec plus simple : 4 élèves et 12 mois.

a. Relevez les effectifs des mois de naissance dans votre classe.

mois 1 2 3 4 5 6 7 8 9 10 11 12

effectif

b. Prenez deux personnes au hasard, quelle est la probabilité qu’elles soient né le même mois ? D’abord avec le tableau précédent puis en général.

c. Quelle est la probabilité que 3 personnes distinctes soient néees le même mois ? Quelle est la probabilité qu’elles ne soient pas nées le même mois ? Mêmes questions avec 4.

4. Quelle est la probabilité que deux élèves ne soient pas nés le même jour dans une classe de 4 élèves ? Soient nés le même jour ?

5. Quelle est la probabilité que deux élèves ne soient pas nés le même jour dans une classe de 30 élèves ? Soient nés le même jour ?

6. Voici deux propositions d’algorithme pour modéliser cette situation.

a. Expliquez les significations de chaque ligne puis tester de manière à répondre à la question précédente.

Algorithme 1 Algorithme 2

Variables : n, i entiers ; q réel.

Entrée : Saisir n.

Initialisation : q prend la valeur 1.

Traitement : Pour i variant de 1 à n−1,

Variables : i entier ; p, q réel.

Entrée : Saisir p.

Initialisation : q prend la valeur 1, i la valeur 0.

Traitement : Tant que q > 1−p,

q prend la valeur 365

365

i q

  .

Sortie : Afficher 1−q.

q prend la valeur 365

365

i q

  ,

i prend la vameur i+1.

Sortie : Afficher i.

b. Combien faut-il d’élèves dans une classe pour être sûr à 99% que deux élèves au moins ont même date anniversaire ?

1.6.35. Dans le grenier

En fouillant dans un vieux cahier d’écolier datant de 2018 j’ai retrouvé cet algorithme… Aussitôt, me précipitant sur mon Apple Iclad-5G++ je rentre le programme par synthèse vocale et je vois se dessiner les positions des points de coordonnées (i, x).

Algorithme 1

Variables : x, n, i, entiers ; q réel.

Entrée : Saisir n.

Initialisation : x et q prennent la valeur 0.

Traitement : Pour i variant de 1 à n,

Si alea(0…1)<0,5 alors x prend la valeur 1x  , sinon x prend la

valeur 1x  . Fin si.

Si x=0 alors q prend la valeur q+1. Fin si.

Fin pour.

Sortie : Afficher x. Afficher 1−q/n.

1. Expliquer ce que fait ce programme et à quoi correspondent les variables x, n et q.

2. Compléter le tableau suivant :

n 100 1 000 10 000 100 000

1−q/n

Quelle conclusion pouvez-vous tirer de ces résultats ?

3. a. Modifier l’algorithme pour garder une trace du nombre de fois où x prend une valeur donnée entre −n et n. b. Relever vos données et faire un graphique pour n=50 : histogramme avec x en abscisse et n en ordonnée. 4. Un trader se dit que cet algorithme pourrait lui servir de modèle pour le cours d’une action en Bourse. Quelle est alors la signification pratique des diverses variables pour le trader ? 5. Pour aller plus loin : que se passe-t-il si on passe dans le plan puis dans des espaces de dimension supérieure ? On pourra consulter Wikipedia, article Marche aléatoire.

1.7. Fluctuations d'une fréquence

1.7.36. Taux anormal de cas de leucémie

Une petite ville des États-Unis a connu 9 cas de leucémie chez de jeunes garçons en l’espace de 10 années. Doit-on, comme l’ont alors affirmé les autorités, en accuser le hasard ?

Cet exemple montre les enjeux de la méthode statistique.

Woburn est une petite ville industrielle du Massachusetts, au Nord-Est des États-Unis. Du milieu à la fin des années 1970, la communauté locale s’émeut d’un grand nombre de leucémies infantiles survenant en particulier chez les garçons dans certains quartiers de la ville. Les familles se lancent alors dans l’exploration des causes et constatent la présence de décharges et de friches industrielles ainsi que l’existence de polluants. Dans un premier temps, les experts gouvernementaux concluent qu’il n’y a rien d’étrange. Mais les familles s’obstinent et saisissent leurs propres experts. Une étude statistique montre qu’il se passe sans doute quelque chose « d’étrange ».

Le tableau suivant résume les données statistiques concernant les garçons de moins de 15 ans, pour la période 1969- 1979 (Source : Massachusetts Department of Public Health).

Population des garçons de moins de 15 ans à Woburn selon le recensement de 1970 : n

Nombre de cas de leucémie infantile observés chez les garçons à Woburn

entre 1969 et 1979

Fréquence des leucémies aux Etats-Unis (garçons) : p

5 969 9 0,000 52

La question statistique qui se pose est de savoir si le hasard seul peut raisonnablement expliquer le nombre de leucémies observées chez les jeunes garçons de Woburn, considérés comme résultant d’un échantillon prélevé dans la population américaine.

La population des États-Unis étant très grande par rapport à celle de Woburn, on peut considérer que l’échantillon résulte d’un tirage avec remise et simuler des tirages de taille n avec le tableur.

Il est aisé de simuler sur le tableur 100 échantillons de taille n = 5 969 prélevés au hasard dans une population de garçons où la probabilité de leucémie est p = 0,00052 (cas « normal ») en utilisant l’instruction :

=ENT(ALEA()+0,00052).

(l’instruction =ALEA() génère un nombre aléatoire dans l’intervalle [0, 1[.)

L’instruction =ALEA()+0,00052 génère donc un nombre aléatoire dans l’intervalle [0,000 52 ; 1,000 52[. Ainsi, =ENT(ALEA()+0,000 52), où ENT désigne la partie entière, vaut la plupart du temps 0 (non malade) et vaut 1 (malade) avec la probabilité 0,000 52.

Sur chaque échantillon, en faisant la somme, on obtient le nombre de cas observés, sous l’hypothèse d’une probabilité « normale ».

Il est possible de représenter sur un graphique les 100 résultats observés sur les échantillons ainsi simulés.

Les simulations montrent que le nombre de cas observés à Woburn (9 cas) est extrêmement rare (de l’ordre de 1 % des simulations sur un grand nombre d’essais), sous l’hypothèse d’une probabilité « normale ».

Il est donc raisonnable de penser que le niveau très « significativement » élevé des leucémies infantiles observées chez les garçons de Woburn n’est pas dû au hasard.

Ce taux anormalement élevé de leucémies est officiellement confirmé par le Département de Santé Publique du Massachusetts en avril 1980. Les soupçons se portent alors sur la qualité de l’eau de la nappe phréatique qui, par des forages, alimente la ville. On découvre ainsi le syndrome du trichloréthylène.

1.7.37. Défauts de peinture

Dans une usine automobile, on contrôle les défauts de peinture de type « grains ponctuels sur le capot ».

Lorsque le processus est sous contrôle, on a 20 % de ce type de défauts.

Lors du contrôle aléatoire de 50 véhicules, on observe 26 % de défauts (13 sur 50). Faut-il s’inquiéter ?

Éléments de réponse

En supposant que la situation est sous contrôle, c’est-à-dire que la proportion de capots présentant ce défaut (minime) de peinture dans la production totale est p = 0,20 , un échantillon aléatoire de 50 capots présentera une

proportion de défauts comprise, dans plus de 95 % des cas, entre 1

0,20 50

 , soit environ 6 % , et 1

0,20 50

 , soit

environ 34 %. Il n’y a donc pas lieu de considérer une observation de 26 % de défauts sur un échantillon de taille 50 comme « anormale ».

Ce type de contrôle de qualité a effectivement été pratiqué par un constructeur d’automobiles français. Il s’agissait de détecter une amélioration significative du procédé de peinture grâce à cet indicateur de défaut, quasiment invisible pour le client.

1.7.38. Naissances à pile ou face

On propose ici une séquence en trois étapes.

ÉTAPE 1 : énoncé

Les données statistiques suivantes ont été relevées : en 2000, dans le village de Xicun, en Chine, il est né 20 enfants, parmi lesquels 16 garçons ; dans la réserve indienne d’Aamjiwnaag, située au Canada à proximité d’industries chimiques, il est né entre 1999 et 2003, 132 enfants dont 46 garçons.

Ces observations sont-elles le fruit du hasard ?

Éléments de réponse

Un temps est laissé aux élèves pour se « débrouiller » avec ces chiffres puis saisir les pistes issues d’une « tempête de cerveaux ». Il faut s’attendre à des calculs de statistique descriptive (pourcentage, fréquence), à une comparaison avec une proportion de 50 %, et voir émerger la problématique du hasard.

La proportion de garçons à la naissance est habituellement estimée à 50 %. En réalité elle est, de façon étonnamment stable, de 51,2 %, mais on peut ici prendre sans inconvénient le modèle « d’une chance sur deux » pour analyser les données proposées.

Une première idée, pour se situer par rapport à un a priori de 50 %, consiste à calculer le pourcentage de garçons (ou de filles) dans chaque cas :

Xicun Aamjiwnaag

Pourcentage de garçons 80 % 34,8 %

Les valeurs trouvées sont loin du résultat « attendu ». Mais peut-être est-ce le hasard ? Pour préciser la réponse à la question posée, il faut étudier les propriétés du hasard en supposant, pour simplifier, qu’à la naissance on a une chance sur deux d’avoir une fille ou un garçon.

ÉTAPE 2 : expérimentation avec des pièces de monnaie

Lancer 20 fois une pièce de monnaie et noter le nombre de « pile ».

Recommencer l’expérience une dizaine de fois ou regrouper les résultats obtenus dans la classe.

Comment peut-on utiliser ces expériences pour commenter les statistiques de Xicun ?

Pourquoi l’expérimentation avec des pièces ne permet-elle pas de répondre complètement au problème posé ?

Éléments de réponse

On peut décider que « pile » correspond à « garçon » et « face » à « fille » (ou le contraire). On constate que pratiquement aucune expérience ne donne 16 piles (ou plus), mais que cela peut se produire.

Le résultat chinois est très étonnant et laisse plutôt penser que « la pièce est truquée ».

Remarque pour le professeur

Le nombre de « pile » peut être considéré comme correspondant à la réalisation d’une variable aléatoire de loi binomiale de paramètres n = 20 et p = 0,5. La probabilité, sur 20 lancers, d’avoir un nombre de « pile » inférieur ou égal à 15 est environ 0,994.

Ce résultat peut s’obtenir sur un tableur par l’instruction : =LOI.BINOMIALE(15;20;0,5;VRAI). C’est-à-dire que l’observation d’un résultat comparable à celui du village chinois a 0,6 % de chances de se produire (quand on suppose le hasard « une chance sur deux » à l’œuvre).

Pour Aamjiwnaag, il faudrait lancer la pièce un trop grand nombre de fois.

Faire constater qu’un plus grand nombre d’expériences permettrait de s’assurer des observations faites pour 20 lancers, permet alors de proposer un TP de simulation sur tableur-grapheur (ou faire une vidéo projection devant la classe ou encore distribuer le fichier sur des ordinateurs).

Cette première expérimentation informatique permet d’étudier ensuite des échantillons de 132 lancers en utilisant le même protocole de simulation.

ÉTAPE 3 : travaux pratiques sur tableur

Un énoncé possible

Simulation d’un lancer de pile ou face.

a. Entrer en cellule A1 la formule =ALEA() (avec des parenthèses vides) puis appuyer de nombreuses fois sur la touche F9.

Compléter la phrase : « La formule =ALEA() affiche un nombre décimal tiré au hasard entre .......... et .......... ».

b. Compléter la phrase : « La formule =ALEA()+0,5 affiche un nombre décimal tiré au hasard entre .......... et .......... ».

Vérifiez votre réponse en entrant la formule =ALEA()+0,5 en cellule A1.

c. En complétant la phrase suivante, trouver une règle permettant de simuler un tirage à pile ou face à l’aide de la fonction ALEA :

« Si en utilisant la formule =ALEA()+0,5 le tableur affiche un nombre de l’intervalle [0 ,5 ; ........[, on considère que la pièce est tombée sur face, si au contraire le tableur affiche un nombre de l’intervalle [........ , ........[, on considère que l’on a obtenu pile. ».

d. On souhaite améliorer la simulation en utilisant la fonction ENT qui affiche la partie devant la virgule d’un nombre positif (partie entière).

Entrer en A1 la formule =ENT(ALEA()+0,5). Faire plusieurs fois F9.

Quels résultats obtient-on ? Quelle est leur signification dans le jeu de pile ou face ?

Simulation de 20 lancers de pile ou face.

Recopier le contenu de la cellule A1 jusqu’en A20 (pointeur de la souris en forme de croix noire).

En A21 entrer la formule =SOMME(A1:A20)/20 . Que calcule cette formule ?

Simulation de 100 expériences.

Sélectionner les cellules de A1 à A21 puis recopier vers la droite jusqu’en colonne CV.

Sélectionner la ligne 21 (en cliquant sur la tête de ligne) puis cliquer sur l’icône de l’assistant graphique et demander un « nuage de points ».

Faire de nombreuses fois F9.

D’après vos observations, sur 20 lancers, une fréquence de « pile » égale ou supérieure à 0,8 :

 ne se produit jamais ;

 se produit environ 20 fois sur 100 ;

 se produit environ 10 fois sur 100 ;

 se produit environ 1 fois sur 100.

Que pouvez-vous déduire de ces simulations à propos des naissances à Xicun en 2000 ?

Cas de 132 naissances.

a. Sur une autre feuille de calcul, simuler 100 expériences de 132 lancers de pile ou face et représenter les fréquences de « pile » comme précédemment.

D’après le graphique, donner un intervalle autour de 0,5 dans lequel se trouve la « grande majorité » des points.

b. Que pouvez-vous déduire de ces simulations à propos des naissances à Aamjiwnaag ?

Éléments de réponse

1. a. « La formule =ALEA() affiche un nombre décimal tiré au hasard entre 0 et 1 ».

b. « La formule =ALEA()+0.5 affiche un nombre décimal tiré au hasard entre 0,5 et 1,5 ».

c. « Si en utilisant la formule =ALEA()+0.5 le tableur affiche un nombre de l’intervalle [0,5 ; 1[ on considère que la pièce est tombée sur face, si au contraire le tableur affiche un nombre de l’intervalle [1 ; 1,5[ on considère que l’on a obtenu pile. »

d. On obtient comme résultats 0 ou 1. Le résultat 0 correspond à face et 1 correspond à pile.

2. La formule calcule la fréquence de « pile » sur les 20 lancers.

3. D’après les observations, sur 20 lancers, une fréquence de « pile » égale ou supérieur à 0,8

 se produit environ 1 fois sur 100.

4. On peut en déduire que les statistiques de Xicun sont très étonnantes. Il est peu probable qu’elles s’expliquent par le seul hasard. C’est une « alerte » qui doit inciter à rechercher des causes extérieures.

5. a. La « grande majorité » des points sont dans l’intervalle [0,4 ; 0,6].

b. Le résultat 0,348 observé à Aamjiwnaag ne se trouve pas dans l’intervalle [0,4 ; 0,6].

Il est peu probable, qu’il s’explique par le seul hasard. C’est une « alerte » qui doit inciter à rechercher des causes extérieures.

Commentaires

Il est important de préciser que les « réponses » apportées par l’activité précédente ne sont que des réponses « statistiques ». Les résultats observés sur les naissances à Xicun et Aamjiwnaag sont « bizarres » (et préoccupants). Rien de plus ne peut être dit quant aux causes, mais ces résultats doivent inciter à enquêter. C’est une obligation morale, car on a établi une « preuve statistique », rationnelle, qu’il se passe sans doute quelque chose d’inhabituel.

Pour le cas de Xicun, la cause probable est l’acquisition dans ce village (en 1999) d’une machine à ultra-sons bon marché, permettant aux médecins de déterminer le sexe du fœtus.

(Source : Washington Post du 29 mai 2001.)

Dans le cas d’Aamjiwnaag, une enquête sanitaire est menée. En effet, depuis Seveso, le rôle de certains polluants sur les déséquilibres du sex-ratio est connu.

(Sources : Science et Vie février 2006 – Environmenthal Health Perspectives octobre 2005, article en anglais en ligne.)

1.7.39. Segment aléatoire

Cette activité illustre l’approche « fréquentiste » d’une probabilité, c’est-à-dire l’observation de la « stabilisation relative des fréquences quand n augmente » vers la probabilité de l’événement.

Deux points A et B sont pris « au hasard » sur un segment de longueur 1.

Ceci peut être réalisé grâce à la fonction « random » de la calculatrice qui donne « au hasard » un nombre compris entre 0 et 1, qui sera l’abscisse du point.

Quelle est la probabilité de l’événement : « la longueur AB est supérieure à 0,5 » ?

Éléments de réponse

– Expérimentation avec une calculatrice :

La différence rand – rand correspond, au signe près, à la distance AB.

Il suffit d’appuyer 10 fois sur Enter pour simuler 10 expériences.

Les résultats de la classe peuvent ensuite être mutualisés.

– Visualisation sur un tableur :

La simulation de l’expérience est simple à mettre en place sur un tableur : sur l’image d’écran ci-dessous, est entrée en B5 et en C5 la formule =ALEA(). En D5 la formule =ABS(B5−C5) fournit la distance AB.

En entrant en E5 la formule =SI(D5>0,5;1;0) la valeur 1 est obtenue lorsque l’événement « AB > 0,5 » est réalisé et la valeur 0 est obtenue lorsqu’il ne l’est pas.

Par recopie, l’expérience simulée peut être répétée et constituer un échantillon (de taille par exemple 500) des résultats de cette expérience. En faisant F9, on multiplie les observations.

La fréquence l’événement « AB > 0,5 » se stabilise autour de 25 %.

Commentaire

L’avantage de cette situation est que la probabilité de l’événement considéré, qui est égale à 0,25, n’est pas « intuitive ». Il est d’ailleurs intéressant de demander aux élèves une évaluation « a priori » de la réponse, avant d’expérimenter

1.7.40. Contester un jugement

(Source : Prove it with figures – H. Zeisel et D Kaye.)

En Novembre 1976 dans un comté du sud du Texas, Rodrigo Partida était condamné à huit ans de prison. Il attaqua ce jugement au motif que la désignation des jurés de ce comté était discriminante à l’égard des Américains d’origine mexicaine. Alors que 79,1% de la population de ce comté était d’origine mexicaine, sur les 870 personnes convoqués pour être jurés lors d’une certaine période de référence, il n’y eut que 339 personnes d’origine mexicaine.

1. Quelle est la fréquence des jurés d’origine mexicaine observée dans ce comté du Texas ?

Fréquence relative aux sept premières expériences

2. La simulation sur un tableur du prélèvement d’échantillons aléatoires de taille n = 870 dans une population où la fréquence des habitants d’origine mexicaine est p = 0,791. Les fréquences des habitants d’origine mexicaine observées sur 100 échantillons simulés sont représentées ci-dessous.

a. Calculer les bornes de l’intervalle [ 1

p n

 ; 1

p n

 ]. (Arrondir à 10 – 2).

b. Quel est le pourcentage des simulations fournissant une fréquence en dehors de l’intervalle précédent ?

3. Sur les simulations, est-il arrivé au hasard de fournir une fréquence d’habitants d’origine mexicaine comparable à celle des jurés d’origine mexicaine observée dans ce comté du Texas ?

4. Comment expliquez-vous cette situation ?

Éléments de réponse

1. La fréquence observée des jurés d’origine mexicaine est 339

870 f  soit environ 0,39.

2. a. On a [ 1

0,791 870

 ; 1

0,791 870

 ] c’est-à-dire environ [0,76 ; 0,82].

b. Sur le graphique des 100 simulations, 4 points sont en dehors de l’intervalle précédent, soit 4 % des cas.

3. Non. La fréquence observée 0,39 est très loin des valeurs obtenues sur les simulations.

4. La constitution des jurys n’est sans doute pas totalement aléatoire.

Commentaires

Les données étudiées constituent une « preuve statistique » du fait que la constitution de ces jurys n’est pas totalement aléatoire, c’est-à-dire que ceux ci ne sont pas « représentatifs » de la population, du point de vue du caractère hispanique. Les calculs précédents montrent qu’il n’est pas possible de considérer que les jurys résultent d’un tirage au sort où chaque élément de la population a les mêmes chances d’être choisi. Mais c’est tout ce que l’on peut dire et, en particulier, il n’est pas possible de se prononcer sur les causes et porter des accusations de discrimination raciale. L’étude statistique précédente doit inciter à enquêter sur les conditions de constitution des jurys. Le constat pourra alors être fait que pour être juré on doit maîtriser la langue anglaise (écrite et parlée), ce qui n’est pas le cas de la majorité de la population d’origine hispanique, que pendant les 11 années correspondant à l’étude, la proportion des hispaniques dans la population a évolué, et que la proportion d’hispaniques dans les jurys a également évolué au cours de ces 11 années.

1.7.41. Pile ou face et contrôle de qualité

Lors de certains contrôles de qualité en cours de fabrication dans l’industrie (diamètre d’une pièce par exemple), des cartes de contrôle reposent sur la procédure suivante : la moyenne de la cote surveillée (le diamètre de la pièce par exemple) est calculée sur des échantillons aléatoires prélevés régulièrement en fin de fabrication. Ces moyennes sont reportées sur une carte de contrôle (comme ci-dessous). Si une série de sept points consécutifs se trouve du

même côté de la « moyenne attendue » (la norme visée), le processus doit être surveillé pour déceler une éventuelle « dérive » dans le processus de fabrication.L’explication du choix du nombre 7 se trouve dans la résolution du problème de probabilités suivant : une pièce de monnaie équilibrée est lancée 7 fois, quelle est la probabilité de l’événement A : « la pièce est tombée 7 fois sur pile » ?

1. Estimer la valeur de cette probabilité à l’aide de simulations sur un tableur.

2. Lancer 3 fois de suite une pièce de monnaie équilibrée.

a. Dessiner un arbre figurant tous les résultats possibles de l’expérience.

b. À l’aide de l’arbre précédent, calculer la probabilité de l’événement « la pièce est tombée trois fois sur pile ».

3. Par analogie avec le cas de 3 lancers, donner la probabilité de l’événement A et comparer avec l’estimation de la question 1.

Éléments de réponse

1. Une feuille de calcul telle que celle montrée ci-après peut être constituée. Selon les circonstances, cette feuille de calcul peut-être totalement ou partiellement fabriquée par les élèves, en salle informatique ou en utilisant un vidéo projecteur.

Pour constituer cette feuille de calcul, 7 lancers à pile ou face sont simulés en introduisant en cellule B3 la formule =ENT(ALEA()+0,5) qui a été recopiée vers la droite.

La réalisation ou non de l’événement A est codée par 1 ou 0 avec l’introduction en cellule J3 de la formule =SI(SOMME(B3:H3)=7;1;0) .

Le calcul des fréquences cumulées de l’événement A est obtenu en introduisant en K3 la formule =J3/A3 puis en K4 la formule =SOMME(J$3:J4)/A4 .

Il faut sélectionner la ligne 4 puis recopier vers le bas, par exemple jusqu’à la ligne 10 002 pour obtenir la fréquence de l’événement A sur 10 000 expériences.

La touche F9 permet de répéter les 10 000 expériences et de faire constater que la probabilité de l’événement A est un peu inférieure à 1 %.

2. b. La probabilité de l’événement PPP est

3 1

0,125 2

   

  .

3. On a   7

1 P A

2

      

, soit environ 0,008 c’est-à-dire 0,8 %.

Ce résultat est conforme aux observations des simulations.

1.7.42. Premier tour des présidentielles 2002

Voici un extrait d’article, publié dans le journal « Le Monde » par le statisticien Michel Lejeune, après le premier tour de l’élection présidentielle de 2002.

« Pour les rares scientifiques qui savent comment sont produites les estimations, il était clair que l'écart des intentions de vote entre les candidats Le Pen et Jospin rendait tout à fait plausible le scénario qui s'est réalisé. En effet, certains des derniers sondages indiquaient 18 % pour Jospin et 14 % pour Le Pen. Si l'on se réfère à un sondage qui serait effectué dans des conditions idéales [...], on obtient sur de tels pourcentages une incertitude de plus ou moins 3 % étant donné la taille de l'échantillon [...]. »

1. Si l’on tient compte de l’incertitude liée au sondage, entre quels pourcentages pourraient se situer réellement (à 95 % de confiance) les deux candidats lorsque le sondage donne 18 % pour l’un et 14 % pour l’autre ?

2. Représenter sur un même graphique les deux « fourchettes » calculées à la question précédente. Peut-on prévoir l’ordre des candidats ?

3. Au premier tour de l’élection présidentielle de 2002, L. Jospin a obtenu 16,18 % des voix et J.-M. Le Pen 16,86 %.

Expliquer la phrase « l'écart des intentions de vote entre les candidats Le Pen et Jospin rendait tout à fait plausible le scénario qui s'est réalisé ».

Éléments de réponse

1. Pour L. Jospin, entre 15 % et 21 %. Pour J.-M. Le Pen, entre 11 % et 17 %.

2. Un dessin possible.

Si on utilise ces fourchettes, on ne peut pas prévoir l’ordre des candidats car elles ont une partie commune.

3. La phrase correspond au fait que les pourcentages obtenus à l’élection sont situés dans les fourchettes du sondage.

Commentaires

Voici un exemple où quelques notions mathématiques de base (pourcentage, représentation des nombres, intervalle, intersection) sont nécessaires à la bonne compréhension d’un article de presse de la rubrique société ou politique.

La lecture du texte est une des difficultés de l’exercice, mais montre aussi l’intérêt de la situation.

L’aspect fluctuation d’échantillonnage (plus ou moins 3 % sur un échantillon de taille mille, c’est-à-dire

1 0,03

1000  ) n’est pas pris en compte dans cet exercice, qui se veut élémentaire. La « confiance » est donnée

au statisticien. Il est possible d’expérimenter la pertinence de ce 3 % (environ 95 % de confiance) par simulation.

1.7.43. Surréservation

Deux énoncés sont proposés. Dans le premier, l’élève est guidé dans la démarche de résolution et dans le second il peut faire preuve de son autonomie et de sa prise d’initiative dans la résolution d’un problème.

Énoncé 1

Une compagnie aérienne dispose d’un avion de 100 places et vend 107 réservations.

L’objectif est d’évaluer la probabilité de surréservation de cette compagnie, autrement dit le risque que plus de 100 passagers se présentent à l’embarquement.

1. On suppose que toute personne réservant une place d’avion a une chance sur 10 de ne pas se présenter à l’embarquement. Réaliser une simulation du nombre de personnes se présentant à l’embarquement d’un vol de 100 places pour 107 réservations, sur un échantillon aléatoire obtenu à l’aide d’un tableur.

Pour cela, dans une feuille de calcul du tableur :

* saisir « =ENT(ALEA()+0,9) » dans la cellule A1 et recopier cette formule vers la droite jusqu’en DC1 pour obtenir 107 réalisations ,

* saisir « =SOMME(A1:DC1) » dans la cellule DD1.

2. Réaliser une simulation du nombre de personnes se présentant à l’embarquement de 1 000 vols de 100 places pour 107 réservations à chaque vol.

3. Déterminer, pour cette simulation de 1 000 vols, la proportion des cas où l’effectif des passagers se présentant à l’embarquement est supérieur à 100. Pour cela :

* dans une cellule de votre choix, utiliser la formule « =NB.SI(DD1:DD1000;">100") »,

* dans une cellule de votre choix, en déduire la fréquence demandée.

15 % 20 % 10 %

4. a. En utilisant la touche F9, réaliser plusieurs simulations, puis évaluer la probabilité que plus de 100 personnes se présentent à l’embarquement.

b. Évaluer, en pourcentage, le risque de surréservation pour la compagnie aérienne.

Éléments de réponse

1. Tout type de tableur convient, par exemple Excel ou OpenOffice Calc.

Il suffit d’inscrire la formule « =ENT(ALEA()+0,9) » dans la cellule A1, de la recopier horizontalement pour qu’elle soit calculée 107 fois, puis d’effectuer la somme.

L’élève doit comprendre que lorsque la formule affiche 1, le passager se présente à l’embarquement et lorsqu’elle affiche 0, le passager ne se présente pas.

2. Il s’agit de sélectionner les cellules de la simulation de la question 1. puis de recopier vers le bas.

3. L’instruction NB.SI fournit un effectif. On s’attache à la différence qui est faite entre effectif et fréquence.

4. L’élève doit comprendre que la probabilité de surréservation est la valeur autour de laquelle fluctuent les fréquences lorsqu’on appuie sur la touche F9.

On accepte toute évaluation comprise entre 0,06 et 0,10.

Signalons pour le professeur que le calcul de cette probabilité peut s’effectuer par la formule « =1- LOI.BINOMIALE(100;107;0,9;VRAI) » qui donne comme réponse environ 0,08 (ou 8 %).

Énoncé 2

On suppose qu’une personne réservant une place d’avion a une chance sur 10 de ne pas se présenter à l’embarquement. Une compagnie dispose d’un avion de 100 places et vend 107 réservations. Le but de l’exercice est d’évaluer la probabilité de surréservation.

1. Sur un tableur, réaliser une simulation du nombre de personnes se présentant à l’embarquement lorsqu’il y a 107 réservations.

On peut utiliser la formule =ENT(ALEA()+0,9).

2. Sur un tableur, réaliser une simulation sur un échantillon de taille 1 000 de l’expérience aléatoire précédente et déterminer, pour cette simulation, la fréquence des cas où plus de 100 personnes se présentent à l’embarquement.

On peut utiliser la formule =NB.SI(plage ;" 100" ).

3. À l’aide des simulations réalisées, est-il possible d’évaluer le risque de surréservation que prend la compagnie ? On peut utiliser la touche F9.

commentaires (0)
Aucun commentaire n'a été pas fait
Écrire ton premier commentaire
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Docsity n'est pas optimisée pour le navigateur que vous utilisez. Passez à Google Chrome, Firefox, Internet Explorer ou Safari 9+! Téléchargez Google Chrome