Exercices sur les probabilités et les statistiques - 8, Exercices de Informatique et analyse de données statistiques
Christophe
Christophe3 March 2014

Exercices sur les probabilités et les statistiques - 8, Exercices de Informatique et analyse de données statistiques

PDF (147.5 KB)
3 pages
162Numéro de visites
Description
Exercices d’informatique sur les robabilités et les statistiques - les annales 8 Les principaux thèmes abordés sont les suivants: exercices, questions,calculs.
20points
Points de téléchargement necessaire pour télécharger
ce document
Télécharger le document

ANNALES 2005 I Préliminaire: RANDOM est une variable aléatoire qui suit la loi diffuse uniforme sur l’intervalle (0,1) . a0 et b0 sont donnés tels que a0 < b0 . quelle est la loi suivie par X=a0 + (b0-a0) * RANDOM ? a et b sont 2 réels tels que : a0 ≤ a < b ≤ b0 quelle est la loi de (X sachant a ≤ X ≤ b) ? exercice: c est un réel tel que 0 < c < 1On dispose d'une fonction RAND qui lors de N appels successifs donne des valeurs r qui sont une réalisation d'un échantillon de taille N de RANDOM . D est la variable aléatoire image de R par l'application r d définie par l'algorithme r=a0 + (b0 – a0)*RAND; a=a0 ; b=b0 ; pour k=1 à N faire: m=(1-c)*a + c*b ; si m ≤ r alors a=m sinon b=m ; fin_de_boucle_k d=b-a; fin. (conseil : éventuellement, essayer c=1/2 pour mieux comprendre cet algorithme) 1 dans le cas ou N=1 : quelle est la loi de D ? quelle est son espérance E(D), sa variance ? quelle valeur de c donne E(D) minimum ? dans ce cas particulier que peut-on dire de très spécial sur la variable aléatoire D 2 dans le cas ou N est >1 : mêmes questions (ici vous pouvez vous dispenser de calculer la variance) 3maintenant N=4: c=1/4 calculer la probabilité que D soit plus petit que pour c=1/2

II Une urne contient des boules blanches et des noires . On appelle tirage au hasard avec remise : un tirage au cours duquel la probabilité de tirer une boule d'une certaine catégorie = le nombre de boules de cette catégorie divisé par le nombre total de boules contenues dans l'urne (avec remise signifie que ces nombres ne varient pas au cours des tirages successifs). 1 au cours de 8 tirages au hasard avec remise on n'a obtenu qu'une blanche ; peut-on rejeter avec le seuil 0.05 l'hypothèse H : "il y a le même nombre de boules blanches et noires dans l'urne" ? 2 au cours de 1024 tirages au hasard avec remise on a obtenu 477 blanches ; peut-on rejeter avec le même seuil 0.05 l'hypothèse H ?

docsity.com

2004 Tous les algorithmes demandés seront (naturellement) écrits en L.D.A , clairs et bien commentés . E est un ensemble d’éléments avec une relation d’ordre total, notée classiquement ≤ . L’algorithme Rand_Tri reçoit en entrée une suite de N éléments de E et retourne en sortie la suite triée suivant l’ordre croissant . Principe de l’algorithme Rand_Tri : un élément de la suite (appelé : pivot) est choisit au ‘’hasard’’ (c’est à dire que chaque élément de la suite a la même probabilité d’être choisi) ; on compare le pivot avec tous les éléments de la suite , ceux qui sont ≤ au pivot sont placés avant le pivot et les autres après le pivot ; on obtient ainsi 2 sous suites (éventuellement l’une des deux peut être vide) . On itère ce procédé sur chaque sous suite ainsi formée, tant qu’elles comportent plus d’un élément . Lorsque l’algorithme s’arrête la suite de départ est triée suivant l’ordre croissant . On s’intéresse à la variable aléatoire N_C nombre de comparaisons effectuées au cours de l’exécution de l’algorithme . Question préliminaire : le nombre de comparaisons effectuées au cours de l’exécution de l’algorithme dépend naturellement de l’ordre initial de la suite d’entrée, qui n’est pas connu, notons L la loi de l’ordre de la suite d’entrée . Montrer qu’en fait la loi de N_C ne dépend pas de la loi L ; c’est à dire précisément, que : pour tout entier k Prob( N_C = k , connaissant l’ordre d’entrée ) = Prob( N_C = k ) I Calcul de l’espérance de N_C ,notée E(N_C) 1) on note xi i=1…N les éléments de la suite en sortie de l’algorithme (c.à.d.. triée suivant l’ordre croissant) ; soient i et j tels que 1≤ i < j ≤ N ; dans le cas où j>i+1, il existe des éléments xk entre xi et xj ; montrer que la Probabilité qu’au cours de l’exécution de l’algorithme xi ou xj aient été choisis comme pivot avant l'un quelconque des xk pour i<k<j , vaut 2/(j-i+1) . En déduire la Probabilité qu’au cours de l’exécution de l’algorithme, il y ait eu une comparaison entre xi et xj . Dans le cas où j=i+1 , la méthode de calcul ci-dessus n’a plus de sens, cependant, vérifier directement que la formule que vous avez trouvée pour la Probabilité est encore valable . 2) on note Xi,j la variable aléatoire caractéristique de l’événement : ‘’au cours de l’exécution de l’algorithme, il y a eu une comparaison entre xi et xj ‘’ .Calculer l’espérance de Xi,j et sa variance . Trouver une relation très simple entre N_C et les Xi,j .A l’aide de cette relation trouver une formule qui donne E(N_C) en fonction de N (vous ne chercherez pas à simplifier cette formule qui contient une double sommation) 3) écrire un algorithme qui calcule E(N_C) .

docsity.com

II Estimation de la variance de N_C , notée Var(N_C) Maintenant , on suppose que N le nombre d’éléments des suites triées , est un ‘’ grand nombre ‘’ du point de vue des statistiques . 1) les variables aléatoires Xi,j sont elles deux à deux indépendantes ? Pour calculer Var(N_C) , pourquoi ne peut-on utiliser la relation entre N_C et les Xi,j d’une manière analogue à ce qui a été fait dans I 2) ? 2) on suppose disponible une fonction appelée rand_tri qui lance l’exécution de l’algorithme Rand_Tri et retourne le nombre de comparaisons effectuées au cours de cette exécution ; écrire un algorithme (après avoir justifié son principe) qui donne une estimation de Var(N_C) . 3) vous supposerez que le paramètre taille_échantillon (que vous avez du introduire dans l’algorithme écrit en 2) ) est supérieur à 100 , compléter votre algorithme pour qu’il donne aussi un intervalle de confiance de la forme classique (0 , b) pour Var(N_C) , au seuil de 0.05 . 4) on considère la condition : Probabilité de ( valeur absolue de [ESTIMATEUR de Var(N_C) - Var(N_C) ] / Var(N_C) < 0.01 ) > 0.95 écrire un algorithme (en le justifiant) qui détermine la valeur minimum du paramètre taille_échantillon qui permet d’obtenir la condition ci dessus . Ecrire une phrase simple qui traduit intuitivement la condition considérée .

docsity.com

commentaires (0)
Aucun commentaire n'a été pas fait
Écrire ton premier commentaire
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Docsity n'est pas optimisée pour le navigateur que vous utilisez. Passez à Google Chrome, Firefox, Internet Explorer ou Safari 9+! Téléchargez Google Chrome