


















Study with the several resources on Docsity
Earn points by helping other students or get them with a premium plan
Prepare for your exams
Study with the several resources on Docsity
Earn points to download
Earn points by helping other students or get them with a premium plan
Dans ce cours Big Data enseigné par Dr. Wiem Chebil, apprenez l'évolution des données, la définition du Big Data et les 5 V's du Big Data. Découvrez l'écosystème Hadoop, son fonctionnement et ses principaux composants : HDFS et MapReduce. En savoir plus sur la distribution des données et traitements, les capacités de stockage et les préfixes multiplicatifs.
Typology: Exams
1 / 26
This page cannot be seen from the preview
Don't miss anything!



















Evolution de la technologie
Evolution des données
Big Data?
Les 5 V’s du Big Data
Les capacités de stockage
Préfixes multiplicatifs Avant de parler de BigData, connaissez-vous les préfixes? signe préfixe facteur exemple représentatif 10 3 k kilo M méga G giga T téra P péta E exa Z zetta une page de texte 10 6 vitesse de transfert par seconde 10 9 DVD, clé USB 10 12 disque dur 10 15 10 18 FaceBook, Amazon 10 21 internet tout entier depuis 2010
Distribution données et traitements Le traitement d’aussi grandes quantités de données impose des méthodes particulières. Un SGBD classique, même haut de gamme, est dans l’incapacité de traiter autant d’informations. Solution:
Machines connectées Toutes ces machines sont connectées entre elles afin de partager l’espace de stockage et la puissance de calcul. Le Cloud est un exemple d’espace de stockage distribué : des fichiers sont stockés sur différentes machines, généralement en double pour prévenir une panne. L’exécution des programmes est également distribuée : ils sont exécutés sur une ou plusieurs machines du réseau. Tout ce module vise à enseigner la programmation d’applications sur un cluster, à l’aide des outils Hadoop.
Ecosystème Hadoop