
Caractéristiques du cours
Durée
4 jours
Niveau de compétence
Intermédiaire
Profils
Administrateurs systèmes
Type de formation
Inter-entreprise
Prix
2400€
Hors frais de déplacement.
La note moyenne attribuée par les participants
8.5/10
La note moyenne de satisfaction
Prérequis
Objectifs
Détail
Prochaines dates de formation
Prérequis
Connaissances en administration système, préalablement Java.
Objectifs
- Objectifs pédagogiques
- Comprendre le Big Data et ses enjeux
- Savoir déployer Hadoop et son écosystème
- Comprendre HDFS, MapReduce
- Structurer les données ave HBase
- Écrire des requêtes avec HiveQl
- Lancer une analyse avec Pig
- Objectifs opérationnels
- Avoir acquis les connaissances sur le Big Data et Hadoop
- Savoir mettre en place Hadoop
- Connaître les intérêts de MapReduce
- Travailler en autonomie
- Maîtriser le module
Détail
PLAN PEDAGOGIQUE
• Introduction au Big Data
-
- Qu’est-ce que le Big Data ?
- Source des données : l’homme, la machine
- La problématique de taille
- Position de Hadoop dans le paysage
• Introduction à Hadoop
-
- L’origine du projet
- Le système de fichiers HDFS
- Comprendre l’algorithme MapReduce
- L’environnement d’Hadoop : HBase, Zookeeper, Hive, Pig…
- L’APIYARN
• Mettre Hadoop en place : HDFS
-
- Du mode autonome au mode complètement distribué en cluster
- Pré-requis, distributions Hadoop
- Cluster Hadoop : NameNode, ResourceManager, DataNode,NodeManager
- Les fichiers de configuration
- Opérations de base sur le duster HDFS : formatage, démarrage, arrêt
Atelier pratique : installer Hadoop sur 2 nœuds, formater et manipuler
• Travailler avec MapReduce
-
- L’intérêt de MapReduce
- Mappers, reducers, parallélisme et indépendance des traitements
- Entrées, sorties
- Soumission d’un job à Hadoop
- Atelier pratique : exécuter une tâche via MapReduce, avec sortie dans HDFS
Prochaines dates de formation
Prochaines dates : du 19 au 22 février 2024.
Merci de nous contacter au 01 86 95 71 60 ou à l’adresse formation@adbi.fr.