Cette présentation vous donnera un aperçu de la manière dont Amazon Web Services (AWS) peut être utilisé pour gérer et analyser vos données massives. Nous commencerons par une introduction aux concepts de base des services AWS pour le Big Data, puis nous verrons comment AWS peut être utilisé pour stocker, traiter et analyser ces données à l'échelle. Nous examinerons les différents services d'AWS tels que Amazon S3, Amazon EMR et Amazon EC2 qui peuvent être utilisés pour gérer les données. Nous verrons également les différentes étapes à suivre pour lancer chacun de ces services et comment peut on les utilisés. Enfin, nous proposerons un exemple pratique d'un problème qui consiste à trouver le nombre de répétition de chaque mots existants dans un large fichier text. La solution sera programmée sous le paradigme du MapReduce et exécutée dans un cluster EMR composé de 3 noueds.
oussafik/AWS-BigData
Folders and files
| Name | Name | Last commit date | ||
|---|---|---|---|---|