Data Engineering sur AWS

Vous voulez devenir autonome dans la création d'architectures data robustes et évolutives sur AWS ? Des fondamentaux Cloud aux patterns de Data Engineering, maîtrisez l'écosystème AWS à travers des retours d'expérience concrets issus de cas clients.

2 jours

Max 10 participants

+
Formations données
Formations données
+
--
Apprenants formés en 2025
Apprenants formés en 2025
%
Satisfaction moyenne
Satisfaction moyenne
Taux de réponse
Taux de réponse
Objectifs

Les apprentissages clés
de la formation

icône fusée

Maîtriser les fondamentaux Cloud et l'écosystème AWS

Comprendre le Cloud Computing, les systèmes distribués et naviguer dans les services managés AWS (S3, RDS, DynamoDB, EMR, Glue, Kinesis, SageMaker).

icône fusée

Déployer des applications data en production

Architecturer son code pour le Cloud, mettre en place l'Infrastructure as Code (Terraform, CloudFormation) et automatiser les déploiements via CI/CD.

icône fusée

Implémenter les patterns de Data Engineering

Construire des pipelines batch et temps réel, orchestrer les traitements et exposer des modèles ML sur AWS.

Programme

Les modules de la formation

Huit modules pour couvrir la chaîne complète du Data Engineering sur AWS, des fondations Cloud aux patterns de pipelines data en production.

01

Fondations Cloud & Data

3h30

Les concepts fondamentaux du Cloud Computing et du Big Data pour poser les bases avant de plonger dans l'écosystème AWS.

Objectifs :

  • Comprendre les types de services managés (IaaS, PaaS, SaaS) et comparer les providers Cloud
  • Maîtriser les principes de scaling horizontal et les systèmes distribués
  • Distinguer les cas d'usage batch et temps réel

MODULES :

  • Types de services managés (IaaS, PaaS, SaaS) et comparaison des providers Cloud
  • Scaling horizontal, systèmes distribués et paradigme MapReduce
  • Cas d'usage batch vs temps réel
02

Écosystème Data AWS

3h30

Naviguer dans les services data AWS et choisir les bons outils pour chaque cas d'usage : stockage, traitement, orchestration et ML.

Objectifs :

  • Maîtriser le stockage AWS : S3, RDS, Aurora, DynamoDB, Parameter Store et Secret Manager
  • Utiliser les services de traitement batch (EMR, Glue, Athena) et temps réel (Kinesis)
  • Découvrir SageMaker pour le Machine Learning et API Gateway pour l'exposition

MODULES :

  • Pipelines ETL/ELT : orchestration, scheduling et gestion des erreurs
  • Architecture event-driven temps réel sur Kinesis
  • Entraînement, déploiement et exposition d'un modèle ML via SageMaker et API Gateway
03

Du code au Cloud

3h30

Déployer et maintenir des applications data en production avec les bonnes pratiques de développement Cloud-native.

Objectifs :

  • Architecturer son application pour le Cloud et mettre en place l'Infrastructure as Code
  • Automatiser les déploiements via CI/CD avec tests et debugging
  • Appliquer les principes 12-factor app et gérer les secrets

MODULES :

  • Architecture Cloud-native et Infrastructure as Code (Terraform, CloudFormation)
  • CI/CD : automatisation des déploiements, tests et debugging
  • Principes 12-factor app et gestion des secrets
04

Patterns de Data Engineering

3h30

Implémenter les patterns classiques de pipelines data sur AWS : batch, temps réel et Machine Learning.

Objectifs :

  • Construire des pipelines ETL/ELT avec orchestration, scheduling et gestion des erreurs
  • Implémenter une architecture event-driven temps réel sur Kinesis
  • Entraîner, déployer et exposer un modèle ML via SageMaker et API Gateway

MODULES :

  • Pipelines ETL/ELT : orchestration, scheduling et gestion des erreurs
  • Architecture event-driven temps réel sur Kinesis
  • Entraînement, déploiement et exposition d'un modèle ML via SageMaker et API Gateway
Magic sauce

Les petits + de la formation

Un groupe de huit personnes debout autour d'une table blanche dans une salle de réunion moderne avec des chaises en bois et des plantes.
Figurine de jouet Playmobil tenant un panneau « Data Engineer » sur une table avec des cartes sur le thème de la gestion des données.

Des ateliers ludiques et participatifs

Nous avons créé les Fresques de la data et de l’IA générative pour rendre l’apprentissage de concepts ludique et accessibles au plus grand nombre.

Deux smartphones affichant des classements et résultats dans une application nommée Prompt Fighter sur fond violet avec motifs abstraits.

Des formats gamifiés et innovants

Nous avons imaginés des jeux pour apprendre les bonnes pratiques de prompting et appréhender différents types d’IA génératives.

Un groupe de cinq jeunes adultes diversifiés collaborant autour d'un ordinateur portable sur une grande table en bois dans un bureau moderne.

Des formateurs certifiés et passionnés

Les formations sont données par des experts d’Hymaïa. Également consultants, ils auront à coeur de vous partagez leurs expériences terrain...

Tristan Achache
Armelle Lefort
Simone Civetta
Elsa Margier
Anis Zakari

Hymaia est certifiée Qualiopi et Toutes nos formations sont finançables par votre OPCO

Certification délivrée au titre des catégories d’actions suivantes : Action de formation (L.6313-1 - 1°)

Toutes nos formations sont finançable par votre OPCO

Télécharger le certificat
Pour aller plus loin

Ces formations pourraient aussi vous intéresser

Ces contenus pourraient
aussi vous intéresser

Article

Article

Tech & Data

5 min

🌶️

Débutants

Leboncoin x hymaïa : Former les Product & Engineering Managers aux enjeux Data & IA

Comment leboncoin forme ses Product & Engineering Managers aux enjeux Data & IA.

28.01.2026

Voir
Article

Article

Tech & Data

15 min

🌶️

🌶️

Confirmés

Tracking des accès à la donnée dans AWS

Surveiller les accès à vos données AWS avec CloudTrail, EventBridge, Lambda et Firehose.

24.06.2025

Voir
Article

Article

Tech & Data

10 min

🌶️

🌶️

Experts

Serverless Inference : Quand AWS SageMaker rencontre AWS Lambda

Combiner AWS SageMaker et Lambda pour des prédictions ML en temps réel, sans gérer de serveurs.

12.05.2025

Voir
Vidéo

Vidéo

Tech & Data

Les secrets d'une équipe Data Science réussie : automatisation, diversité et innovation

Quels sont les challenges d'un Lead AI dans une scale-up qui veut faire de l'IA son cheval de bataille stratégique ?

Quels sont les challenges d'un Lead AI dans une scale-up qui veut faire de l'IA son cheval de bataille stratégique ?

Au cours de cette interview, Remi Takase, Lead AI de Mirakl, nous expliquera son quotidien, ses questionnements et ses challenges passés et à venir.

08.07.2025

Voir
Vidéo

Vidéo

Tech & Data

Café Data avec Gaël Varoquaux

Gaël Varoquaux est le co-fondateur de scikit-learn, le projet open-source le plus utilisé pour faire du Machine Learning en Python. Directeur de recherche à l’Inria, il est aussi membre du récent comité scientifique pour l’Intelligence Artificielle Générative. Il nous accorde une interview exclusive durant laquelle il nous partage ses convictions sur l'avenir de l'IA et sur la place de l'open-source.e

Au programme :

  • Sa vision Produit autour de scikit-learn et son avenir - et plus généralement la place de l’open-source dans la tech et l’IA
  • Ses travaux de recherche à l’Inria - en particulier les applications du Machine Learning sur des questions de santé et de société
  • Ses messages et convictions sur les challenges à venir en IA - messages qu’il porte auprès du comité de l'intelligence artificielle générative

08.07.2025

Voir
Vidéo

Vidéo

Tech & Data

Kubernetes en 1h pour les dev

01.07.2025

Voir

Construisons votre parcours de formation

Discutons de vos besoins en formation et créons un programme sur mesure pour vos équipes.