Data Engineering sur AWS

Vous voulez devenir autonome dans la création d'architectures data robustes et évolutives sur AWS ? Des fondamentaux Cloud aux patterns de Data Engineering, maîtrisez l'écosystème AWS à travers des retours d'expérience concrets issus de cas clients.

2 jours

Max 10 participants

Discutons de votre projet

Télécharger le programme

Formations données

Apprenants formés en 2025

Satisfaction moyenne

Taux de réponse

Objectifs

Les apprentissages clés
de la formation

Maîtriser les fondamentaux Cloud et l'écosystème AWS

Comprendre le Cloud Computing, les systèmes distribués et naviguer dans les services managés AWS (S3, RDS, DynamoDB, EMR, Glue, Kinesis, SageMaker).

Déployer des applications data en production

Architecturer son code pour le Cloud, mettre en place l'Infrastructure as Code (Terraform, CloudFormation) et automatiser les déploiements via CI/CD.

Implémenter les patterns de Data Engineering

Construire des pipelines batch et temps réel, orchestrer les traitements et exposer des modèles ML sur AWS.

Programme

Les modules de la formation

Huit modules pour couvrir la chaîne complète du Data Engineering sur AWS, des fondations Cloud aux patterns de pipelines data en production.

Fondations Cloud & Data

3h30

Les concepts fondamentaux du Cloud Computing et du Big Data pour poser les bases avant de plonger dans l'écosystème AWS.

Objectifs :

Comprendre les types de services managés (IaaS, PaaS, SaaS) et comparer les providers Cloud
Maîtriser les principes de scaling horizontal et les systèmes distribués
Distinguer les cas d'usage batch et temps réel

MODULES :

Types de services managés (IaaS, PaaS, SaaS) et comparaison des providers Cloud
Scaling horizontal, systèmes distribués et paradigme MapReduce
Cas d'usage batch vs temps réel

Écosystème Data AWS

3h30

Naviguer dans les services data AWS et choisir les bons outils pour chaque cas d'usage : stockage, traitement, orchestration et ML.

Objectifs :

Maîtriser le stockage AWS : S3, RDS, Aurora, DynamoDB, Parameter Store et Secret Manager
Utiliser les services de traitement batch (EMR, Glue, Athena) et temps réel (Kinesis)
Découvrir SageMaker pour le Machine Learning et API Gateway pour l'exposition

MODULES :

Stockage AWS : S3, RDS, Aurora, DynamoDB, Parameter Store, Secret Manager
Traitement batch (EMR, Glue, Athena) et temps réel (Kinesis)
SageMaker pour le Machine Learning et API Gateway pour l'exposition

Du code au Cloud

3h30

Déployer et maintenir des applications data en production avec les bonnes pratiques de développement Cloud-native.

Objectifs :

Architecturer son application pour le Cloud et mettre en place l'Infrastructure as Code
Automatiser les déploiements via CI/CD avec tests et debugging
Appliquer les principes 12-factor app et gérer les secrets

MODULES :

Architecture Cloud-native et Infrastructure as Code (Terraform, CloudFormation)
CI/CD : automatisation des déploiements, tests et debugging
Principes 12-factor app et gestion des secrets

Patterns de Data Engineering

3h30

Implémenter les patterns classiques de pipelines data sur AWS : batch, temps réel et Machine Learning.

Objectifs :

Construire des pipelines ETL/ELT avec orchestration, scheduling et gestion des erreurs
Implémenter une architecture event-driven temps réel sur Kinesis
Entraîner, déployer et exposer un modèle ML via SageMaker et API Gateway

MODULES :

Pipelines ETL/ELT : orchestration, scheduling et gestion des erreurs
Architecture event-driven temps réel sur Kinesis
Entraînement, déploiement et exposition d'un modèle ML via SageMaker et API Gateway

Fondations Cloud & Data

3h30

Les concepts fondamentaux du Cloud Computing et du Big Data pour poser les bases avant de plonger dans l'écosystème AWS.

Objectifs :

Comprendre les types de services managés (IaaS, PaaS, SaaS) et comparer les providers Cloud
Maîtriser les principes de scaling horizontal et les systèmes distribués
Distinguer les cas d'usage batch et temps réel

MODULES :

Types de services managés (IaaS, PaaS, SaaS) et comparaison des providers Cloud
Scaling horizontal, systèmes distribués et paradigme MapReduce
Cas d'usage batch vs temps réel

Écosystème Data AWS

3h30

Naviguer dans les services data AWS et choisir les bons outils pour chaque cas d'usage : stockage, traitement, orchestration et ML.

Objectifs :

Maîtriser le stockage AWS : S3, RDS, Aurora, DynamoDB, Parameter Store et Secret Manager
Utiliser les services de traitement batch (EMR, Glue, Athena) et temps réel (Kinesis)
Découvrir SageMaker pour le Machine Learning et API Gateway pour l'exposition

MODULES :

Pipelines ETL/ELT : orchestration, scheduling et gestion des erreurs
Architecture event-driven temps réel sur Kinesis
Entraînement, déploiement et exposition d'un modèle ML via SageMaker et API Gateway

Du code au Cloud

3h30

Déployer et maintenir des applications data en production avec les bonnes pratiques de développement Cloud-native.

Objectifs :

Architecturer son application pour le Cloud et mettre en place l'Infrastructure as Code
Automatiser les déploiements via CI/CD avec tests et debugging
Appliquer les principes 12-factor app et gérer les secrets

MODULES :

Architecture Cloud-native et Infrastructure as Code (Terraform, CloudFormation)
CI/CD : automatisation des déploiements, tests et debugging
Principes 12-factor app et gestion des secrets

Patterns de Data Engineering

3h30

Implémenter les patterns classiques de pipelines data sur AWS : batch, temps réel et Machine Learning.

Objectifs :

Construire des pipelines ETL/ELT avec orchestration, scheduling et gestion des erreurs
Implémenter une architecture event-driven temps réel sur Kinesis
Entraîner, déployer et exposer un modèle ML via SageMaker et API Gateway

MODULES :

Pipelines ETL/ELT : orchestration, scheduling et gestion des erreurs
Architecture event-driven temps réel sur Kinesis
Entraînement, déploiement et exposition d'un modèle ML via SageMaker et API Gateway

S'inscrire

Télécharger le programme

Magic sauce

Les petits + de la formation

Un groupe de huit personnes debout autour d'une table blanche dans une salle de réunion moderne avec des chaises en bois et des plantes.

Figurine de jouet Playmobil tenant un panneau « Data Engineer » sur une table avec des cartes sur le thème de la gestion des données.

Des ateliers ludiques et participatifs

Deux smartphones affichant des classements et résultats dans une application nommée Prompt Fighter sur fond violet avec motifs abstraits.

Des formats gamifiés et innovants

Un groupe de cinq jeunes adultes diversifiés collaborant autour d'un ordinateur portable sur une grande table en bois dans un bureau moderne.

Des formateurs certifiés et passionnés

Télécharger le certificat

Hymaia est certifiée Qualiopi et Toutes nos formations sont finançables par votre OPCO

Certification délivrée au titre des catégories d’actions suivantes : Action de formation (L.6313-1 - 1°)

Toutes nos formations sont finançable par votre OPCO

Télécharger le certificat

Pour aller plus loin

Ces formations pourraient aussi vous intéresser

Voir toutes les formations

Voir toutes les offres

Nos solutions

ces offres pourraient aussi vous intéresser

Conseil et Expertise Technique

Nos experts s'immergent dans vos équipes pour cadrer, construire et transférer. Data, IA, Produit, Transformation : toutes nos expertises, un seul mode de fonctionnement.

Voir

Voir toutes les offres

Ces contenus pourraient
aussi vous intéresser

Article

5 min

🌶️

Débutants

Leboncoin x hymaïa : Former les Product & Engineering Managers aux enjeux Data & IA

Comment leboncoin forme ses Product & Engineering Managers aux enjeux Data & IA.

28.01.2026

Voir

Article

15 min

🌶️

Confirmés

Tracking des accès à la donnée dans AWS

Surveiller les accès à vos données AWS avec CloudTrail, EventBridge, Lambda et Firehose.

24.06.2025

Voir

Article

10 min

🌶️

Experts

Serverless Inference : Quand AWS SageMaker rencontre AWS Lambda

Combiner AWS SageMaker et Lambda pour des prédictions ML en temps réel, sans gérer de serveurs.

12.05.2025

Voir

Vidéo

Les secrets d'une équipe Data Science réussie : automatisation, diversité et innovation

Quels sont les challenges d'un Lead AI dans une scale-up qui veut faire de l'IA son cheval de bataille stratégique ?

Au cours de cette interview, Remi Takase, Lead AI de Mirakl, nous expliquera son quotidien, ses questionnements et ses challenges passés et à venir.

08.07.2025

Voir

Vidéo

Café Data avec Gaël Varoquaux

Gaël Varoquaux est le co-fondateur de scikit-learn, le projet open-source le plus utilisé pour faire du Machine Learning en Python. Directeur de recherche à l’Inria, il est aussi membre du récent comité scientifique pour l’Intelligence Artificielle Générative. Il nous accorde une interview exclusive durant laquelle il nous partage ses convictions sur l'avenir de l'IA et sur la place de l'open-source.e

Au programme :

Sa vision Produit autour de scikit-learn et son avenir - et plus généralement la place de l’open-source dans la tech et l’IA
Ses travaux de recherche à l’Inria - en particulier les applications du Machine Learning sur des questions de santé et de société
Ses messages et convictions sur les challenges à venir en IA - messages qu’il porte auprès du comité de l'intelligence artificielle générative

‍

08.07.2025

Voir

Vidéo

Kubernetes en 1h pour les dev

01.07.2025

Voir

Voir tous les contenus

Construisons votre parcours de formation

Discutons de vos besoins en formation et créons un programme sur mesure pour vos équipes.

Demander un devis

Télécharger le catalogue

Data Engineering sur AWS

Les apprentissages clés de la formation

Maîtriser les fondamentaux Cloud et l'écosystème AWS

Déployer des applications data en production

Implémenter les patterns de Data Engineering

Les modules de la formation

Fondations Cloud & Data

Écosystème Data AWS

Du code au Cloud

Patterns de Data Engineering

Fondations Cloud & Data

Écosystème Data AWS

Du code au Cloud

Patterns de Data Engineering

Les petits + de la formation

Des ateliers ludiques et participatifs

Des formats gamifiés et innovants

Des formateurs certifiés et passionnés

Hymaia est certifiée Qualiopi et Toutes nos formations sont finançables par votre OPCO

Toutes nos formations sont finançable par votre OPCO

Ces formations pourraient aussi vous intéresser

ces offres pourraient aussi vous intéresser

Conseil et Expertise Technique

Ces contenus pourraientaussi vous intéresser

Construisons votre parcours de formation

Les apprentissages clés
de la formation

Ces contenus pourraient
aussi vous intéresser