Data Engineering sur AWS
Vous voulez devenir autonome dans la création d'architectures data robustes et évolutives sur AWS ? Des fondamentaux Cloud aux patterns de Data Engineering, maîtrisez l'écosystème AWS à travers des retours d'expérience concrets issus de cas clients.
2 jours
Max 10 participants

Les apprentissages clés
de la formation
Maîtriser les fondamentaux Cloud et l'écosystème AWS
Comprendre le Cloud Computing, les systèmes distribués et naviguer dans les services managés AWS (S3, RDS, DynamoDB, EMR, Glue, Kinesis, SageMaker).
Déployer des applications data en production
Architecturer son code pour le Cloud, mettre en place l'Infrastructure as Code (Terraform, CloudFormation) et automatiser les déploiements via CI/CD.
Implémenter les patterns de Data Engineering
Construire des pipelines batch et temps réel, orchestrer les traitements et exposer des modèles ML sur AWS.
Les modules de la formation
Huit modules pour couvrir la chaîne complète du Data Engineering sur AWS, des fondations Cloud aux patterns de pipelines data en production.
Fondations Cloud & Data
Les concepts fondamentaux du Cloud Computing et du Big Data pour poser les bases avant de plonger dans l'écosystème AWS.
Objectifs :
- Comprendre les types de services managés (IaaS, PaaS, SaaS) et comparer les providers Cloud
- Maîtriser les principes de scaling horizontal et les systèmes distribués
- Distinguer les cas d'usage batch et temps réel
MODULES :
- Types de services managés (IaaS, PaaS, SaaS) et comparaison des providers Cloud
- Scaling horizontal, systèmes distribués et paradigme MapReduce
- Cas d'usage batch vs temps réel
Écosystème Data AWS
Naviguer dans les services data AWS et choisir les bons outils pour chaque cas d'usage : stockage, traitement, orchestration et ML.
Objectifs :
- Maîtriser le stockage AWS : S3, RDS, Aurora, DynamoDB, Parameter Store et Secret Manager
- Utiliser les services de traitement batch (EMR, Glue, Athena) et temps réel (Kinesis)
- Découvrir SageMaker pour le Machine Learning et API Gateway pour l'exposition
MODULES :
- Pipelines ETL/ELT : orchestration, scheduling et gestion des erreurs
- Architecture event-driven temps réel sur Kinesis
- Entraînement, déploiement et exposition d'un modèle ML via SageMaker et API Gateway
Du code au Cloud
Déployer et maintenir des applications data en production avec les bonnes pratiques de développement Cloud-native.
Objectifs :
- Architecturer son application pour le Cloud et mettre en place l'Infrastructure as Code
- Automatiser les déploiements via CI/CD avec tests et debugging
- Appliquer les principes 12-factor app et gérer les secrets
MODULES :
- Architecture Cloud-native et Infrastructure as Code (Terraform, CloudFormation)
- CI/CD : automatisation des déploiements, tests et debugging
- Principes 12-factor app et gestion des secrets
Patterns de Data Engineering
Implémenter les patterns classiques de pipelines data sur AWS : batch, temps réel et Machine Learning.
Objectifs :
- Construire des pipelines ETL/ELT avec orchestration, scheduling et gestion des erreurs
- Implémenter une architecture event-driven temps réel sur Kinesis
- Entraîner, déployer et exposer un modèle ML via SageMaker et API Gateway
MODULES :
- Pipelines ETL/ELT : orchestration, scheduling et gestion des erreurs
- Architecture event-driven temps réel sur Kinesis
- Entraînement, déploiement et exposition d'un modèle ML via SageMaker et API Gateway
Les petits + de la formation

Des ateliers ludiques et participatifs
Nous avons créé les Fresques de la data et de l’IA générative pour rendre l’apprentissage de concepts ludique et accessibles au plus grand nombre.
Des formats gamifiés et innovants
Nous avons imaginés des jeux pour apprendre les bonnes pratiques de prompting et appréhender différents types d’IA génératives.


Toutes nos formations sont finançable par votre OPCO
Ces formations pourraient aussi vous intéresser
ces offres pourraient aussi vous intéresser
Ces contenus pourraient
aussi vous intéresser
Article
Tech & Data
5 min
🌶️
Débutants

Comment leboncoin forme ses Product & Engineering Managers aux enjeux Data & IA.
28.01.2026
Article
Tech & Data
15 min
🌶️
🌶️
Confirmés

Surveiller les accès à vos données AWS avec CloudTrail, EventBridge, Lambda et Firehose.
24.06.2025
Article
Tech & Data
10 min
🌶️
🌶️
Experts

Combiner AWS SageMaker et Lambda pour des prédictions ML en temps réel, sans gérer de serveurs.
12.05.2025
Vidéo
Tech & Data

Quels sont les challenges d'un Lead AI dans une scale-up qui veut faire de l'IA son cheval de bataille stratégique ?
Quels sont les challenges d'un Lead AI dans une scale-up qui veut faire de l'IA son cheval de bataille stratégique ?
Au cours de cette interview, Remi Takase, Lead AI de Mirakl, nous expliquera son quotidien, ses questionnements et ses challenges passés et à venir.
08.07.2025
Vidéo
Tech & Data

Gaël Varoquaux est le co-fondateur de scikit-learn, le projet open-source le plus utilisé pour faire du Machine Learning en Python. Directeur de recherche à l’Inria, il est aussi membre du récent comité scientifique pour l’Intelligence Artificielle Générative. Il nous accorde une interview exclusive durant laquelle il nous partage ses convictions sur l'avenir de l'IA et sur la place de l'open-source.e
Au programme :
- Sa vision Produit autour de scikit-learn et son avenir - et plus généralement la place de l’open-source dans la tech et l’IA
- Ses travaux de recherche à l’Inria - en particulier les applications du Machine Learning sur des questions de santé et de société
- Ses messages et convictions sur les challenges à venir en IA - messages qu’il porte auprès du comité de l'intelligence artificielle générative
08.07.2025
01.07.2025
Construisons votre parcours de formation
Discutons de vos besoins en formation et créons un programme sur mesure pour vos équipes.






