Hymaïa DataDictionary | Explorez les concepts essentiels de la Data et de l'IA

AI ACT

L’IA Act (Artificielle Intelligence Act) est un règlement qui vise à encadrer et favoriser le développement et la commercialisation des systèmes d’IA en Union européenne.

voir la définition

AI Ops

Alors que l'IA transforme rapidement le monde professionnel, un nouveau rôle émerge pour orchestrer cette révolution : l'AI Ops. À l'instar du Product Ops qui optimise la chaîne de valeur Produit, l'AI Ops est le catalyseur qui permet aux organisations de tirer le meilleur parti de l'Intelligence Artificielle.

voir la définition

AWS

AWS est un provisionner de Cloud. Réputé pour sa pléthore de services managés (déjà plus de 90 en 2017), vous n’êtes pas prêt d’en avoir fait le tour.

voir la définition

Analyse des erreurs

Se dit d’une approche qui consiste à détecter les points faibles d’un modèle de Machine Learning puis à les réduire par l’ajout de nouvelles observations ou variables explicatives.

voir la définition

Analytics Engineer

Personne qui applique les bonnes pratiques du Software Engineering (CI/CD, tests, versionning) à la création de datasets et data pipelines, afin d’accélérer le Time to Insight. Permet de réduire l’écart entre un Data Engineer et un Data Analyst.

voir la définition

CRISP-ML

CRISP-ML (ou CRISP-ML(Q)) est une proposition de standardisation des processus de développement d’un modèle de Machine Learning tout au long de son cycle de vie. C’est une méthodologie structurée pour guider les différentes étapes de réalisation d’un modèle de Machine Learning, de la compréhension du problème à la mise en production. Le prisme de lecture de cette approche est celui du Quality Engineering (d’où le Q).

voir la définition

ChatGPT

ChatGPT est un outil de génération de langage naturel basé sur l’intelligence artificielle qui permet aux utilisateurs de simuler des conversations avec des humains.

voir la définition

Citizen Data Scientist

Se dit d’une personne en capacité d’utiliser des techniques issues de la Data Science afin de répondre à des enjeux business, sans avoir nécessairement une formation spécifique sur le sujet. Favorise la démocratisation de la Data Science et de l’IA au sein de l’entreprise.

voir la définition

Cloud

modèle de service informatique qui permet aux utilisateurs d'accéder à des ressources informatiques, telles que des serveurs, du stockage et des applications, via Internet

voir la définition

Data Analyst

Le rôle d'un Data Analyst est d'exploiter, fiabiliser et interpréter des données pour en tirer des KPI et préconisations utiles.Les rapports et tableaux de bords générés permettent la prise de décisions stratégiques par l'entreprise.

voir la définition

Data As A Product

Constitue l’un des 4 piliers du Data Mesh. Il consiste à considérer la Data d’un domaine métier comme un produit à part entière. Parmi ses propriétés : découvrabilité, facilité d’accès, fiabilité, non-ambiguïté, gouverné et sécurisé.

voir la définition

Data Business Model Canvas

Un support pour faciliter l’alignement lors de la phase de cadrage, qui constitue la première partie indispensable du cycle d’un projet Data.

voir la définition

Data Drift

Correspond à une situation où la distribution des données en entrée d’un modèle de Machine Learning change, ce qui peut avoir pour conséquence des dégradations de ses performances globales.

voir la définition

Data Engineer

En tant que Data Engineers, leur rôle est essentiel pour aider à concevoir et mettre en œuvre des solutions efficaces de pipeline de données.

voir la définition

Data Governance

La Data Governance est le cadre stratégique et opérationnel qui définit les politiques, les procédures et les bonnes pratiques pour gérer de manière efficace et responsable l'ensemble des données au sein d'une organisation.

voir la définition

Data Lineage

Se dit de l'historique des transformations effectuées sur un ensemble de données à travers le temps et les différentes sources et systèmes par lesquels elles sont passées.Permet de suivre la provenance et l'intégrité des données, ainsi que de comprendre comment elles ont été transformées au fil du temps.

voir la définition

Data Literacy

La Data Literacy (la littératie de données ou la culture des données en français) désigne la capacité à identifier, collecter, traiter, analyser et interpréter les données afin de pouvoir prendre les décisions en se basant dessus.

voir la définition

Data Mesh

Un shift technologique, organisationnel et culturel vers une vision décentralisée de l’exploitation de la data en entreprise. S’articule autour de 4 piliers : Data Ownership by Domain, Data As A Product, Self-Serve Data Platform et Federated Computational Governance.

voir la définition

Data Platform

Se dit d’un ensemble d’outils, services et fonctionnalités prêts à l’emploi et réutilisables permettant la construction de nouveaux produits data et d’accélérer la création de valeur.

voir la définition

Data Product Manager

En tant que Data Product Managers, leur rôle est essentiel pour s'assurer que la Data est utilisée efficacement afin de résoudre les problèmes des utilisateurs, améliorer les produits et aider l'entreprise à atteindre ses objectifs.

voir la définition

Data Steward

Se dit d’une personne qui a la responsabilité de la qualité des données et des processus qui garantissent son contrôle et son utilisation efficace. Elle est entre autres responsable du glossaire business et est le premier point d’entrée de tous les utilisateurs de données. Son outil favori est le Data Catalog.

voir la définition

Data Storytelling

Le Data Storytelling c’est la capacité de raconter une histoire à l’aide de données. L’objectif est de faciliter la compréhension des résultats d’analyses de données pour une audience spécifique.

voir la définition

Data Strategist

Le Data Strategist joue un rôle crucial dans l'élaboration et la mise en œuvre de la stratégie data d'une entreprise.

voir la définition

Dbt

DBT est un outil de transformation de données conçu pour simplifier le processus de création et de gestion des requêtes SQL

voir la définition

Ecueils Data

Rares sont les entreprises n’ayant aujourd’hui aucune exploitation de leurs données, mais rares aussi sont celles qui ont réussi à passer son exploitation à l’échelle de toute l’organisation et à mettre la Data au cœur de leur activité.

voir la définition

Feature Store

Un Feature Store est une plateforme qui stocke et gère les caractéristiques (features) utilisées pour entraîner des modèles de Machine Learning, avec l'objectif de les rendre facilement accessibles et réutilisables.

voir la définition

Fresque de la Data

Un atelier collaboratif conçu chez Hymaïa destiné à familiariser les participants aux concepts fondamentaux de la Data

voir la définition

IA Generative

L'IA Générative est une catégorie d'algorithmes d'Intelligence Artificielle ayant la capacité de générer du texte, des images ou d'autres médias.

voir la définition

IA Responsable

L'Intelligence Artificielle Responsable fait référence à l'utilisation éthique, équitable, transparente et respectueuse de l'intelligence artificielle (IA) dans le développement, le déploiement et l'utilisation des systèmes d'IA.

voir la définition

Ingestion Batch

Ingestion de données qui se fait qu’une seule fois ou de manière récurrente, mais lors d’un job qui a un temps d’exécution fini. L’exemple le plus classique est une ingestion de donnée quotidienne qui doit se lancer tous les jours à 4h du matin.

voir la définition

ML Engineer

Un Ingénieur en Machine Learning est spécialisé dans la conception, la construction et le déploiement de modèles de machine learning pour résoudre des problèmes complexes et automatiser des processus décisionnels.

voir la définition

MLOps

Le MLOps est le processus d’automatisation du Machine Learning en utilisant les méthodologies DevOps. Son but est de faciliter la création, le déploiement et la gestion en production de systèmes de Machine Learning sur l’ensemble de son cycle de vie.

voir la définition

MLOps Engineer

Les responsabilités d'un ingénieur MLOps chez Hymaia sont l'automatisation du Pipeline, l'intégration la livraison continues, la surveillance et le logging, la gestion de la qualité des données, la conformité et la sécurité.

voir la définition

Modern Data Stack

Se dit d’un ensemble d’outils et technologies cloud utilisé pour la collecte, le processing, le stockage et l’analyse de données.

voir la définition

Poetry Python

Poetry est un outil de gestion de dépendances et de packaging pour Python.

voir la définition

Product Manager

Le Product Manager est responsable de la conception, du développement et de l'amélioration des produits, veillant à ce que ceux-ci répondent efficacement aux besoins des utilisateurs et exploitent judicieusement la Data.

voir la définition

Spark

Apache Spark est un framework de calcul distribué

voir la définition

Datadictionary

AI ACT

AI Ops

AWS

Analyse des erreurs

Analytics Engineer

CRISP-ML

ChatGPT

Citizen Data Scientist

Cloud

Data Analyst

Data As A Product

Data Business Model Canvas

Data Drift

Data Engineer

Data Governance

Data Lineage

Data Literacy

Data Mesh

Data Platform

Data Product Manager

Data Steward

Data Storytelling

Data Strategist

Dbt

Ecueils Data

Feature Store

Fresque de la Data

IA Generative

IA Responsable

Ingestion Batch

ML Engineer

MLOps

MLOps Engineer

Modern Data Stack

Poetry Python

Product Manager

Spark

Les formations Data & IA

Data Engineering sur AWS

Apache Airflow

L'IA au Quotidien : Gagnez en productivité dans votre entreprise

Les prochains événements Hymaïa

Forward Data Conference 2025

Les articles du blog

Forward Data Conference Paris 2024 : Participer à la 1ère édition de la conférence internationale Data & IA

Data Product Manager, un métier en pleine expansion

Penser sa Data Platform comme un Produit