Vous avez encore

5 minutes

Retour
Yoann Benoit
Yoann Benoit
28/12/2022
[Ecueils Data E3] - Croire que la Culture Data s’arrête à l’équipe Data

Avez-vous tous la même définition des rôles, responsabilités et enjeux de la Data au sein de votre entreprise ?

Cet article décrit une démarche de formation et d’acculturation, et met l’accent sur l’importance de la communication pour accroître l’impact des initiatives Data.

Yoann Benoit
Yoann Benoit
3/11/2022
[Ecueils Data E2] - Ne pas avoir une équipe Data assez diversifiée

Toutes les compétences essentielles à la création de Produits Data de bout en bout sont-elles représentées au sein de vos équipes Data ?

Lorsque l’on parle d’équipe Data, les profils qui viennent assez souvent en tête sont les #datascientists et les #dataengineers. Mais ce n’est pas suffisant dans l’optique de créer des Produits Data qui apportent de la valeur business, et encore moins pour passer à l’échelle dans l’exploitation de la donnée de l’entreprise.

L’important n’est pas tant de savoir combien de personnes ou de métiers différents vous devez intégrer au sein de vos équipes Data, mais de construire une #datateam diversifiée, capable de créer des #dataproducts de bout en bout, sans laisser de côté les dimensions #business et #product.

Yoann Benoit
Yoann Benoit
27/10/2022
[Ecueils Data E1] - Voir les équipes Data comme des “vendeuses de services”

Vos #datateams sont-elles encore obligées de convaincre vos directions business de l’intérêt de travailler avec elles ?

Un changement de perspective sur la place de la #data dans l’entreprise est nécessaire ! Le #chiefdataofficer et les équipes Data doivent passer d’un positionnement de “vendeurs de services” à celui de “partenaires privilégiés” du business pour les aider à prendre des décisions par la donnée.

L’objectif est de mettre la #data au cœur des enjeux stratégiques de l’entreprise et rompre le silotage entre les équipes Data et le reste de l’organisation.

Ces principes ne sont pas sans rappeler ceux du #datamesh, qui peut servir de source d’inspiration dans ce changement de paradigme.

Yoann Benoit
Yoann Benoit
6/10/2022
[Ecueils Data E0] - 10 écueils limitant l’impact de la Data sur les produits et organisations

Rares sont les entreprises n’ayant aujourd’hui aucune exploitation de leurs données, mais rares aussi sont celles qui ont réussi à passer son exploitation à l’échelle de toute l’organisation et à mettre la Data au cœur de leur activité.

Data Literacy - 4 actions pour commencer à démocratiser la Data au sein de votre entreprise

Démocratiser la Data est l'un des enjeux majeurs de nombreuses entreprises aujourd'hui. C'est notamment l'un des objectifs du Data Mesh, dont l'un des piliers repose sur la gestion de données par domaine métier afin de simplifier leur utilisation et leur maintenance.

Par conséquent, pour assurer la gouvernance de la donnée sans avoir à augmenter le nombre des profils Data, il est nécessaire de former ses équipes et d’être capable de parler le même langage entre les profils techniques et non techniques.

C’est là où nous avons besoin de la Data Literacy.

Le Data Business Model Canvas

Utile, Utilisable, Utilisé ! Comment faire pour qu’un projet Data réponde à la règle des 3U ?

Nous vous proposons un support pour faciliter la phase de cadrage, qui constitue la première partie indispensable du cycle d’un projet Data.

C’est dès cette phase amont des projets qu’il faut créer un alignement entre toutes les parties prenantes. Embarquez donc les sponsors, les potentiels utilisateurs, les développeurs et toute personne qui pourra apporter des éléments pour faciliter et challenger vos réflexions concernant le problème à résoudre.

Yoann Benoit
Yoann Benoit
28/6/2022
Plus de 80% des projets data ne partent pas en production, et alors ?

De nombreux chiffres ont été publiés et font du bruit sur le taux de projets data qui échouent à aller en production et ne dépassent pas le stade du PoC (Proof of Concept) :

  • Un rapport de VentureBeat AI explique que 87% des projets Data Science ne vont pas en production
  • Gartner estimait en 2019 que 80% des projets d’IA de 2020 allaient rester à l’état de PoC, menés par des “sorciers” dont les talents ne sont pas compatibles avec une exploitation de la data à l’échelle de l’entreprise
  • Ce même rapport Gartner estime que seulement 20% des insights d’analytics vont réellement délivrer de la valeur en 2022

Mais au final, est-ce une si mauvaise chose que certains projets n’aillent pas plus loin ? La question mérite d’être posée.

Yoann Benoit
Yoann Benoit
21/5/2022
La Data n’est pas une fin en soi

Le monde de la Data a souvent été vu comme un univers parallèle peuplé de Data Scientists aux airs de licornes ou autres moutons à 5 pattes qui allaient magiquement faire faire des avancées incroyables aux entreprise grâce à leurs petits doigts.

La désillusion fut grande lorsque le temps du bilan a sonné : POCs qui duraient éternellement et échouaient à partir en production (ou bien à simplement apporter de la réelle valeur pour le business), manque d’appropriation de la donnée en dehors des équipes data, manque de confiance dans la provenance, la traçabilité et la qualité de la donnée, et projets tirés par la tech et pas suffisamment par la valeur business.

la data nouvel or noir pour les nuls
Franck Cussac
Franck Cussac
17/5/2022
Spark : quand faire un cache sur une DataFrame ?

Pour améliorer les performances de votre job Spark, vous avez probablement déjà pensé à ajouter un cache sur une ou plusieurs de vos DataFrames. C’est même peut-être devenu une habitude.

dataframe cache pyspark spark cache persist
Yoann Benoit
Yoann Benoit
11/5/2022
MLOps : les principes du DevOps appliqués au Machine Learning

Le terme MLOps (Machine Learning Operations) est de plus en plus souvent employé dans la communauté data et est rapidement devenu un concept central dans la mise en production et le passage à l’échelle de projets à base de Machine Learning.

Tâchons de comprendre ce qu’il y a derrière, d’où cela vient, et surtout pourquoi c’est maintenant devenu une nécessité.

mlops vs devops engineer
Benchmark Apache Spark : Préparation du test TPC-DS

Cette année, nous nous sommes lancés dans un projet de benchmark d’Apache Spark avec pour objectif d'être capable de déterminer les différences de temps d’exécution entre Spark avec Yarn et Spark sur Kubernetes. Nous partagerons nos différentes découvertes au fur et à mesure dans cette série d’articles.

Yoann Benoit
Yoann Benoit
22/4/2022
Produits Data Science - N’attendez pas le modèle parfait avant d’industrialiser !

Un produit Data Science étant avant tout un produit logiciel, les bonnes pratiques de Software Craftsmanship et de développement itératif et agile y ont toute leur place. Sauf que lorsqu’il est question du modèle de Machine Learning en lui-même, il est très courant de beaucoup moins respecter ces principes. Et se pose alors souvent la question fatidique : “stop ou encore ?”.

Yoann Benoit
Yoann Benoit
19/4/2022
Qu’est ce que l’IA Responsable?

“Responsible AI”, “Explainable AI”, “AI Fairness”, “Ethical AI”, etc. Tous ces termes prennent de plus en plus d’ampleur dans les discussions mais aussi dans les investissements des entreprises qui créent des produits incorporant de l’Intelligence Artificielle.

Que ce soit d’un point de vue business pour mieux comprendre le raisonnement derrière certains modèles “Black Box” et prendre de meilleures décisions, ou d’un point de vue sociétal ou environnemental, une réelle prise de conscience est en train de se dessiner autour de ce sujet.

#Passion

C’est la passion pour notre métier qui nous guide au quotidien. Cette passion est notre motivation intrinsèque.

#Intégrité

Nous sommes des êtres accomplis, qui prennent la responsabilité de leurs actions et idées.

#Pragmatisme

Nous sommes des doers, animés par un mindset agile et de test & learn. Nous faisons en sorte que actions débouchent sur des résultats concrets et mesurables.

illustration valeurs
Nos valeurs