[Ecueils Data E2] - Ne pas avoir une équipe Data assez diversifiée

[Ecueils Data E2] - Ne pas avoir une équipe Data assez diversifiée

Toutes les compétences essentielles à la création de Produits Data de bout en bout sont-elles représentées au sein de vos équipes Data ?

Lorsque l’on parle d’équipe Data, les profils qui viennent assez souvent en tête sont les #datascientists et les #dataengineers. Mais ce n’est pas suffisant dans l’optique de créer des Produits Data qui apportent de la valeur business, et encore moins pour passer à l’échelle dans l’exploitation de la donnée de l’entreprise.

L’important n’est pas tant de savoir combien de personnes ou de métiers différents vous devez intégrer au sein de vos équipes Data, mais de construire une #datateam diversifiée, capable de créer des #dataproducts de bout en bout, sans laisser de côté les dimensions #business et #product.

Lorsque l’on parle d’équipe Data, les profils qui viennent assez souvent entête sont les Data Scientists et les Data Engineers. Ils ont en effet un rôle essentiel dans l’implémentation de Use Cases Data. Mais il y a de fortes chances pour que ces deux profils ne soient pas suffisants pour réellement pouvoir créer des Produits Data qui apportent de la valeur business, et encore moins pour passer à l’échelle dans l’exploitation de la donnée de l’entreprise.

Certains métiers semblent peu à peu disparaître au profit de nouvelles dénominations et pour s’adapter aux nouvelles tendances. D’autres en revanche reviennent sur le devant de la scène suite à la prise de conscience de certains manquements.

C’est notamment le cas du Data Analyst (certains utilisaient plutôt le terme Data Miner). La Data Analyse était une composante essentielle du business il y a quelques années. Les Data Analysts travaillaient moins l’aspect algorithmique et prévisionnel, et étaient vraiment focalisés sur la compréhension business via la donnée. Avec la vague de la Data Science, cette compétence s’est vue être petit à petit sortie des radars, face à la promesse de ces nouveaux profils et de tous ces algorithmes qui allaient révolutionner l’exploitation de la donnée. La conséquence négative de ces changements est qu’un fossé s’est peu à peu creusé entre le business et la Data. En effet, beaucoup de ces nouveaux experts de la donnée n’ont en réalité pas suffisamment de compréhension (ou d’intérêt ?) business, et sont plus intéressés par la performance algorithmique des modélisations.

C’est la raison pour laquelle beaucoup d’entreprises se réorganisent aujourd’hui afin de réintégrer cette composante essentielle et redonner ses lettres de noblesse à la Data Analyse. Data Scientist et Data Analyst ne sont donc pas les mêmes métiers, même si des synergies et des recouvrements peuvent être apparents.

Notre conviction est que l’important n’est pas tant de savoir combien de personnes ou de métiers différents vous devez intégrer au sein de vos équipes Data, mais bien de vous poser la question suivante: toutes les compétences essentielles à la création de Produits Data de bout en bout sont-elles représentées au sein de vos équipes Data ?

💡 La question à vous poser
Toutes les compétences essentielles à la création de Produits Data de bout en bout sont-elles représentées au sein de vos équipes Data ?

Les compétences en question peuvent s’avérer extrêmement nombreuses. Nous en recensons ici une dizaine qui apparaissent régulièrement comme des compétences clé dans l’exploitation de la donnée à l’échelle dans les entreprises :

  • Data Product Management : Challenger le QUOI et le POURQUOI avec les métiers, comprendre la donnée et être capable d’y accéder pour tirer les initiatives Data et les proposer au business ;
  • Data Engineering : Mettre en place des pipelines de données dans un environnement scalable et de confiance, en respectant les principes du Software Craftsmanship ;
  • ML / MLOps Engineering : Industrialiser, déployer et gérer des modèles de Machine Learning en production ;
  • Data Management / Stewardship : Veiller à ce que les données soient accessibles, compréhensibles et réutilisables, ainsi que s’assurerde leur qualité et prioriser des actions pour aller dans ce sens ;
  • Data Analyse : Requêter, croiser et analyser les données pour en tirer des enseignements et exposer des informations facilitant la prise de décision business ;
  • DataOps / Data Reliability Engineering : Assurer la gestion de la donnée à l’échelle de l’entreprise, garantir sa qualité et son exploitabilité, et faire preuve de proactivité dans l’identification et la communication des erreurs ;
  • Data Science : Identifier les croisements de données et les modélisations adéquates pour répondre à une problématique business définie ;
  • Data Visualisation : Exposer la donnée de manière claire et intuitive afin de faciliter la prise de décision informée par la donnée ;
  • Data Architecture : Penser, créer et faire évoluer des plateformes Data scalables.

Nous souhaitons ici mettre en avant une notion importante : celle de l’interdépendance entre chaque profil Data. Il ne s’agit pas de créer un monde siloté où un Data Scientist ne se contente que de créer des algorithmes sur des notebooks qu’il envoie ensuite aux Data Engineers pour qu’ils l’industrialisent une fois qu’il est satisfait. Au contraire, il nous paraît par exemple essentiel qu’un Data Scientist soit sensibilisé aux problématiques liées au Software Engineering et à l’industrialisation de modèles de Machine Learning, et qu’un Data Engineer comprenne les spécificités inhérentes au travail d’un Data Scientist. Il en est de même pour l’ensemble des profils Data, qui doivent absolument garder des frontières poreuses.

C’est la raison pour laquelle nous parlons plutôt des compétences clés requises pour la création de Produits Data de bout en bout, car une même personne pourra avoir plusieurs de ces compétences. Preuve supplémentaire de cette multidisciplinarité et porosité essentielle entre chaque profil : l’apparition de nouvelles appellations et nouveaux métiers tels que le Machine Learning Engineer, le MLOps Engineer, ou encore le Data Reliability Engineer (le pan Data du Site Reliability Engineer). L’ordre dans lequel vous intégrerez ces compétences dépendra fortement de la maturité de vos équipes et de votreexistant. Nous attirons cependant votre attention sur deux aspects importants :

  • Intégrer la dimension Business & Produit au plus tôt. Un projet Data se perd dès que sa valeur business est elle-même perdue de vue ;
  • Construire votre socle de données de manière pérenne afin d’avoir de la donnée de qualité, dans laquelle les utilisateurs peuvent avoir confiance, et pour laquelle ils peuvent retrouver toutes les informations dont ils ont besoin (son origine, ses transformations, sa fraîcheur, etc.). Le manque de confiance dans la donnée est l’un des points de douleurs les plus fréquemment remontés par les utilisateurs.
💡 Notre recommandation
Construire une équipe Data diversifiée, sans laisser de côté les dimensions business et produit.

La diversité n’est pas qu’une question de compétences techniques. Elle est aussi apportée par des backgrounds différents. Vouloir recruter uniquement des profils venant des mêmes écoles est selon nous une erreur (nous y reviendrons notamment dans la section sur les biais), car vous risquez d’avoir des personnes ayant les mêmes modes de pensée et de fonctionnement. La diversité est cruciale dans la constitution d’une équipe Data, afin de challenger le statu quo et se remettre en question constamment.

Si vous souhaitez avoir l’ensemble des écueils à portée de main, rien de plus simple ! Vous pouvez télécharger notre eBook dédié directement en pdf, ou bien vous le procurer en version imprimée ou Kindle sur Amazon !

🙏 Cliquez ici si vous avez aimé cet article, aidez nous à gagner en visibilité sur Linkedin 🙏