Qu’est-ce que c’est « être consultant data » ?

Être consultant data est bien plus qu’un simple métier, c’est être un véritable couteau suisse au service du monde. Avant toute chose, le métier de consultant est un métier Humain. Les qualités personnelles, l’ouverture d’esprit, la bienveillance, la capacité d’adaptation, l’honnêteté et la curiosité sont les qualités principales d’un bon consultant. Il faut être prêt à être en formation tout au long de sa carrière que ce soit au niveau des technologies mais aussi et surtout des domaines des clients de votre actuelle ou future entreprise. La veille technologique est aussi un élément important du métier de consultant data pour pouvoir conseiller le client avec les outils les plus adaptés techniquement, économiquement et disponibles au moment de la mission.

Le consultant data peut se décliner en plusieurs métiers mais dans cet article nous nous intéresserons plus particulièrement au data engineer, au data analyst et au data scientist. Une même personne peut faire ces différents métiers au cours d’une même mission ou d’une même carrière mais cela nécessite beaucoup de travail et de compétences transverses (technologique et métier).

Le data engineer :

Il est responsable et garant de la mise à disposition de la donnée. C’est lui qui va choisir comment récolter la donnée, la nettoyer, la consolider et la rendre accessible (de manière anonymisée ou pas en fonction de la RGPD) sous la forme la plus adéquate pour les analyses de ces collaborateurs.

Pour mener à bien sa mission, il doit maîtriser des langages de programmation qui lui permettront de mettre en place ces logiques de flux : R, python, Scala, Java, SQL, … Des plateformes Big data comme Hadoop ainsi que des outils ETL : Talend, Informatica, Nifi, etc…

Sans lui, les data scientists et data analysts n’auraient pas de données propres et directement structurées correctement à traiter. Il est donc à la base de tout et permet aux data analysts et aux data scientists de se concentrer sur l’essentiel de la donnée.

Le data analyst :

Il exploite les données mises à disposition par le data engineer pour permettre la prise de décision au niveau des métiers par la création de rapports et/ou d’indicateurs : les KPI (Key Performance Indicator). Pour cela, il peut être amené à retravailler la donnée et à en rajouter. Il a besoin de connaître les outils du data engineer. De plus, il doit maîtriser le domaine dans lequel il intervient, les méthodes statistiques simples et les outils de BI comme Power BI, Tableau Software, Qlik Sense, Superset, etc…

Ce métier nécessite une très bonne communication, curiosité et un esprit de synthèse pour comprendre la donnée et créer des indicateurs clés avec des visuels utiles et pertinents au client pour l’aider dans sa prise de décision.

Le data scientist :

Le métier de data scientist est à la frontière entre le data engineer et le data analyst mais il utilise en plus le machine learning pour aller plus loin dans le traitement et la recherche d’information dans la donnée. C’est lui qui va extraire l’information « cachée » de la donnée en traduisant une problématique métier en une problématique mathématique et statistique poussée. L’essor du Big data a permis au data scientist d’avoir un véritable terrain de jeu pour pouvoir mettre en place des analyses prédictives, des classifications, de la reconnaissance d’image, de sons et bien plus encore sur de gros volumes de données. Pour mener à bien sa mission, il va utiliser les outils de ces deux prédécesseurs mais pour coder, il utilisera par exemple, des notebooks comme Jupyter Lab, des outils de développement multi langage comme VS Code, des plateformes de Data science comme DSS de Dataiku, etc… C’est donc un mathématicien/statisticien plus poussé que le data analyst.

Conclusion

Même si le métier du data scientist est sous les feux des projecteurs depuis quelques années par rapport au data engineer et au data analyst, il ne faut pas négliger leurs importances pour autant ! Être data scientist n’est pas une fin en soi mais une possibilité d’évolution, non obligatoire pour être accomplie dans son métier de consultant data. Pour ma part, le métier de data analyst me permet de m’épanouir complètement. Je peux laisser la partie collecte, nettoyage et mise à disposition de la donnée, sans m’en vouloir et en sachant que ça sera très bien fait par le data engineer, pour pouvoir me concentrer sur la création de visualisations qui font appel à mon appétence pour le design sans me faire rentrer dans des modèles statistiques compliqués pour lequel je n’ai pas forcément l’envie de me pencher.

Être en mesure de traiter toutes les données existantes, de la manière la plus efficace pour répondre à des problématiques données est le travail d’une équipe pluridisciplinaire qui prend du temps. Toutes les parties prenantes d’un projet data doivent savoir écouter et comprendre les problématiques les unes des autres pour réussir à travailler ensemble et dans de bonnes conditions. Néanmoins, toutes les entreprises ne sont pas encore matures par rapport à ces pratiques data mais beaucoup font en sorte de s’armer de ce type de profils experts pour avancer vers une meilleure gestion de leurs données et savoir comment en tirer profit au mieux.

Merci à Mohamed Hassan de Pixabay pour l’image

(https://pixabay.com/fr/photos/d-affaires-se-connecter-coop%C3%A9ration-4838852/)

Pour aller plus loin :

https://datascientest.com/blog-data-ia-actualites

https://www.kdnuggets.com/

https://www.kaggle.com/