Par Pierre Baudin

Data Manager

Avec l’émergence de l’analyse des données, de l’intelligence artificielle et du machine learning comme les nouveaux piliers du commerce numérique, la capacité des créateurs et des consommateurs de solutions reposant sur ces éléments à «parler données» de manière commune est un véritable enjeu.

Tout comme l’alphabétisation et la capacité à écrire, lire et penser de manière critique, la data literacy, ou culture des données en français, est devenue essentielle dans la vie de tous les jours.

Être cultivé dans le domaine de la données signifie être capable de lire, utiliser, analyser et communiquer grâce aux données et de penser la donnée de manière critique.

Que ce soit un particulier concerné par l’exploitation de ses données personnelles ou un professionnel avec un besoin de prendre des décisions informées, la culture de la donnée est devenue nécessaire et parfois même indispensable.

Alors comment devenir data literate ?

Tout d’abord pas d’inquiétude, devenir data literate est important mais le niveau requis n’est pas forcément celui d’un expert. Dans le monde professionnel, il va notamment dépendre du rôle du collaborateur et de son exposition à la donnée. L’attente ne sera pas la même entre le Machine Learning Engineer et le Project Owner par exemple.

Comme pour l’apprentissage de tout nouveau langage, devenir data literate commence avant tout par la compréhension des termes de bases et des concepts clés.

Dans le cas de la donnée, les trois aspects de “vocabulaire” fondamentaux sont les suivants :

  • La gestion des données

On parle ici de data management (voir mes articles : data manager, c’est quoi mon métier ? et le data management, ça consiste en quoi ? )

  • L’analyse des données

Sans aller trop dans le détail, le domaine de l’analyse recense quatre grands types d’analyse (descriptive, caractéristique, prédictive et prescriptive) qui ont chacun leurs spécificités, leurs fonctions et leurs valeurs dans l’entreprise.

  • La mise en œuvre de la donnée valorisée dans un contexte

Il s’agit là de l’exploitation de la valeur inhérente des données pour répondre à un besoin économique et fournir une solution informée à un problème.

La science des données ou data science, fondations de la data literacy.

Une définition rapide et complète nous informe que la data science est un domaine interdisciplinaire qui utilise la méthode scientifique, des processus, des algorithmes et des systèmes pour extraire des connaissances à partir de données sous diverses formes.

À ne pas confondre avec l’intelligence artificielle, qui contient une énorme collection d’outils pour donner aux machines des comportements plus intelligent et le machine learning qui est un sous-domaine de l’intelligence artificielle et vise à donner aux algorithmes la capacité d’apprendre sans avoir été programmés de manière explicite.

Aucun texte alternatif pour cette image

La data science en pratique permet donc de découvrir des éléments d’information au sein des données. En plongeant dans ces informations, l’objectif du data scientist est de mettre en évidence et de comprendre des tendances et modèles complexes. Il s’agit ensuite de faire remonter à la surface ces informations qui pourront aider l’entreprise à prendre des décisions plus informées.

Pour finir, l’implémentation de la science des données et de culture de la donnée en entreprise repose sur des concepts similaires à la pyramide des besoins de Maslow.

À la base de la pyramide, on trouve la collecte de données, qui ensuite donne lieu au déplacement et stockage puis à l’exploration et la transformation des données. Si ces trois éléments de bases sont solides et que chacun soutien le suivant, de bons fondamentaux sont en place pour aller plus loin dans l’exploitation de la donnée. L’agrégation et la catégorisation suivent puis on commencera à pouvoir générer des modèles d’apprentissage et d’optimisation.

Aucun texte alternatif pour cette image
(Source : altares)

Cette pyramide des besoins en data science nous rappelle bien que sans de solides fondations, il sera de plus en plus complexe de franchir les niveaux supérieurs et de tenter de produire des résultats de qualité.

Pour conclure, devenir un lettré de la donnée est une aventure et la maîtrise de cette nouvelle langue requiert une prise de conscience et un apprentissage continu pour rester au contact de ce domaine en plein essor et plein d’évolutions fulgurantes. J’espère y avoir contribué à mon échelle avec ces quelques éléments pour commencer à “parler data”.

Envie d'en savoir plus ?

Nos experts ont réalisé ce guide complet sur la data !