Les grands principes de la data
Chaque data doit être maitrisée, c'est-à-dire que quelqu’un doit bien comprendre ce que chaque data recouvre. Quel cadre, quelle limite ? Comment la calculer ? La retranscrire ? Pour certaines données, c’est simple, pour d’autres, c’est plus coton (ah oui, bon exemple, le coton : eh bien, c'est une matière première parmi le 1600 recensées chez Decath).
Une fois que le cadre est bien posé, que le concept est clair, il reste une question capitale : est-ce qu’il est correctement déployé (et utilisé) par nos équipes ?
C’est la data gouvernance : autrement dit un ensemble de règles, un cadre que chaque personne en charge d’une donnée (le ou la data owner) doit suivre. L’objectif : assurer la bonne qualité de chacune des données.
Une fois que ce cadre est posé, les données recueillies (via les “outils sources”, là où elles sont directement entrées par les ingénieurs par exemple), il convient de les “faire parler” entre elles. Et ça, ça se fait via un datalake (un référentiel de données unique et centralisé). Il s’agit alors de s’assurer de la cohérence des données entre elles au sein d’une entreprise, mais aussi “d’enrichir la donnée” : croiser l’une avec une autre et idéalement, en tirer des conclusions (c’est la partie data analyse).
Par exemple, on peut ainsi croiser les typologies de produits vendus et le taux d’éco-conception. L’analyse des résultats peut permettre d’identifier si un périmètre est en retard sur le sujet, et identifier la raison de ce retard.
Et après, c’est fini ?
Presque. Reste à rendre ça visuel : c’est le rôle de la business intelligence. La data science, elle, se chargera d’observer les performances passées pour prévoir le futur.