Séminaire - Data management (Audrey Lamy Martinot)

Audrey Lamy Martinot, 15 novembre 2024

  • plus de 25 ans d'expérience dans le domaine de la data
  • a créé sa propre entreprise (Dataacteur)

"un IT, peu importe ce qu'il fait, data engineer ou fullstack, pour moi c'est un métier, donc c'est hors du data office"
"le juridique aussi, les DPO, c'est du métier"
"et le data steward, il est dans le métier mais il s'intéresse à la data, ça sera leur référent ; il aura un rôle de maîtrise d'ouvrage sur les données, en théorie"
"j'ai fait une formation (cours du soir au CNAM) pour comprendre comment aider les métiers à formuler leurs besoins"
"comme j'avais une vue décisionnelle, j'ai pu voir la data dans sa globalité"

"quel est lien que vous faire entre DPO et data ?"
"quel différence on ferait avec un commercial qui vend par la connaissance des données et les visites de terrain ? il n'y a pas vraiment de différence"
"les DPO protègent les données mais surtout les individus, c'est pour ça que je le sors de la data ; c'est plus une conséquence qu'un vrai lien"

"le data analyst va retravailler les données, comprendre le besoin auquel il doit répondre"
"ensuite le data engineer va récupérer les données ou les retravailler, il y a un binôme entre l'analyst qui dit ce dont on a besoin et l'engineer qui répond à ces besoins"
"enfin, il faut poser des modèles mathématiques, et ça c'est le data scientist"

"je suis souvent Chief Data Officer externalisé pour les entreprises"

"réalisez le trésor à votre disposition" : "seulement 32% des données sont exploitées par les entreprises"
"dans des secteurs spécifiques comme l'industrie, on tombe à 20%, la marge de manœuvre est quand même énorme"
"et par contre, les entreprises ont tendance à stocker 100% des données, voire 110%, on sait jamais"
"selon la Commission européenne (7 mars 2023), la transition numérique pourrait créer jusqu'à 1 million d'emploi supplémentaire d'ici à 2030"
"et malgré tout ça, on a une pénurie de talents"

"pourquoi conquérir ce trésor ? je vous donne 4 grands axes" :

  • vision client "pour qu'il se sente plus choyé, ou pour lui permettre d'innover"
  • vision organisation : "pour augmenter son CA bien entendu, mais aussi pour prendre des décisions plus éclairées, il y a des études qui montrent que les décideurs ont peur des données car ils ne savent pas si elle est d'assez bonne qualité"
  • excellence opérationnelle : "je vais faciliter le process, on va clairement réduire les actions chronophages, ça je le vis tout le temps"
  • maîtrise des risques

"la notion de numérique, s'il vous plaît, sortez-là de votre tête : la donnée, elle peut se manifester partout"
"maintenant, si elle n'est pas numérique, c'est compliqué de l'utiliser"

vision opérationnelle, fonctionnelle, technique : "on parle de bases de données, mais pour que la vision technique soit la bonne, les deux autres visions sont essentielles"
"imaginez quelqu'un dans une chaîne de production dans une usine : lui n'a pas accès à des données comme vous l'entendez, mais son process opérationnel dans son quotidien, c'est ça sa donnée à lui, peu importe qu'elle soit stockée dans telle ou telle base"
"comment, fonctionnellement parlant, je vais récupérer cette information-là ? c'est ensuite qu'on se demande comment les stocker techniquement"
"j'espère que vous garderez ces 3 aspects en tête en sortant d'ici, gardez ces 3 casquettes et c'est comme ça que vous garderez une vraie vision de la donnée"

"où trouver ces données ? partout", "finalement, tout est donnée"
"le papier c'est aussi des données, y'a beaucoup d'entreprises qui sont encore sur ces supports", "et la matière grise : ce que vous avez dans vos têtes, ce sont des données"

"Le Data Management est le développement, exécution et la supervision de plans, de politiques, de programmes et de pratiques qui permettent de contrôler, de protéger et d'améliorer la valeur des actif de données et d'informations tout au long de leur cycle de vie" (The DAMA-DMBOK2 Data Management Framework)
"une donnée n'a de valeur que si elle utilisée par les métiers : une donnée stockée quelque part et mise de côté, elle sert à rien"

chaîne de valeur de la donnée :

  • Business Intelligence : "on va calculer les moyennes, l'écart-type tendance, qu'importe"
  • Data Mining "je ne sais pas exactement ce que je cherche, mais on va trouver"
  • Machine Learning "vous en avez entendu parler, je fais de la modélisation"
  • IA : "la frontière est souvent floue, ça dépend à qui on parle"
    "imaginez ça comme une échelle, en bas il y a la BI, et plus je monte plus je vais vers l'IA"

"ça c'est de la valorisation, ça répond à un besoin métier, mais dans le DMBOK on représente une autre chaîne de valeur, des méthodes pour faire du data management :"

  • architecture, modélisation et design, "c'est comme une maison"
  • stockage des données, "ensuite on va stocker des meubles"
  • sécurité, "ensuite on va mettre la serrure sur la porte"
  • interopérabilité, "on veut que les portes s'ouvrent, que les outils parlent entre eux pour ne pas refaire de la saisie"
  • gestion de documents et Master Data Management (pour véhiculer des référentiels)
  • entrepôts de données et BI, "c'est là qu'on fait le lien avec l'aspect valorisation", "pour que le métier puisse utiliser ces données au quotidien"
  • métadonnées : "si je vous dis un mot que vous ne comprenez pas, vous allez voir dans le dictionnaire : c'est ce qui se passe avec la métadonnée"
  • qualité des données "pour avoir une meilleure valorisation et ne pas embarquer l'entreprise à prendre de mauvaises décisions"
    "et vous voyez qu'au centre de tout ça, il y a le mot gouvernance"

"mon travail, c'est d'amener des méthodes pour que toute cette chaîne de valeur soit mise en place : et vous voyez que les méthodes et la valorisation ne vont pas l'un sans l'autre, dans un monde idéal, les méthodes précèdent la valorisation"

"quand on parle de gouvernance des données, on parle de stratégie, de principes, de politique", "on n'est pas du tout dans une vision produit"
"la donnée est un actif pour l'organisation à aligner sur les stratégies" :

  • piloter/optimiser un processus
  • réduire les tâches chronophages
  • proposer des tâches à plus forte valeur ajoutée
  • prendre des décisions mieux fondées, plus rapidement, plus automatisées/industrialisées
  • partager des connaissances avec des collègues/client/tout l'écosystème
  • avoir confiance dans les chiffres

"sachez qu'une information c'est une donnée contextualisée : une donnée sans contexte ce n'est pas une information"

"quand on est data analyste, vous passez 90% de votre temps à récolter de la donnée ; en faisant du data management, vous simplifiez ce travail"