Pilotage de projet open data

Anne-Laure Donzel

Ressources

Notes de cours

"je ne suis pas enseignante, je travaille ailleurs [à Datactivist]"
"les professionnels de l’open data doivent se positionner comme médiateur en accompagnant la réutilisation pour maximiser l’impact"

Séance 1 – Culture générale de l’ouverture des données

"on parlera pas mal de freins, on ne parlera quasiment que de ça"
"le chemin à parcourir est encore très long avant que l'open data soit une réalité pour l'ensemble des données"

la première mention de l'open data se trouve dans les documents de la NASA des années 1970, "vous imaginez que les données des satellites c'est très utile pour beaucoup de monde"
le terme réapparaît en 1990
"en France, on fait démarrer ça en 2010 pour le premier portail de collectivités, c'était la ville de Rennes"

  • une définition en 2005 ("The Open Definition")
    "l'ouverture des données, c'est d'abord l'accès, mais c'est surtout la réutilisation avec le moins de limites"
  • rencontre de Sébastopol en 2007, "au moment de la campagne d'Obama"
    "je vous laisserai regarder la vidéo de Lawrence Lessig"
    "on retrouve un peu les mêmes choses entre les principes de l'open data et les principes de Sébastopol"
    "regardez aussi la vidéo de Tim Berners-Lee où il fait scander à la foule "raw data now" (données brutes maintenant), c'est un aspect hyper intéressant"
  • Berners-Lee invente aussi le modèle en cinq étoiles en 2010, "c'est pas terrible mais c'est déjà pas si mal", "aujourd'hui on a cette idée où il vaut mieux un peu de donnée que pas du tout"
    "pour passer au RDF et au Linked Open Data, vous allez devoir passer sur des outils pas accessibles à tout le monde"

"les collectivités qui sémantisent leurs données, c'est encore très très rare"
"si vous téléchargez un fichier de subventions, il doit être tout le temps structuré de la même façon, pour pouvoir facilement comparer deux fichiers similaires"

"pourquoi il y a aussi peu de données touristiques en open data ? parce que les acteurs préfèrent les vendre pour ne pas tuer la poule aux œufs d'or"

données immobilières : "le DVF est récupéré par des sites commerciaux comme meilleurs-agents, qui basent leur offre commerciale dessus"

"les structures ont commencé à mettre des choses en place, et la loi est venue après, courir après ces structures-là" : loi CADA "extrêmement importante mais très mal appliquée", directives européennes "peu connues"

"l'article 15 de la DDHC de 1789 n'était quasiment pas mis en place jusqu'à très récemment", "la culture du secret reste très importante"

hors cours

Cf. Bardin: "l'instruction par la CADA des demandes d'accès, c'était un enfer : vous commencez par faire une demande, ils commencent par mettre 6 mois, ils commencent par répondre non"

Licence ouverte (LO) : "la date de dernière modification, personne ne la connaît, pour moi c'est totalement illusoire de la demander"

hors exceptions (consentement/loi), il faut anonymiser les données ouvertes

Séance 2 - Écosystème de l’open data

"j'utilise indifféremment les termes de portail ou de plateforme", "si vous voulez vraiment trouver des différences, vous pourrez dire qu'une plateforme a plus de fonctionnalités qu'un portail"
"je vous montrerai la partie backoffice"

effet démonstrateur : "quand vous avez un portail sur lequel il a déjà de la donnée, ça permet de montrer au service comment ça facilitera leur travail s'ils publient leurs données dessus", "ça donne un exemple"

"si vous cherchez des données locales sur data.gouv, c'est un peu compliqué, le moteur n'est pas très bon, c'est vraiment son point faible"

"dès que les gens trouvent une excuse pour ne pas publier leurs données en open data, ils ne publient pas"

Séance 3 – Qui se charge d'exploiter les données

"comment définiriez-vous la gouvernance des données ?"

  • souveraineté : contrôle, maîtrise
  • procédures : registre des traitements, des incidents
  • réglementaire : lois, actes admin
  • valorisation : pilotage, aide à la décision, évaluation
TP

"pour la séance, je vous ai sélectionné 4 chartes des données numériques", "vous allez voir de quoi ils parlent"
https://digipad.app/p/1146508/788d711633948

"souvent, l'étape qu'on oublie en mettant les données en ligne, c'est celle de la mise à jour : on est généralement sur des one-shots"

identification et priorisation : où sont les données qu'on veut ouvrir ? est-ce qu'on peut le faire (données personnelles à anonymiser, format, etc.) ? qu'est-ce qu'on priorise ?
certaines données doivent être ouvertes : "je vous mets au défi de trouver une seule donnée produite par un acteur public qui ne rentre pas dans ces catégories-là", "considérez qu'il faut publier à peu près tout, ce qui n'est pas simple et qui n'a pas vraiment de sens"
"c'est pour ça qu'on essaie de prioriser" :

  • critères de disponibilité : est-ce que les données sont déjà produites et accessibles ?
  • critères techniques : faut-il standardiser ? "ça peut être relativement chronophage"
  • critères d'usage :

Séance 4 - Présentation des projets