Sociologie de la quantification
Ouassim Hamzaoui
"pour chaque séance, vous aurez un texte à lire"
examen : devoir sur table (rappel d'un article + question longue)
"rendre compte d'une argumentation et articuler une argumentation"
"ça ne sert à rien de faire un cours qui passe tous les courants en revue"
"je fais une intro surplombante et après on se rapprochera des chiffres, qui est la partie qui vous intéresse le plus"
aujourd'hui les chiffres sont partout
mais les chiffres ont toujours été dans nos vies :
les savoirs managériaux (tout ce qui relève du management) reposent sur l'idée que tout ce qui peut être évalué doit l'être, car ce qui peut être mesuré peut être accompli
la socio de la quantification propose que :
évolution historique :
on tire 3 enseignements de cette évolution :
Alain Desrosières, "le pape de la sociologie de la quantification en France, un vrai statisticien qui s'est rapproché de la sociologie bourdieusienne et de la violence symbolique des statistiques"
on m'a cité Desrosières à mon entretien d'embauche pour Datactivist : "les données font tenir la réalité"
Desrosières : la construction d’indicateurs de palmarès et de performance et la multiplication de statistiques micro-sociales à l’ensemble des sphères économiques et sociales est essentielle à l’Etat néolibéral
ça me fait penser à ce post Mastodon à propos des indicateurs PISA:
Le pilotage par indicateur c'est probablement la pire chose qui soit arrivée à l'humanité en matière politique depuis le fascisme du siècle dernier.
dans la quantification :
l'hypothèse de Supiot : passer d'un gouvernement par la loi à la gouvernance par les nombres
"comment la fonction publique voit cette nouvelle technique qui produit de la donnée ?"
"au moment de l'éclatement de la bulle internet, Google va prendre une décision fondamentale : celle de conserver l'historique de recherche des utilisateurs"
"auparavant, les données des utilisateurs n'étaient pas conservées"
Hal Varian, "l'économiste en chef de Google"
"tout ça est bien raconté par Shoshanna Zuboff"
« l’emploi le plus sexy des dix années à venir sera statisticien » (Hal Varian, 2009, cité par cette note de lecture sur "Statactivisme" de J.C. Plantin)
le V de "vitesse", "ça veut dire la continuité, sans interruption ; on ne prend pas un instantané comme dans une enquête"
"une des missions du statisticien, c'est de coller au plus près du réel"
loi des grands nombres : si on choisit bien une partie d'un tout, on peut étudier le tout
ENSAE
INSEE : opérateur central de la statistique, rattaché à Bercy ("études économiques")
"à Bercy, on appelle les autres ministères les dépensiers"
DARES et DREES : services statistiques interministériels
Loi pour une République numérique (2016) : équilibre entre protection du secret des affaires, de la vie privée, et nécessité d'informer le public
l'INSEE est en droit de demander à ce que certaines informations soient collectées
les algorithmes s'affranchissent du lien linéaire entre les variables : le modèle progresse par effet de seuil
ici, les variables peuvent avoir des évolution très erratiques, et on ne saisit pas forcément le lien qu'elles ont entre elles : "pour les statisticiens, ça pose la question de l'intelligibilité du modèle"
autre problème : une partie de ces méthodes de traitement n'ont pas de visée explicative
Chris Anderson, "sorte d'essayiste égérie de la tech"
a écrit "The End of Theory" (Wired) en 2008 : "ce texte de Combes & Givors dit le contraire"
"les infrastructures informatiques, c'est comme le train et les routes : ce sont des investissements pérennes"
sur ça, l'INSEE a besoin d'un accompagnement extérieur : c'est la première lacune du métier de statisticien public
"le problème du big data, c'est que c'est du big data"
mise à l'agenda du big data sous l'influence d'Eurostat et de l'ONU ("délicate incitation")
"dans ce texte, il n'est quasiment pas question des méthodes ou des infrastructures, on ne parle que de la donnée"
suivi conjoncturel = vélocité
"il y a un problème d'instabilité et de pérennité, et aussi de rétroaction"
"Google Flu a marché au début, mais on suppose que ça a arrêté de fonctionner à cause des évolutions incessantes du moteur de recherche : si les résultats changent, on va forcément changer les requêtes aussi, c'est trop instable pour y baser une métrologie"
mesure des prix = volumétrie
"les statisticiens ne sont pas des révolutionnaires, leurs méthodes sont très pragmatiques"
ils consolident leur ancien modèle de mesure en intégrant des données sur un domaine spécifique
mesure de l'économie numérique => "c'est un secteur trop nouveau, on n'arrive pas à le mesurer" = variété
étude britannique : mesurer l'importance des produits digitaux
étude néerlandaise : repérer toutes les structures qui utilisent des outils digitaux, même si leurs produits ne le sont pas
"les résultats ne sont pas comparables"
"l'idée majeure à retenir, c'est que le big data n'est pas une recette miracle"
"l'exemple le plus probant, c'est celui des tickets de caisse, or c'est la donnée la plus structurée, complètement homogène, c'est donc pas tant de la big data du point de vue de la variété"
cf. Salvaggio : "In pure terabytes, the vast majority of archived human knowledge is sales receipts."
il existe un mouvement pour l'analyse des données à l'influence croissante
"les statisticiens veulent connaître le monde social avec le plus d'objectivité possible"
"s'ils viennent déterrer cette notion d'analyse de données, c'est parce que leur objectivité est remise en question : en gros ce ne sont plus les boss"
"Tukey dit : arrêtez de penser que la quintessence de votre métier, c'est de produire des données propres ; allez chercher les données sales, pas seulement dans les administrations, mais chez les acteurs de tous les secteurs"
"le message de Cleveland est très similaire sur le fond mais résonne différemment : soit on se fait baiser, soit on s'adapte"