Sociologie de la quantification

Ouassim Hamzaoui

"pour chaque séance, vous aurez un texte à lire"
examen : devoir sur table (rappel d'un article + question longue)
"rendre compte d'une argumentation et articuler une argumentation"

Ressources

Notes de cours

"ça ne sert à rien de faire un cours qui passe tous les courants en revue"
"je fais une intro surplombante et après on se rapprochera des chiffres, qui est la partie qui vous intéresse le plus"

Intro

aujourd'hui les chiffres sont partout
mais les chiffres ont toujours été dans nos vies :

  • au sens anthropologique, les sociétés humaines ont toujours utilisé les chiffres (dans une mesure différente d'aujourd'hui) ; on n'a pas d'exemple de société sans chiffre, il n'y a pas de langue sans nombre, et les enfants seraient capables de comprendre les nombres avant de savoir parler (Dehaene 2008)
  • au sens historique, l'apparition des pratiques de comptage coïncide avec l'émergence de sociétés complexes (= division du travail) de domination politique (= d'un centre spécialisé sur d'autres parties du corps social)

les savoirs managériaux (tout ce qui relève du management) reposent sur l'idée que tout ce qui peut être évalué doit l'être, car ce qui peut être mesuré peut être accompli

la socio de la quantification propose que :

  • les chiffres ne "sont" pas le réel mais une perspective de représentation du réel, comme "précaution méthodologique" : puisque ce n'est qu'une perspective, on peut débattre avant et après que le chiffre soit produit
  • les chiffres sont des constructions, mais ils ont "une forme de solidité", "y'a quelque chose derrière" : ils peuvent servir à conduire les gens où on veut, ils sont à la fois objet de connaissance et de gouvernement ("savoir et pouvoir sont toujours intimement liés")
  • les chiffres ne sont ni vrais, ni faux : ils sont le résultat d'un processus de quantification ("pour parler du chiffre, la socio de la quanti s'intéresse à ce qu'il y a autour du chiffre")

évolution historique :

  • lien entre le compte et le roi : "il faut compter ce que les gens doivent payer au souverain"
  • "c'est une évolution très tardive des sciences" : avant, les productions scientifiques ne recouraient pas systématiquement à la quantification ("l'échelle de Richter, l'échelle de la dépression, etc.")
  • plus récent encore, les quantifications du management : benchmarking, auto-évaluation
    et enfin "ce que j'appelle la datafication, une autre étape à l'ère des algorithmes"
    "difficile de dire aujourd'hui si c'est un changement simplement quantitatif ou qualitatif"

on tire 3 enseignements de cette évolution :

  • "la" mesure n'existe pas : donnée/obtenue, il y a plusieurs manières de mesurer
  • la mesure des choses est d'abord un acte de régulation : les "vrais" chiffres n'existent pas, "c'est comme des compromis"
  • la quantification, ce n'est que du social : on passe de la grandeur perçue ("il y a des chômeurs à indemniser") à une définition ("combien de gens sont concernés"), puis à un dispositif ("comment on compte les chômeurs"), et enfin à un chiffre qu'il faut contextualiser et estimer, pour rendre compte de la valeur perçue sur laquelle on s'est déjà accordé
    "en tant que sociologue de la quantification, les premiers chiffres du chômage sont surtout un reflet de la société qui a produit ce chiffre, et comment cette mesure a progressivement agi sur cette société"

Alain Desrosières, "le pape de la sociologie de la quantification en France, un vrai statisticien qui s'est rapproché de la sociologie bourdieusienne et de la violence symbolique des statistiques"

hors cours

on m'a cité Desrosières à mon entretien d'embauche pour Datactivist : "les données font tenir la réalité"

encore hors cours

Desrosières : la construction d’indicateurs de palmarès et de performance et la multiplication de statistiques micro-sociales à l’ensemble des sphères économiques et sociales est essentielle à l’Etat néolibéral
ça me fait penser à ce post Mastodon à propos des indicateurs PISA:

Le pilotage par indicateur c'est probablement la pire chose qui soit arrivée à l'humanité en matière politique depuis le fascisme du siècle dernier.

dans la quantification :

  • on retrouve toujours des techniques et des pratiques : une "myriade" de systèmes routinisés
  • il y a aussi des conventions : la négociation entre acteurs (et donc les compromis) précède la mesure
    comment vérifier leur fiabilité ? Pour Desrosières, "il faut trouver un langage"
    ce qui rend réel la statistique, c'est sa circulation : "elle passe le test du social" et produit ainsi un effet sur le réel
  • pour adopter ces conventions, il faut disposer d'un pouvoir

l'hypothèse de Supiot : passer d'un gouvernement par la loi à la gouvernance par les nombres

Big data et statistique publique

"comment la fonction publique voit cette nouvelle technique qui produit de la donnée ?"

Quelle place pour la data science et les big data au sein de la statistique publique ? (Combes & Givord)

"au moment de l'éclatement de la bulle internet, Google va prendre une décision fondamentale : celle de conserver l'historique de recherche des utilisateurs"
"auparavant, les données des utilisateurs n'étaient pas conservées"
Hal Varian, "l'économiste en chef de Google"
"tout ça est bien raconté par Shoshanna Zuboff"

hors cours

« l’emploi le plus sexy des dix années à venir sera statisticien » (Hal Varian, 2009, cité par cette note de lecture sur "Statactivisme" de J.C. Plantin)

le V de "vitesse", "ça veut dire la continuité, sans interruption ; on ne prend pas un instantané comme dans une enquête"

"une des missions du statisticien, c'est de coller au plus près du réel"

loi des grands nombres : si on choisit bien une partie d'un tout, on peut étudier le tout

ENSAE
INSEE : opérateur central de la statistique, rattaché à Bercy ("études économiques")
"à Bercy, on appelle les autres ministères les dépensiers"
DARES et DREES : services statistiques interministériels

Loi pour une République numérique (2016) : équilibre entre protection du secret des affaires, de la vie privée, et nécessité d'informer le public
l'INSEE est en droit de demander à ce que certaines informations soient collectées

les algorithmes s'affranchissent du lien linéaire entre les variables : le modèle progresse par effet de seuil
ici, les variables peuvent avoir des évolution très erratiques, et on ne saisit pas forcément le lien qu'elles ont entre elles : "pour les statisticiens, ça pose la question de l'intelligibilité du modèle"
autre problème : une partie de ces méthodes de traitement n'ont pas de visée explicative

Chris Anderson, "sorte d'essayiste égérie de la tech"
a écrit "The End of Theory" (Wired) en 2008 : "ce texte de Combes & Givors dit le contraire"

"les infrastructures informatiques, c'est comme le train et les routes : ce sont des investissements pérennes"
sur ça, l'INSEE a besoin d'un accompagnement extérieur : c'est la première lacune du métier de statisticien public

Données massives, statistique publique et mesure de l’économie (Blanchet & Givord)

"le problème du big data, c'est que c'est du big data"

mise à l'agenda du big data sous l'influence d'Eurostat et de l'ONU ("délicate incitation")

"dans ce texte, il n'est quasiment pas question des méthodes ou des infrastructures, on ne parle que de la donnée"

suivi conjoncturel = vélocité
"il y a un problème d'instabilité et de pérennité, et aussi de rétroaction"
"Google Flu a marché au début, mais on suppose que ça a arrêté de fonctionner à cause des évolutions incessantes du moteur de recherche : si les résultats changent, on va forcément changer les requêtes aussi, c'est trop instable pour y baser une métrologie"

mesure des prix = volumétrie
"les statisticiens ne sont pas des révolutionnaires, leurs méthodes sont très pragmatiques"
ils consolident leur ancien modèle de mesure en intégrant des données sur un domaine spécifique

mesure de l'économie numérique => "c'est un secteur trop nouveau, on n'arrive pas à le mesurer" = variété
étude britannique : mesurer l'importance des produits digitaux
étude néerlandaise : repérer toutes les structures qui utilisent des outils digitaux, même si leurs produits ne le sont pas
"les résultats ne sont pas comparables"

"l'idée majeure à retenir, c'est que le big data n'est pas une recette miracle"
"l'exemple le plus probant, c'est celui des tickets de caisse, or c'est la donnée la plus structurée, complètement homogène, c'est donc pas tant de la big data du point de vue de la variété"

hors cours

cf. Salvaggio : "In pure terabytes, the vast majority of archived human knowledge is sales receipts."

La ‘science des données’ à la conquête des mondes sociaux - ce que le ‘Big Data’ doit aux épistémologies locales (Dagiral & Parasie)

  1. contexte de questionnement : on n'imaginait pas que l'informatique serait aussi répandue, et pourtant elle a "coïncidé"
  2. question : pourquoi ?
  3. réponses :
    1. c'est une rupture épistémologique (pour les promoteurs du big data)
    2. pas tant que ça (pour les chercheurs en sciences sociales)
  4. critiques des réponses : ça n'explique pas l'extension actuelle du phénomène
  5. positionnement de la recherche : sous l'angle des STS, on voit que les techniques de big data se sont bien répandues, mais sans nécessairement entraîner de remise en cause des épist. locales : au contraire, elles s'y sont adaptées
  6. perspective : on se trompe avec le big data, il faut parler science des données
  7. hypothèse : en parlant de science des données, il sera plus simple de démontrer que si le big data s'est autant répandu, c'est bien grâce à sa "relative ouverture" aux mondes sociaux
  8. méthodo :
    1. historique
    2. R
    3. enquête auprès des datajournalistes/datahealth
  9. administration de l'argumentation :
    1. tradition valorisée
    2. caractérisation des principaux traits
    3. réception et mise à l'épreuve

il existe un mouvement pour l'analyse des données à l'influence croissante

"les statisticiens veulent connaître le monde social avec le plus d'objectivité possible"
"s'ils viennent déterrer cette notion d'analyse de données, c'est parce que leur objectivité est remise en question : en gros ce ne sont plus les boss"

"Tukey dit : arrêtez de penser que la quintessence de votre métier, c'est de produire des données propres ; allez chercher les données sales, pas seulement dans les administrations, mais chez les acteurs de tous les secteurs"
"le message de Cleveland est très similaire sur le fond mais résonne différemment : soit on se fait baiser, soit on s'adapte"