Traces numériques - Gestion des applications

Éric Sanjuan

"ce semestre, il n'y a pas de notions nouvelles"
"les traces c'est ce qu'on laisse sur le serveur, la gestion des applications c'est côté client", "les deux matières sont ensemble"
"pour la gestion des applications, c'est logique que vous soyez en distanciel", "j'aimerais bien que vous testiez les applications depuis chez vous"

"et bien sûr, on va mettre en place un Nextcloud"
"quand vous avez la main sur le système, on peut vraiment faire le registre de toute information stockée"

"il faut vraiment écrire vos rapports au fur et à mesure"
"avant de faire quoi que ce soit, notez tout ce que vous allez faire", "je m'attends à des Markdown kilométriques"

TP

"identifiez les traces laissées sur les systèmes suivants, par ordre décroissant d'importance" :

  1. les serveurs DNS
  2. le service web
  3. la base de données
  4. éventuels fichiers
TP

"Ce matin on travaille côté applications. Chaque application Nextcloud génère des données côté système et client. On commence par les applications par défaut."
"Il vous faut accéder la base de données (accessible via phpmyadmin) ncdgedu avec le login mgd23 et le mot de passe Vatuc!DEGe7"
"Pouvez vous établir le registre des données personnelles actuellement gérées par cette base de données? Répartissez vous les tables à analyser. Partagez le registre sur ce même NextCloud."
"Il est nécessaire de structurer ce registre selon le niveau de sensibilité de la donnée considérée."

"Moralité: une messagerie ce n'est pas pour archivage", "il faut conserver les informations sur fichier ou bases de données car la fonction d'archivage est en contradiction avec les contraintes de gestion des messages considérés par défaut comme données personnelles."
"Le rocket chat institutionnel n'a pas pour le moment cette contrainte. Les CGUs RENATER sont tellement restrictives que tout est archivé sur base de données pour au moins 3 ans."
"nous avons deux injonctions contradictoires"

"Une application installée par défaut qui pose problème est photos car par défaut les clients téléphone ont tendance ... à y sauvegarder les photos!"
"A votre avis, pourquoi existe-t-elle par défaut?"

TP

Avec un double objectif:
un nextcloud opérationnel en fin de matinée pouvant être ouvert aux M1
la rédaction de vos comptes rendus d'expérimentation à rendre sur e-uapv

les connexions à guacamole.univ-avignon.fr sont redirigées par NAT sur une IP interne où est hébergée dg-edu.eu
"si vous êtes dans une boîte qui a son infra interne, encouragez-les à maintenir leurs routeurs, ça va leur servir très très vite, on a de plus en plus de soucis de cloud"

"une fois sur la bonne machine, je regarde le fichier de configuration du serveur web Apache (/etc/apache1/sites-enabled/)" :

  • dg-edu.eu-le-ssl.conf (configuration Let's Encrypt)
  • dg-edu.eu.conf
    Apache ne va répondre qu'aux requêtes provenant de dg-edu.eu, "c'est un site qui ne peut pas marcher sans DNS"
    toutes les erreurs sont enregistrées (ErrorLog) dans un log
    "il utilise un dossier disque" (/var/www/dg-edu/)
    AllowOverride All : sans cette directive, "il est pénible de configurer le Nextcloud"
    "le droit s'applique sur un territoire donné, le RGPD revient constamment sur cette notion : où est la machine, où sont les données... pareil en Chine, et chez eux si vous démarrez un serveur DNS sans le déclarer à l'État vous risquez gros, et y'a une prime à la dénonciation"
    "ne faites pas confiance au Nextcloud, ne laissez pas la sécurité au niveau applicatif", "si vous êtes dans une structure de moins de 300 collaborateurs, je trouve que le plus simple c'est de faire ça à la main"

"on a quelques inquiétudes sur la bibliothèque de Let's Encrypt, elle n'est pas tout à fait mise à jour", "le jour où on trouvera une faille sur ce code, c'est la panique sur les deux tiers du web, c'est trop populaire"

"dans le droit on pose la question de "où", mais sur internet il faudrait plutôt se demander "qui" a accès" : ls -lh /var/www/dg-edu
"on a un dossier data qui a l'air sensible, l'utilisateur qui y a accès ce n'est pas l'admin mais www-data" (c'est Apache)
drwxr-xr-x : a priori, tous les utilisateurs de la machine guacamole ont le droit de lecture, "ça fait peur"
le dossier data contient un fichier index.html vide

  • Nextcloud fonctionne comme Azure : les fichiers téléversés sont directement stockés sur le disque du serveur, contrairement à Google Drive (BigTable) et Salesforce (Oracle, "et finalement leurs BDD relationnelles ça leur coûte moins cher que Google et leur NoSQL")
  • où sont les fichiers ? "il y a un dossier config mais c'est un pot de miel", "tout le monde essaie d'attaquer votre config.php de façon évidente"
    - -rw-r----- : seul l'admin peut écrire ce fichier (et seul l'admin + le groupe www-data a accès en lecture)
    - 'datadirectory' => '/srv/ncdgedu/' "on va voir si les fichiers y sont vraiment"
    - le mot de passe de la BDD ('dbpassword') est stocké en clair
    le dossier /srv/ncdgedu/ contient effectivement les données, qui ont les mêmes autorisations que data (mais pas le dossier en lui-même, qui est drwx------)
  • "moi j'ai enlevé la lecture à tous sur mes fichiers, je ne sais pas pourquoi ce n'est pas par défaut"
  • "il faudrait modifier les droits par défaut des dossiers, ou alors les corriger manuellement" (chmod -R)

"l'an dernier on a vu les traces des applications locales, on s'est beaucoup focalisé sur les cookies"

  • "la société qui a vraiment eu un problème avec ça, c'était Critéo qui est allé très loin dans le partage des cookies", "et y'a eu la surcharge de la gestion du consentement, certains sites américains ont préféré bloquer leur accès"
  • "mais les cookies c'est chez moi, ce n'est pas ce qui m'inquiète le plus"
    "et puis il y a les traces laissées à l'externe", "dans vos rendus c'est ça qui va m'intéresser le plus" :
  • FAI (Renater) et DNS (Gandi), "les deux voient pas mal de choses"
  • infrastructure : NAT (DOSI) "une fois que vous atteignez l'infrastructure", service web "dans notre cas on a regardé Apache", "on a vu qu'il y avait un compte DOSI, y'a moi, Jourlin, Fezzi, d'autres profs..."
  • application proprement dite :
    - fichiers distants : Nextcloud, Microsoft Azure
    - bases de données : "vous avez vu que Nextcloud laisse beaucoup de traces", Google et Salesforce
    "la législation sur les cookies, finalement, ça n'a pas gêné les développements des plus gros, ça a même renforcé la dépendance"
Questions
  1. Intérêt/inconvénient de proposer le cryptage (sic) des fichiers par l'utilisateur sur le Nextcloud ?
  2. Intérêt/inconvénient de laisser ce Nextcloud sur l'infrastructure de l'université ?
  3. Comment ajouter un administrateur étudiant (au niveau du service web) ? Quels intérêts/inconvénients ?

Réponses en commun :

  1. Arguments en faveur : Droit au chiffrement (art. 30 LCEN/art. 8 CEDH), moins de responsabilité pour l'admin ("c'est l'argument de Microsoft") ; en défaveur : complicité en cas d'usage illicite ("on a eu des enquêtes, sur des journalistes"), risque de perte de données en cas de perte des clés