Analyse en ligne (OLAP) et visualisation
Noé Cécillon
"je vais vous montrer comment visualiser des choses intéressantes à partir des données"
"cette séance je vais parler moi, les suivantes ce sera à vous d'appliquer"
analyse en ligne : "c'est vraiment pas la partie principale du cours"
OLAP = Online Analytical Processing, "bien orienté commercial"
en général, les organismes commerciaux sont capables de collecter énormément de données -> une fois ces données collectées, il faut pouvoir "en tirer des choses bénéfiques" (tendances, informations...)
l'OLAP est orienté analyse multidimensionnelle : données numériques, textuelles, spatiales... "souvent on les représente sous la forme d'un cube"
"c'est plutôt complexe à traiter" : l'objectif des systèmes d'OLAP est d'optimiser leur stockage ("beaucoup plus que les bases relationnelles"), leur exploration...
étapes :
en formatant les données en cube, on va pouvoir les découper et ne garder que certains éléments, "mettre des filtres en quelque sorte"
un cube est composé de couches ajoutant chacune des dimensions supplémentaires
techniques d'analyse : "je vous cite les 3 plus populaires"
Elastic Stack (ELK) : Beats, Logstash, Elasticsearch, Kibana
"on va principalement se concentrer sur Kibana" :