Statistique et qualité de la donnée

Jimmy Merlet

Notes de cours
...

"je mets rien sur Moodle, à vous de prendre vos notes"

2 écrits de 1h, en octobre et novembre

transformation économique et RSE

Concepts fondamentaux en statistiques
...

Intro
...

économétrie : un "outil d'analyse quantitative"
prédire ou mesurer d'après des caractéristiques pouvant influer sur des résultantes
modéliser la réalité

établir une relation, une corrélation
entre des variables explicatives ou covariables (x1 = âge, x2 = niveau de revenu, xi, etc.)
et une variable à expliquer (y = taux de réussite aux examens)

pour vérifier une relation linéaire entre y et x :
y = β0 + β1x1
β0 = constante
β1 = coefficient directeur ("on l'appellera α")
y = f(xi,...,xni,...,βn)
xn = variable pour 1 individu (n = nombre d'observations) avec x les variables ∀ i = 1

linéarisation

Présentation de l'application
...

(TD sur Moodle)

Annéex (consommation)y (revenu)
1102114
.........
12154178

Diagramme de dispersion
...

le diagramme de dispersion/de corrélation (scatter diagram) est un outil de contrôle et d'aide à la décision pour vérifier l'existence d'une relation/corrélation entre variables quantitatives

tester des hypothèses pour :

  • trouver l'origine d'un problème
  • améliorer la performance
  • etc.

Régression linéaire
...

Ici (sur le tableau du TD), la relation n'a pas une forme linéaire exacte (prédication précise de y)
yi = βxi + α
y ne dépend pas uniquement de x1, x2, etc.
il faut introduire de l'aléatoire : μ1
yi = βxi + α + μ1 (= terme d'erreur aléatoire avec E(μ1) = α)
i = 1, 2, ... n avec n = le nombre de données
plus la valeur de μ est grande, moins le modèle est précis (et plus il est mauvais)
même chose pour la somme des carrés des résidus