Statistiques descriptive: mesures dynamiques

Rappelons que l'objectif de la statistique descriptive est de décrire, c'est-à-dire de résumer ou représenter par des statistiques, les données disponibles lorsqu'elles sont nombreuses. Les données sont les valeurs prise par des v.a. sur un échantillon issu d'une population. Les tableaux et les graphes offrent plusieurs point de vues sur les données, mais il est souvent utile d'avoir des mesures numériques.

Commençons par observer qu'il existe des cas où les valeurs d'une v.a. sont statiques, c'est-à-dire qu'elles ne dépendent pas du temps:

Dans certains cas, la dépendance sur le temps n'est pas toujours connues d'avance. Par exemple, considérons un échantillon formé de 800 morceaux de un kilo de glace ayant été prélevés à différents endroits d'un glacier en Alaska. Pour chacun, on a les variables:

Il n'est pas évident de savoir s'il y a une dépendance entre p et t, ou entre d'autres variables. Dans ce cas, on peut choisir de considérer le temps t comme tout autre v.a. et non pas comme une variable indépendante. Il existe des méthodes statistiques permettant de caractériser les dépendances au sein des v.a., nous les aborderons plus tard.

S'il est clair que le temps apparait dans le contexte, le considérer comme une variable indépendante offre un point de vue particulier et souvent fort utile. On parle alors d'une série temporelle. C'est le cas de la valeur d'un titre coté sur le TSX, de la température extérieure en un endroit précis, de la position d'un avion dans le ciel, etc.

Nous avons déjà vue plusieurs exemples de représentations graphiques de séries temporelles. Nous allons maintenant nous intéresser à des mesures statistiques qui résument les données qui dépendent du temps.

Matériel à lire: