Régression linéaire

Dans cette partie, on couvre les sujets suivants:

Afin de bien comprendre le concept, il est toujours préférable de faire un exemple manuel. Ainsi, reprennons l'exemple "linear fit {{1,2},{5,7},{3,3}}".

Nous avons 3 couples, donc x prends les valeurs 1, 5, 3 et y les valeurs 2, 7, 3.

L'équation de la droite de régression est y=mx+b, avec:

On a:

C'est-à-dire y = 1.25x + 0.25 , ce qui correspond bien au résultat de Wolframalpha.

Le coefficient de corrélation est cor(x,y) = cov(x,y)/(s(x)s(y)) = 3.3333/(sqrt(2.6666)*sqrt(4.6666)) = 0.945. Ce coefficient étant proche de 1, on en déduit que le modèle linéaire est représentatif de la relation entre x et y.

Remarque: même si le comportement d'une fonction est non linéaire, l'utilisation d'un modèle linéaire peut avoir un intérêt si on reste sur une courte échelle. Pour s'en convaincre, il est intéressant de revoir le concept de développement en série de Taylor. Il nous rappelle qu'on peut approximer une fonction différentiable au voisinage d'un point par un développement linéaire. L'erreur est alors proportionnelle à l'écart avec ce point, d'où l'importance de rester sur une courte échelle.