Inférence statistique

L'inférence statistique consiste à induire les caractéristiques inconnues d'une population à partir d'un échantillon issu de cette population. Les caractéristiques de l'échantillon, une fois connues, reflètent avec une certaine marge d'erreur les caractéristiques de la population.

Matériel à lire:

Pourquoi s'intéresser à l'inférence statistique? C'est en partie parce que la loi normale est très utilisée dans le monde des affaires et souvent à tord. Il convient de bien comprendre les hypothèses sous jacentes à son utilisation et les limitations liées.

Rappelons d'abord que c'est le théorème de la limite centrale qui donne un caractère universel à la loi normale. Ainsi, même dans le cas d'une v.a. distribuée selon une loi uniforme discrète (ex: un dé 6), la distribution de la moyenne échantionnale de plusieurs jets tend vers la loi normale. Exemple avec la distribution de la moyenne de n jets d'un dé à 6 faces: 1 2 3 4 5 6 7 8 9 10 11 12

La loi normale est notamment utilisée en affaire pour:

Dans chacun de ces cas, le fait d'utiliser la loi normale pour représenter les probabilités dans un cadre général repose sur l'inférence d'observation particulières (échantillon) vers la population entière. C'est ce processus de généralisation que l'on appelle "inférence". Il y a des risques à faire une généralisation et il convient d'être prudent en regard de ce qu'on en déduit. On a d'ailleurs déjà observé que la méthode VaR s'appui sur la loi normale pour caractériser le risque, alors que celle-ci sous estime la probabilité des événements rares. Or, le but est justement de protéger les actifs contre l'occurence de ceux-ci!

Exemple d'utilisation en RH: Dans une enquête de satisfaction de la clientèle avec un questionnaire à 5 choix, on pourrait inférer que la distribution des choix au sein de la population est une loi normale. Puisque 99.73% est probabilité selon N(0,1) sont entre -3 et 3. Si on divise cet intervalle en 5 choix, on obtient les intervalles suivant avec les probabilités associées, calculées via WolframAlpha (WA).

Intervalle Probabilité N(0,1)
[-3,-1.8] 3.5%
[-1.8,-0.6] 23.8%
[-0.6,0.6] 45.1%
[0.6,1.8] 23.8%
[1.8,3] 3.5%

Tableau: cinq intervalles et les probabilités selon N(0,1)

L'interprétation est qu'on peut normalement s'attendre à ce que 3.5% des répondants cochent le meilleur des choix. Par exemple, si les résultats obtenus en compilant les formulaires receuillies montrent que 8% des répondants ont cochés le meilleur choix. On sera enclin à conclure que le niveau de satisfaction dépasse les attentes normales.

Dans le cas de la gestion des ressources humaines, on utilise souvent le même genre de stratégie pour caractériser les performances de employés. Cependant, les études récentes tendent à démontrer que les performances humaines ne suivent pas une loi normale.

Matériel à lire:

Compétences visées:

Connaître
Le rôle de l'inférence statistique.