Inférence statistique

L'inférence statistique consiste à induire les caractéristiques inconnues d'une population à partir d'un échantillon issu de cette population. Les caractéristiques de l'échantillon, une fois connues, reflètent avec une certaine marge d'erreur les caractéristiques de la population.

Matériel à lire:

Pourquoi s'intéresser à l'inférence statistique? C'est en partie parce que la loi normale est très utilisée dans le monde des affaires et souvent à tord. Il convient de bien comprendre les hypothèses sous jacentes à son utilisation et les limitations liées.

Rappelons d'abord que c'est le théorème de la limite centrale qui donne un caractère universel à la loi normale. Ainsi, même dans le cas d'une v.a. distribuée selon une loi uniforme discrète (ex: un dé 6), la distribution de la moyenne échantionnale de plusieurs jets tend vers la loi normale. Exemple: 1 2 3 4 5 6 7 8 9 10 11 12

La loi normale est notamment utilisée en affaire pour:

Dans chacun de ces cas, le fait d'utiliser la loi normale pour représenter les probabilités dans un cadre général repose sur l'inférence d'observation particulières (échantillon) vers la population entière. C'est ce processus de généralisation que l'on appelle "inférence". Il y a des risques à faire une généralisation et il convient d'être prudent en regard de ce qu'on en déduit.

Par exemple, dans une enquête de satisfaction de la clientèle avec un questionnaire à 5 choix, on pourrait associer la distribution des choix au sein de la population à une loi normale. Puisque 99.73% est probabilité selon N(0,1) sont entre -3 et 3. Si on divise cet intervalle en 5 choix, on obtient les intervalles suivant avec les probabilités associées, calculées via WolframAlpha (WA).

Intervalle Probabilité N(0,1)
[-3,-1.8] 3.5%
[-1.8,-0.6] 23.8%
[-0.6,0.6] 45.1%
[0.6,1.8] 23.8%
[1.8,3] 3.5%

Tableau: cinq intervalles et les probabilités selon N(0,1)

L'interprétation est qu'on peut "normalement" s'attendre à ce que 3.5% des répondants cochent le meilleur des choix. Par exemple, si les résultats obtenus en compilant les formulaires receuillies montrent que 8% des répondants ont cochés le meilleur choix. On sera enclin à conclure que le niveau de satisfaction dépasse les attentes normales.

Dans le cas de la gestion des ressources humaines, on utilise souvent le même genre de stratégie pour caractériser les performances de employés. Cependant, les études récentes tendent à démontrer que les performances humaines ne suivent pas une lois normales.

Matériel à lire: