Probabilité: concepts de base

La théorie des probabilité nous donne des moyens pour mesurer quantitativement les chances qu'un événement se produise. C'est donc un outil fort intéressant pour les affaires. Cependant, il y a plusieurs obstacles à son utilisation:

Notre mémoire sélective et l'instinct de survie fait que les humains craignent plus les événements qui les ont affectés récemment. Par exemple, on craint de prendre l'avion lorsqu'il y a eu récemment un crash. Or, la probabilité de mourrir en avion est infime par rapport aux autres moyens de transport. En finance, s'il y a eu un crash récent, on se prépare au prochain. A l'opposé, si la croissance dure suffisamment longtemps, on devient insouciant. C'est le cas actuellement au Canada avec le marché immobilier et aussi avec les taux d'intérêts. Ces derniers baissent depuis 1981, toute une génération n'a connue que ça. On arrive à croire que les banques ont un contrôle complet sur les taux. Ça porte à mal mesurer les chances d'une croissance soutenue des taux pour une longue période. C'est ignorer ce que nous disent les données historique.

Le problème de la disponibilité des informations est souvent sous-estimé. Il est fréquent de ne pas avoir suffisamment d'information pour appliquer les méthodes de la probabilité. On assemble des larges banques d'informations, mais on a rarement toute les informations. De plus, on est jamais complètement certain de la pertinence et de la qualité des informations sur lesquelles on base notre jugement. En outre, on a rarement la bonne information au prix qu'on est prêt à payer...

Malgrés tous ces obstacles, il est essentiel d'utiliser la probabilité parce qu'on est dans un univers de données et que les autres les exploitent. L'ignorer c'est se mettre automatiquement en désavantage face aux compétiteurs.

Matériel à lire:

Problème de Monty-Hall

Nous allons considérer ce problème classique pour mieux comprendre la nature des difficultés en probabilité et introduire des méthodes de calcul.

Il existe plusieurs approche pour solutionner ce problème:

Probabilité: lois

Une distribution de probabilité caractérise complètement les valeurs prises par une v.a. au sein d'un échantillon ou d'une population. Dans le cas d'un échantillon on parle d'une distribution échantillonnale et on peut toujours la représenter par un tableau ou un histogramme de fréquences. C'est plus compliqué dans le cas d'une population où il est souvent difficile d'expliciter tous les cas possibles. On utilise alors un modèle théorique donné par une formule mathématique qu'on appelle loi de probabilité.

Il existe des dizaines de lois de probabilité. Le processus usuel pour affecter une loi particulière à une v.a. est:

Matériel à lire:

Voici un plus large éventail de lois classiques disponible sur Wolfram Alpha:

Il existe de multiple outils logiciels pour calculer des probabilités et faire des statistiques. SAS et R sont les plus connus, mais plusieurs langages de programmation, tel Python, offre une large gamme de fonctionalités avec le bénéfice de pouvoir s'extensionner à l'infinie. Les logiciels et moteurs de calcul mathématique offrent aussi des possibilités de calcul de probabilité et statistique. C'est le cas de Matlab, Maple et Wolfram Alpha.

Voici quelques exemples de calcul fait avec les outils de probabilité et statistique de Wolfram Alpha:

Le cas du jeu américain de lotterie powerball est intéressant pour discuter de la difficulté des humains à appréhender rationnellement les probabilités. Dans ce jeu, il y a environ un chance sur 25 de gagner. Le cas une boule étant le plus fréquent. Le cervaux humain raisonne linéairement. Par exemple, Montréal est environ le double de la distance pour aller à Québec, il faut donc 2 fois plus de temps pour y aller. Ainsi, l'intuition linéaire nous dit inconsciemment que gagner avec 5 boules est environ 5 fois plus difficile. Si on traduit le jugement linéaire en probabilité, on aurait une chance sur 2500 de gagner avec 5 boules. En regardant les chances de gagner avec 5 boules, on voit immédiatement que c'est beaucoup plus rare que ça (environ 1 sur 292 millions).

Les chances de gagner varient exponentiellement avec le nombre de boules. Or, notre cerveau n'est pas programmer pour la croissance exponentielle car elle n'est jamais viable sur une longue période. Dans la réalité, toute croissance exponentielle est temporaire et se termine généralement par une implosion catastrophique. Une exemple typique est la reproduction exponentielle des petits mammifères qui se termine abruptement par une épidémie, une famine, etc. Une bonne façon d'aider notre cerveaux à capter l'essence des changements exponentiels est de faire des analogies avec des phénomènes usuels qui sont linéaires. Dans le contexte de l'exemple du jeu powerball: en voiture à 100 km/h, il faut 15 minutes pour parcourir 25 km (cas gagner avec au moins une boule). Cependant, il faut 3 ans et 4 mois pour parcourir 292,201,338 km (cas gros lot).

Gagner un prix Gagner le gros lot
1 sur 25 1 sur 292 millions
15 minutes pour 25km 3 ans et 4 mois pour 292m de km
2$ d'essence 3 millions de $ d'essence
distance Chicoutimi à Falardeau 7300 fois le tour de la terre

Tableau: analogie powerball versus déplacement sur terre en km


L'infographe de la dette américaine en 2011 est un exemple de représentation graphique qui aide à mieux comprendre ce que représente les grands nombres.