Statistiques

1) Introduction

Le concept de variable statistique `x` sous-entend presque naturellement qu'il existe une succession de tirages de la variable statistique `x_1,x_2,x_3,...,x_n`, où l'indice de tirage s'apparente au temps qui s'écoule. C'est pourquoi il convient de préciser si la loi de probabilité de `x` dépend du temps ou non. Nous traitons ici seulement du cas où la loi de probabilité ne dépend pas du temps, d'aucune façon. Il s'agit donc de variables statistiques dites intemporelles. La loi est alors complètement défini par une distribution de probabilités des valeurs possibles de `x`, dont leur somme vaut `1`.

Cette hypothèse d'intemporalité est essentielle si on veut pouvoir découvrir la loi de probabilité de la variable. C'est elle qui lui donne un sens et qui donne un sens aux probabilités de prédiction et aux intervalles de confiances.

On traite le cas d'une variable discrète, cela signifie qu'elle désigne des classes dont apriori, l'ordre na pas de signification particulière. On renomme donc ses valeurs discrètes possibles par les premiers entiers, `x in {1,2,...,n}` et dans un ordre quelconque. La loi de probabilité est la liste des probabilités `p_1,p_2,...,p_n` où `p_i=bbbP(x"="i)` Les probabilités étant indépendantes et exhaustives :

`sum_(i=1)^n bbbP(x"="i) = sum_(i=1)^n p_i = 1`

2) Loi normale

La loi normale centrée réduite est la courbe de Gauss pour une moyenne égale à `0` et une variance égale à `1`.

`F(x) = 1/sqrt(2pi) e^(-(x^2)/2)`

La probabilité que la variable `x` de loi de probabilité `F` soit comprise entre `a` et `b` est obtenue en intégrant la loi de `a` à `b` :

`P(x "∈" [a,b]) =int_a^b F(x)dx`

On note l'écart type de `x` par l'expression `sigma`. Et nous avons :

`sigma^2 = sum_i(x_i-bar x)^2`

`P(x "∈" ["-"1,"+"1]) = 68%`

`P(x "∈" ["-"2,"+"2]) = 95.4%`

`P(x "∈" ["-"3,"+"3]) = 99.7%`

La loi normale de moyenne `m` et d'écart type `sigma` :

`F(x) = 1/(sigma sqrt(2pi)) e^(-1/2((x-m)/sigma)^2)`

`P(x "∈" [m"-"sigma,m"+"sigma]) = 68%`

`P(x "∈" [m"-"2sigma,m"+"2sigma]) = 95.4%`

`P(x "∈" [m"-"3sigma,m"+"3sigma]) = 99.7%`

Variable centrée réduite :

`(x -m)/sigma`

Dominique Mabboux-Stromberg
Septembre 2025