La variance d’une variable aléatoire mesure sa dispersion autour de son espérance. L’inégalité de Bienaymé-Tchebychev et toutes les inégalités de concentration apportent des précisions sur cette dispersion.
I. Inégalité de Markov
Si X est une variable aléatoire à valeurs positives et si EX désigne son espérance, alors, pour tout réel a strictement positif :
PX≥a≤EXa
En notant μ l’espérance de X, cette inégalité est parfois écrite sous la forme :
pour tout réel k>0, PX≥kμ≤1k.
On en déduit en particulier que la probabilité que X prenne une valeur supérieure ou égale au double de son espérance est inférieure ou égale à 0,5.
II. Inégalité de Bienaymé-Tchebychev
L’inégalité de Bienaymé-Tchebychev permet de majorer la probabilité qu’une variable aléatoire X s’écarte de son espérance d’une quantité supérieure ou égale à une valeur donnée.
Si X est une variable aléatoire d’espérance μ et de variance V, alors, pour tout réel δ>0 :
P X−μ ≥δ≤Vδ2
On peut aussi l’écrire : pour tout réel k>0, PX−μ ≥kV≤1k2.
III. Une inégalité de concentration pour la moyenne
Soit n un entier supérieur ou égal à 2 et X1, X2, …, Xn un échantillon de taille n d’une loi de probabilité d’espérance μ et de variance V.
On note Mn la moyenne de cet échantillon, c’est-à-dire Mn=X1+X2+…+Xnn.
Alors, pour tout réel δ>0 :
P Mn−μ ≥δ≤Vnδ2
À noter
Ce résultat est une conséquence directe de l’inégalité de Bienaymé-Tchebychev et d’un résultat vu au chapitre précédent : la variance de Mn est VMn=Vn.
Méthode
Définir une taille d’échantillon en fonction de la précision et du risque choisis
Pour une certaine variété de pois de senteur, la probabilité d’obtenir une fleur blanche est égale à 0,25, la probabilité d’obtenir une fleur rose ou rouge est 0,75.
Combien faut-il observer de fleurs de cette espèce pour que la fréquence de fleurs blanches soit comprise entre 0,2 et 0,3 avec une probabilité supérieure ou égale à 0,99 ?
Conseils
En appelant n la taille de l’échantillon, c’est-à-dire le nombre de fleurs à observer, introduisez la variable aléatoire égale à la fréquence de fleurs blanches dans un échantillon de taille n et déterminez, en fonction de n, l’espérance et la variance de cette variable aléatoire.
Utilisez ensuite l’inégalité de Bienaymé-Tchebychev.
Solution
Soit n le nombre de fleurs à observer, Fn et Xn les variables aléatoires donnant respectivement la fréquence et le nombre de fleurs blanches dans un échantillon de taille n. On a Fn=Xnn et Xn suit la loi binomiale Bn ; 0,25.
La variance de Xn est VXn=n×0,25×0,75=0,1875n et celle de Fn est V=VFn=VXnn2=0,1875n.
0,2<Fn<0,3 équivaut à Fn−0,25 <0,05.
On cherche donc n tel que P Fn−0,25 <0,05≥0,99.
Cette condition équivaut à 1−P Fn−0,25 ≥0,05≥0,99, soit :
P Fn−0,25 ≥0,05≤0,01 (*).
Or l’inégalité de Bienaymé-Tchebychev dit que, pour tout δ>0 :
Fn−μ ≥δ≤Vδ2, avec μ=0,25, V=0,1875n, et δ=0,05, on a :
Fn−0,25 ≥0,05≤0,1875n0,052.
On cherche n tel que (*) soit vérifiée, il suffit donc que n vérifie 0,1875n0,052≤0,01, soit n≥0,18750,01×0,052 c’est-à-dire n≥7 500.
Si on observe au moins 7 500 fleurs, la fréquence de fleurs blanches est comprise entre 0,2 et 0,3 avec une probabilité supérieure ou égale à 0,99.
Remarque : 0,05 est la précision choisie (écart maximal par rapport à l’espérance) et 0,01 est le risque choisi.