Indicateurs de dispersion : écart interquartile et écart type

icône de pdf
Signaler
Évalue la dispersion d’une série statistique grâce à des indicateurs précis : écart interquartile et écart type. Mots-clés : écart type, interquartile, dispersion, données, statistique

I. Quartile et étendue


Il s'agit ici de paramètres de dispersion. Ils mesurent si une série est concentrée autour d'une valeur ou si, au contraire, elles sont « éparpillées ».

Définitions

On considère une série statistique ordonnée dans l'ordre croissant.

On appelle premier quartile, noté Q1Q_1, la plus petite valeur de la série pour laquelle au moins 25% des valeurs lui sont inférieures ou égales.

On appelle troisième quartile, noté Q3Q_3, la plus petite valeur de la série pour laquelle au moins 75% des valeurs lui sont inférieures ou égales.

Remarque : Du fait de la définition, les deux quartiles appartiennent nécessairement à la série statistique étudiée.

Exemple : Voici les notes de 50 étudiants à un examen

picture-in-textLes notes étant toutes comprises entre 0 et 20 on va les regrouper dans un tableau en comptabilisant le nombre de fois ou chacune d'entre-elles apparaît.

On obtient ainsi le tableau suivant :

picture-in-text

En prenant notre série de notes :
504=12,5\frac{50}{4}=12,5. Q1Q_1 correspondra donc à la 13ème valeur soit Q1=5Q_1=5.
3×504=37,53\times\frac{50}{4}=37,5. Q3Q_3 correspondra donc à la 38ème valeur soit Q3=14Q_3=14.

Le dernier paramètre étudié est l'étendue.

Définition étendue :

L'étendue d'une série statistique est la différence entre la plus grande et la plus petite valeur.

Ainsi dans l'exemple l'étendue vaut 200=2020 - 0 = 20.

Définition écart inter-quartile

L'écart inter-quartile est égal à Q3Q1Q_3-Q_1

Dans l'exemple précédent, il vaut 145=914-5=9.

II. Pour aller plus loin : variance et écart-type

👉 Ce paragraphe va au delà du programme, mais permet de mieux comprendre les données qu'un code Python ou qu'un tableur sont capables de renvoyer.


On a vu l'année dernière que la moyenne d'une série statistique permet de « résumer » la série mais on n'a alors aucune information sur la dispersion des valeurs. Il a donc fallu trouver un moyen de mesurer cette dispersion. C'est le rôle que va remplir l'écart-type.
On va considérer dans les définitions et propriétés qui vont suivre la série statistique suivante :

Valeurs x1x_1x1x_1 ... x1x_1 Total
Effectif n1n_1n1n_1 ... n1n_1NN

Définition

On appelle xˉ\bar{x} la moyenne de la série statistique.
On appelle variance de la série statistique le nombre :
V=1Ni=1pni(xixˉ)2V=\frac{1}{N}\sum_{i=1}^{p}{n_i(x_i-\bar{x})}^2

et l'écart-type le nombre σ=V\sigma = \sqrt{V}

Prenons un exemple numérique :

Voici les notes à un devoir de quelques élèves d'une classe :
12 - 10 - 15 - 9 - 13 - 10 - 17 - 14 - 11

picture-in-text

La moyenne de la série est xˉ=9+10+10+..+179=373\bar{x}=\frac{9+10+10+..+17}{9} = \frac{37}{3}


Ainsi la variance de la série statistique est :
V=19(1×(9373)2+2×(10373)2++1×(17373)2)=569\begin{aligned}V &= \frac{1}{9} \big( 1 \times (9-\tfrac{37}{3})^2 + 2 \times (10-\tfrac{37}{3})^2 + \dots \\ &\quad + 1 \times (17-\tfrac{37}{3})^2 \big) = \frac{56}{9}\end{aligned}

Et l'écart-type est :
σ=569=21432,49\sigma = \sqrt{ \frac{56}{9} } = \frac{2\sqrt{14}}{3} \approx 2,49

Remarque : L'intérêt majeur de l'écart-type est d'être exprimé dans la même unité que les valeurs de la série, ce qui n'est pas le cas de la variance du fait de la présence des carrés dans sa définition.

Propriété

On peut également calculer la variance d'une série statistique à l'aide de la formule suivante :
V=1Ni=1pnixi2xˉ2V=\frac{1}{N}\sum_{i=1}^{p}{n_i x_i^2-\bar{x}^2}

On applique cette formule à l'aide de l'exemple initial :
V=19(1×92+2×102+...+1×172)(373)2V=\frac{1}{9}(1 \times 9^2 + 2 \times 10^2 + ... + 1 \times 17^2)-\left(\dfrac{37}{3}\right)^2

V=569\phantom{V}=\dfrac{56}{9}