Plusieurs méthodes permettent de traiter et d’interpréter des données de nature diverse concernant des « populations » (ensembles de personnes, d’objets...).
I) Leçon
1) Définition d’une série statistique
Une étude statistique concerne une population dont les éléments sont appelés individus pour lesquels on choisit d’étudier un aspect appelé caractère ou variable.
La liste des valeurs recensées pour le caractère étudié constitue une série statistique.
Exemple : On étudie les notes obtenues (le caractère) à un contrôle pour l’ensemble des élèves d’une classe (les individus et la population). La liste des notes constitue donc la série statistique. Dans la suite, on s’appuiera sur la série de notes suivantes (notation sur 10) :
1 ; 1 ; 2 ; 2 ; 3 ; 4 ; 4 ; 5 ; 5 ; 5 ; 5 ; 5 ; 5 ; 7 ; 7 ; 8 ; 9 ; 9 ; 9 ; 10 ; 10 ; 10 ; 10 ; 10 ; 10.
2) Effectif et fréquence
L’effectif d’une valeur d’un caractère (ou d’une variable) est le nombre d’individus de la population étudiée qui correspondent à cette valeur.
La fréquence d’une valeur d’un caractère est le quotient de l’effectif de cette valeur par l’effectif total.
Soit , ,... les valeurs d'une série statistique, pour une valeur dont l'effectif est , sa fréquence est donnée par , où désigne l'effectif total. La fréquence est généralement exprimée en pourcentage.
Exemple : Le tableau suivant synthétise les effectifs et fréquences pour les valeurs de la variable considérée dans l’exemple ci-dessus, l’effectif total étant de 25 élèves.
La somme des fréquences est égale à 1 ou à 100 %.
3) Paramètres de position
A) La moyenne arithmétique pondérée (ou simplement moyenne)
Si , , ... sont les données d'une série statistique, , , ... les effectifs pour chaque valeur et l'effectif total (donc ), alors la moyenne est le nombre :
.
Exemple : Dans l'exemple ci-dessus, la moyenne des notes de la classe est égale à :
.
Dans certaines situations, les effectifs sont remplacés par des coefficients. Par exemple, lorsqu’on calcule la moyenne obtenue avec des devoirs affectés de coefficients différents.
B) La médiane
Si , , ... sont les valeurs, ordonnées par ordre croissant, d'une série statistique et son effectif total, la médiane est un nombre qui correspond au partage de la série en deux sous-parties de même effectif :
- si est impair, est la valeur de cette série dont le rang est ;
- si est pair, appartient à l'intervalle formé par les deux valeurs situées « au milieu » de la série, donc de rangs respectifs et .
Exemple : Toujours avec l’exemple ci-dessus, l’effectif total est un nombre impair, la médiane est donc la valeur de rang , donc de rang 13 : c’est ici la note 5. La population peut être partagée de façon à ce qu’il y ait autant d’élèves qui ont eu une note inférieure ou égale à 5 que d’élèves qui ont eu une note supérieure ou égale à 5.
La médiane est rarement égale à la moyenne.
4) Paramètres de dispersion : l’étendue
L’étendue d’une série statistique est la différence entre la plus grande valeur et la plus petite valeur de la série, valeurs dont les effectifs ne sont pas nuls.
Exemple : L’étendue est égale à .
II) Ce qu'il faut savoir faire
➢ Calculer les différents paramètres d’une série statistique
Pour cela, on utilise leurs définitions.
III) Je m'entraîne
1. Voici les tailles (en cm) de deux groupes d’enfants :
- groupe A : 137 ; 145 ; 148 ; 137 ; 150 ; 146 ; 150 ; 150 ; 145 ;
- groupe B : 136 ; 142 ; 136 ; 152 ; 174 ; 152 ; 152 ; 136 ; 152 ; 158.
a. Pour chaque série statistique, construire le tableau des effectifs et des fréquences.
b. Calculer la moyenne, la médiane et l’étendue de chacune des séries puis utiliser ces paramètres pour comparer les deux séries.
2. Un examen comporte 4 épreuves de coefficients différents : maths (4), français (5), arts plastiques (3), EPS (2). Les notes obtenues par deux élèves sont renseignées dans le tableau. Calculer la moyenne obtenue par chaque élève à cet examen.