👉 Des fiches d'exercices (non visibles actuellement sur l'application) existent, elles sont disponibles depuis le site internet https://www.digischool.fr/lycee

I. Définitions

Lorsqu’on étudie conjointement deux caractères (ou variables) $x$ et $y$ sur une même population de taille $n$ , on associe à chaque individu de la population un couple $(x_i ; y_i)$ , où $x_i$ et $y_i$ sont les valeurs respectives des variables $x$ et $y$ prises par l’individu « numéro $i$ » (où $i$ est un nombre entier entre $1$ et $n$ , ou parfois entre $0$ et $n - 1$ ).

Définition :

On appelle série statistique double $(x ; y)$ l’ensemble des couples $(x_i ; y_i)$ associés à chaque individu de la population. On la présente en général dans un tableau.

picture-in-text Remarque : La liste des valeurs associées à la variable $x$ est une série statistique simple dont on peut calculer la moyenne $\overline{x}$ . Il en va de même pour les valeurs de $y$ , dont la moyenne est $\overline{y}$ :

$\small\overline{x} = \dfrac{x_1 + x_2 + \dots + x_n}{n}$ et $\small \overline{y} = \dfrac{y_1 + y_2 + \dots + y_n}{n}$

Définition :

On appelle point moyen de la série statistique double $(x ; y)$ le point $G$ de coordonnées $(\overline{x}, \overline{y})$ , où : $\overline{x} = \dfrac{x_1 + x_2 + \dots + x_n}{n}$ et $\overline{y} = \dfrac{y_1 + y_2 + \dots + y_n}{n}$
Le point $G$ représente le barycentre des points du nuage de points associé à la série.

Définition :

À chaque couple $(x_i ; y_i)$ de la série statistique double $(x ; y)$ , on peut associer le point $M_i$ de coordonnées $(x_i ; y_i)$ dans un repère.
L’ensemble de ces points est appelé nuage de points associé à la série statistique double $(x ; y)$ .

II. Exemple

On étudie la taille (en cm), notée $x$ , et le poids (en kg), noté $y$ , de 8 élèves. On recueille les données suivantes :

picture-in-text

La série statistique double $(x ; y)$ est l’ensemble des couples suivants :

$(x_1, y_1) = (150, 45)$
$(x_2, y_2) = (160, 50)$
$(x_3, y_3) = (155, 48)$
$(x_4, y_4) = (165, 55)$
$(x_5, y_5) = (170, 60)$
$(x_6, y_6) = (158, 49)$
$(x_7, y_7) = (162, 52)$
$(x_8, y_8) = (168, 57)$

On peut calculer les moyennes des variables $x$ et $y$ .

Pour la taille :

$\scriptsize \overline{x} = \dfrac{150 + 160 + 155 + 165 + 170 + 158 + 162 + 168}{8} = \dfrac{1288}{8} = 161$

Pour le poids :

$\small\overline{y} = \dfrac{45 + 50 + 48 + 55 + 60 + 49 + 52 + 57}{8} = \dfrac{416}{8} = 52$

Le point moyen de la série est donc le point de coordonnées $(\overline{x}, \overline{y}) = (161, 52)$ .

picture-in-text On cherche s’il existe un lien entre ces deux variables, l’altitude et la température.
On va donc essayer de trouver une courbe qui « approche au mieux » le nuage, c’est-à-dire une courbe qui passe au plus près des points du nuage.
On dit que l’on a effectué un ajustement.

Cette courbe d’ajustement, si elle existe, représente alors une fonction $f$ qui permet quasiment d’exprimer la variable $y$ en fonction de la variable $x$ , sous la forme $y = f(x)$ .

Ici, les points sont presque alignés, donc on peut ajuster le nuage par une droite :
on a donc quasiment une relation du type : $y = ax + b$ entre les deux variables $x$ et $y$ de la série statistique.

Statistiques à deux variables : définitions

👉 Des fiches d'exercices (non visibles actuellement sur l'application) existent, elles sont disponibles depuis le site internet https://www.digischool.fr/lycee

I. Définitions

II. Exemple