I. Droite d'ajustement
Définition :
Lorsque les points du nuage sont sensiblement alignés, on appelle droite d’ajustement une droite qui passe au plus près des points du nuage.
On dit que cette droite réalise un ajustement affine du nuage de points.
Remarques :
La variable peut alors s’exprimer de façon approchée sous la forme (équation de la droite d’ajustement). Ainsi, on estime qu’il existe un lien affine entre et .
Il est généralement admis que la droite d’ajustement passe par le point moyen du nuage.
II. Méthode des moindres carrés
Définition : droite de régression ou droite des moindres carrés
Soit un nuage de points pour , et une droite d’équation qui ajuste le nuage. On considère les points situés sur la droite .
Il existe un réel et un réel tels que la somme :
soit minimale.
Pour ces valeurs de et , la droite d’équation est appelée droite des moindres carrés associée au nuage de points pour , ou encore droite de régression de en .
Propriété :
La droite des moindres carrés a pour équation avec :
La covariance (ou ) des séries statistiques et se calcule de la façon suivante :
Définition :
Le coefficient de corrélation linéaire d’une série statistique de variables et est le nombre défini par :Propriété :
Le coefficient de corrélation linéaire vérifie : .
Plus est proche de , plus l’ajustement est un bon modèle de corrélation entre les variables et .
Plus est proche de , moins l’ajustement n’a de sens.
Si , alors la droite de régression passe par tous les points du nuage.
III. Exemple
Reprenons l'exemple du relevé taille, poids des 8 élèves.
La série statistique double est l’ensemble des couples suivants : ; ; ;
; ;
Voici le nuage de points avec la droite des moindres carrés tracée en vert. Cette droite représente l'ajustement affine de la variable (le poids) en fonction de la variable (la taille). Le point moyen est également représenté en rouge.
L’analyse statistique des données montre que les points du nuage sont presque alignés, ce qui indique une relation affine forte entre la taille (en cm) et le poids (en kg) des élèves.
La droite des moindres carrés a pour équation approximative :
Cela signifie qu’en moyenne, chaque centimètre supplémentaire de taille est associé à une augmentation d’environ kg du poids.
Le coefficient de corrélation linéaire est , ce qui est très proche de . Cela confirme qu’il existe une forte corrélation linéaire positive entre les deux variables : plus la taille augmente, plus le poids a tendance à augmenter également.
La droite obtenue peut donc être utilisée pour faire des prévisions ou estimer le poids d’un élève connaissant sa taille, dans la limite des valeurs observées.
IV. Utilisation de la calculatrice
Sur la calculatrice, on peut aussi représenter le nuage de points. Cela permet de vérifier visuellement si un ajustement affine a du sens.
🔸 TI-83 Premium CE
Appuyer sur la touche
STAT
Sélectionner le menu EDIT : 1.Modifier
Entrer les valeurs de la série statistique dans les colonnes L1 (pour ) et L2 (pour )
Appuyer de nouveau sur la touche
STAT
Aller dans CALC et choisir 4:LinReg(ax+b)
Vérifier que Xlist : L1 et Ylist : L2
Valider : la calculatrice affiche l’équation de la droite de régression de en , ainsi que le coefficient de corrélation linéaire
🔸 NUMWORKS
Appuyer sur la touche
home
Aller dans l’application Statistiques
Entrer les valeurs dans les colonnes X1 (pour ) et Y1 (pour )
Valider, puis descendre dans les menus
Sélectionner Stats → l'écran affiche les caractéristiques de la série, y compris :
la droite de régression
le coefficient de corrélation linéaire
🔸 CASIO GRAPH 90+E
Appuyer sur la touche
MENU
, puis sélectionner l’icône STATEntrer les données dans les colonnes List1 (pour ) et List2 (pour )
Vérifier les réglages dans
SET
:XList : List1
YList : List2
Appuyer sur
F2 : CALC
, puis choisirX
(droite de régression)La calculatrice affiche l’équation et la valeur du coefficient de corrélation