Ajustement affine

icône de pdf
Signaler

I. Droite d'ajustement

Définition :

Lorsque les points du nuage sont sensiblement alignés, on appelle droite d’ajustement une droite qui passe au plus près des points du nuage.
On dit que cette droite réalise un ajustement affine du nuage de points.

Remarques :
\circ\quad La variable yy peut alors s’exprimer de façon approchée sous la forme y=ax+by = ax + b (équation de la droite d’ajustement). Ainsi, on estime qu’il existe un lien affine entre xx et yy.

\circ\quad Il est généralement admis que la droite d’ajustement passe par le point moyen GG du nuage.

II. Méthode des moindres carrés

Définition : droite de régression ou droite des moindres carrés

Soit un nuage de points Mi(xi;yi)M_i(x_i ; y_i) pour 1in1 \leq i \leq n, et une droite dd d’équation y=ax+by = ax + b qui ajuste le nuage. On considère les points Pi(xi;axi+b)P_i(x_i ; ax_i + b) situés sur la droite dd.

Il existe un réel aa et un réel bb tels que la somme :

MP=i=1nMiPi2=M1P12+M2P22++MnPn2\displaystyle MP = \sum_{i=1}^{n} M_i P_i^2 = M_1 P_1^2 + M_2 P_2^2 + \dots + M_n P_n^2 soit minimale.

Pour ces valeurs de aa et bb, la droite d’équation y=ax+by = ax + b est appelée droite des moindres carrés associée au nuage de points Mi(xi;yi)M_i(x_i ; y_i) pour 1in1 \leq i \leq n, ou encore droite de régression de yy en xx.

picture-in-textPropriété :
La droite des moindres carrés a pour équation y=ax+by = ax + b avec :

a=cov(x;y)var(x);b=yaxa = \dfrac{\text{cov}(x ; y)}{\text{var}(x)} \qquad ; \qquad b = \overline{y} - a \overline{x}

La covariance cov(x;y)\text{cov}(x ; y) (ou σxy\sigma_{xy}) des séries statistiques xx et yy se calcule de la façon suivante :

cov(x;y)=σxy\text{cov}(x ; y) = \sigma_{xy}cov(x;y)=(x1x)(y1y)+(x2x)(y2y)++(xnx)(yny)n\text{cov}(x ; y) = \dfrac{(x_1 - \overline{x})(y_1 - \overline{y}) + (x_2 - \overline{x})(y_2 - \overline{y}) + \dots + (x_n - \overline{x})(y_n - \overline{y})}{n}

Définition :
Le coefficient de corrélation linéaire d’une série statistique de variables xx et yy est le nombre rr défini par : r=σxyσ(x)σ(y)r = \dfrac{\sigma_{xy}}{\sigma(x) \sigma(y)}

Propriété :
Le coefficient de corrélation linéaire rr vérifie : 1r1-1 \leq r \leq 1.

  • Plus r|r| est proche de 11, plus l’ajustement est un bon modèle de corrélation entre les variables xx et yy.

  • Plus r|r| est proche de 00, moins l’ajustement n’a de sens.

  • Si r=1|r| = 1, alors la droite de régression passe par tous les points du nuage.

III. Exemple

Reprenons l'exemple du relevé taille, poids des 8 élèves.

La série statistique double (x;y)(x ; y) est l’ensemble des couples suivants : (x1,y1)=(150,45)(x_1, y_1) = (150, 45) ; (x2,y2)=(160,50)(x_2, y_2) = (160, 50) ; (x3,y3)=(155,48)(x_3, y_3) = (155, 48) ;
(x4,y4)=(165,55)(x_4, y_4) = (165, 55) ; (x5,y5)=(170,60)(x_5, y_5) = (170, 60) ; (x6,y6)=(158,49)(x_6, y_6) = (158, 49)
(x7,y7)=(162,52)(x_7, y_7) = (162, 52)

picture-in-text

picture-in-text

Voici le nuage de points avec la droite des moindres carrés tracée en vert. Cette droite représente l'ajustement affine de la variable yy (le poids) en fonction de la variable xx (la taille). Le point moyen (x,y)(\overline{x}, \overline{y}) est également représenté en rouge.

L’analyse statistique des données montre que les points du nuage sont presque alignés, ce qui indique une relation affine forte entre la taille xx (en cm) et le poids yy (en kg) des élèves.

La droite des moindres carrés a pour équation approximative :

y=0,74x66,44y = 0{,}74x - 66{,}44

Cela signifie qu’en moyenne, chaque centimètre supplémentaire de taille est associé à une augmentation d’environ 0,740{,}74 kg du poids.

Le coefficient de corrélation linéaire est r0,98r \approx 0{,}98, ce qui est très proche de 11. Cela confirme qu’il existe une forte corrélation linéaire positive entre les deux variables : plus la taille augmente, plus le poids a tendance à augmenter également.

La droite obtenue peut donc être utilisée pour faire des prévisions ou estimer le poids d’un élève connaissant sa taille, dans la limite des valeurs observées.

IV. Utilisation de la calculatrice

Sur la calculatrice, on peut aussi représenter le nuage de points. Cela permet de vérifier visuellement si un ajustement affine a du sens.

🔸 TI-83 Premium CE

  1. Appuyer sur la touche STAT

  2. Sélectionner le menu EDIT : 1.Modifier

  3. Entrer les valeurs de la série statistique dans les colonnes L1 (pour xx) et L2 (pour yy)

  4. Appuyer de nouveau sur la touche STAT

  5. Aller dans CALC et choisir 4:LinReg(ax+b)

  6. Vérifier que Xlist : L1 et Ylist : L2

  7. Valider : la calculatrice affiche l’équation y=ax+by = ax + b de la droite de régression de yy en xx, ainsi que le coefficient de corrélation linéaire rr

🔸 NUMWORKS

  1. Appuyer sur la touche home

  2. Aller dans l’application Statistiques

  3. Entrer les valeurs dans les colonnes X1 (pour xx) et Y1 (pour yy)

  4. Valider, puis descendre dans les menus

  5. Sélectionner Stats → l'écran affiche les caractéristiques de la série, y compris :

    • la droite de régression y=ax+by = ax + b

    • le coefficient de corrélation linéaire rr

🔸 CASIO GRAPH 90+E

  1. Appuyer sur la touche MENU, puis sélectionner l’icône STAT

  2. Entrer les données dans les colonnes List1 (pour xx) et List2 (pour yy)

  3. Vérifier les réglages dans SET :

    • XList : List1

    • YList : List2

  4. Appuyer sur F2 : CALC, puis choisir X (droite de régression)

  5. La calculatrice affiche l’équation y=ax+by = ax + b et la valeur du coefficient de corrélation rr