I. Estimer graphiquement une valeur
Lorsqu’on a pu réaliser un ajustement (affine ou exponentiel) satisfaisant pour le nuage de points d’une série statistique à deux variables et , on peut considérer — si cela a du sens dans le contexte étudié — que les quantités et ne sont pas complètement indépendantes, et qu’il existe un lien entre elles.
Ce lien peut être modélisé par une fonction (affine ou exponentielle), correspondant à l’ajustement trouvé, telle que :
Cela permet d’estimer, de manière graphique ou algébrique, une valeur de la variable qui pourrait correspondre à une valeur théorique de , non mesurée dans l’étude initiale.
Réciproquement, on peut également estimer une valeur de correspondant à une valeur donnée de .
Si la valeur choisie reste dans le domaine d’étude (c’est-à-dire l’intervalle couvert par les données de l’échantillon), on parle alors d’interpolation.
Si la valeur est en dehors de cet intervalle, on parle d’extrapolation.
II. Exemple
🔹 Exemple 1 : la situation
On a relevé les températures (en °C) observées à différentes heures de la matinée dans une ville :
|
On remarque que les points du nuage sont alignés. On effectue un ajustement affine et on trouve la droite de régression :
Voici le graphique correspondant à la situation :
Les points bleus représentent les données relevées.
La courbe verte est la droite d’ajustement .
Le point orange correspond à l’interpolation pour (température estimée : 21 °C).
Le point rouge correspond à l’extrapolation pour (température estimée : 24 °C).
🔸 Interpolation
On cherche à estimer la température à 10h30 (), ce qui est compris dans l’intervalle [8 ; 12] couvert par les données.
On calcule :
On estime donc qu’il faisait environ 21 °C à 10h30.
✅ C’est une interpolation.
🔸 Extrapolation
On cherche maintenant à estimer la température à 14h (), soit en dehors de l’intervalle [8 ; 12].
On calcule :
On estime donc qu’il ferait 24 °C à 14h, selon le modèle.
⚠️ C’est une extrapolation car la valeur de dépasse le domaine d’étude.
🔹 Exemple 2 : la situation
On étudie la croissance d’une population bactérienne. Le nombre de bactéries est mesuré toutes les 2 heures :
|
On remarque que les points du nuage semblent suivre une tendance exponentielle.
Après changement de variable et ajustement linéaire, on obtient :
Ce qui équivaut à :
Voici le graphique pour l’exemple exponentiel :
Les points bleus représentent les mesures du nombre de bactéries.
La courbe verte est l’ajustement exponentiel .
Le point orange montre l’interpolation à h, avec une estimation d’environ 403 bactéries.
Le point rouge montre l’extrapolation à h, avec une estimation d’environ 2880 bactéries.
🔸 Interpolation
On cherche à estimer le nombre de bactéries à h, ce qui est entre 4h et 6h, donc dans le domaine d’étude.
On calcule :
✅ C’est une interpolation : on estime qu’il y a environ 403 bactéries à 5h.
🔸 Extrapolation
On cherche maintenant à estimer le nombre de bactéries à h, ce qui est en dehors de l’intervalle [0 ; 8].
On calcule :
⚠️ C’est une extrapolation : selon le modèle, il y aurait environ 2880 bactéries à 12h, mais cette estimation est moins fiable.