Interpolation, extrapolation

icône de pdf
Signaler

I. Estimer graphiquement une valeur

Lorsqu’on a pu réaliser un ajustement (affine ou exponentiel) satisfaisant pour le nuage de points d’une série statistique à deux variables xx et yy, on peut considérer — si cela a du sens dans le contexte étudié — que les quantités xx et yy ne sont pas complètement indépendantes, et qu’il existe un lien entre elles.

Ce lien peut être modélisé par une fonction ff (affine ou exponentielle), correspondant à l’ajustement trouvé, telle que :

y=f(x)y = f(x)

Cela permet d’estimer, de manière graphique ou algébrique, une valeur de la variable yy qui pourrait correspondre à une valeur théorique de xx, non mesurée dans l’étude initiale.

Réciproquement, on peut également estimer une valeur de xx correspondant à une valeur donnée de yy.

  • Si la valeur choisie reste dans le domaine d’étude (c’est-à-dire l’intervalle couvert par les données de l’échantillon), on parle alors d’interpolation.

  • Si la valeur est en dehors de cet intervalle, on parle d’extrapolation.

II. Exemple

🔹 Exemple 1 : la situation

On a relevé les températures (en °C) observées à différentes heures de la matinée dans une ville :

Heure xx (h)

Température yy (°C)

8

12

9

14

10

16

11

18

12

20

picture-in-text

On remarque que les points du nuage (x;y)(x ; y) sont alignés. On effectue un ajustement affine et on trouve la droite de régression : y=2x4y = 2x - 4

Voici le graphique correspondant à la situation :

  • Les points bleus représentent les données relevées.

  • La courbe verte est la droite d’ajustement y=2x4y = 2x - 4.

  • Le point orange correspond à l’interpolation pour x=10,5x = 10{,}5 (température estimée : 21 °C).

  • Le point rouge correspond à l’extrapolation pour x=14x = 14 (température estimée : 24 °C).

🔸 Interpolation

On cherche à estimer la température à 10h30 (x=10,5x = 10{,}5), ce qui est compris dans l’intervalle [8 ; 12] couvert par les données.

On calcule :

y=2×10,54=21y = 2 \times 10{,}5 - 4 = 21

On estime donc qu’il faisait environ 21 °C à 10h30.
✅ C’est une interpolation.

🔸 Extrapolation

On cherche maintenant à estimer la température à 14h (x=14x = 14), soit en dehors de l’intervalle [8 ; 12].

On calcule :

y=2×144=24y = 2 \times 14 - 4 = 24

On estime donc qu’il ferait 24 °C à 14h, selon le modèle.
⚠️ C’est une extrapolation car la valeur de x=14x = 14 dépasse le domaine d’étude.

🔹 Exemple 2 : la situation

On étudie la croissance d’une population bactérienne. Le nombre de bactéries yy est mesuré toutes les 2 heures :

Temps xx (en h)

Nombre de bactéries yy

0

100

2

180

4

325

6

590

8

1070

picture-in-text

On remarque que les points du nuage (x;y)(x ; y) semblent suivre une tendance exponentielle.

Après changement de variable y=ln(y)y' = \ln(y) et ajustement linéaire, on obtient :

ln(y)=0,28x+4,6\ln(y) = 0{,}28x + 4{,}6

Ce qui équivaut à : y=e0,28x+4,6y = \text e^{0{,}28x + 4{,}6}

Voici le graphique pour l’exemple exponentiel :

  • Les points bleus représentent les mesures du nombre de bactéries.

  • La courbe verte est l’ajustement exponentiel y=e0,28x+4,6y = \text e^{0{,}28x + 4{,}6}.

  • Le point orange montre l’interpolation à x=5x = 5 h, avec une estimation d’environ 403 bactéries.

  • Le point rouge montre l’extrapolation à x=12x = 12 h, avec une estimation d’environ 2880 bactéries.

🔸 Interpolation

On cherche à estimer le nombre de bactéries à x=5x = 5 h, ce qui est entre 4h et 6h, donc dans le domaine d’étude.

On calcule :

y=e0,28×5+4,6=e1,4+4,6=e6,0403y = \text e^{0{,}28 \times 5 + 4{,}6} = \text e^{1{,}4 + 4{,}6} = \text e^{6{,}0} \approx 403

✅ C’est une interpolation : on estime qu’il y a environ 403 bactéries à 5h.

🔸 Extrapolation

On cherche maintenant à estimer le nombre de bactéries à x=12x = 12 h, ce qui est en dehors de l’intervalle [0 ; 8].

On calcule : y=e0,28×12+4,6=e3,36+4,6=e7,962880y = \text e^{0{,}28 \times 12 + 4{,}6} = \text e^{3{,}36 + 4{,}6} = \text e^{7{,}96} \approx 2880

⚠️ C’est une extrapolation : selon le modèle, il y aurait environ 2880 bactéries à 12h, mais cette estimation est moins fiable.