Épreuve ultime

Somme de variables aléatoires

Signaler

Énoncé

Le codage « base64 », utilisé en informatique, permet de représenter et de transmettre des messages et d’autres données telles que des images, en utilisant 64 caractères : les 26 lettres majuscules, les 26 lettres minuscules, les chiffres de 0 à 9 et deux autres caractères spéciaux.

Les parties A, B et C sont indépendantes.

Partie A
Dans cette partie, on s’intéresse aux séquences de 4 caractères en base64.
Par exemple, « p3Pg » est une telle séquence.
Dans une séquence, l’ordre est à prendre en compte : les séquences « m5C2 » et « 5C2m » ne sont pas identiques.

  1. Déterminer le nombre de séquences possibles.

  2. Déterminer le nombre de séquences si l’on impose que les 4 caractères sont différents deux à deux.

a. Déterminer le nombre de séquences ne comportant pas de lettre A majuscule.
b. En déduire le nombre de séquences comportant au moins une lettre A majuscule.
c. Déterminer le nombre de séquences comportant exactement une fois la lettre A majuscule.
d. Déterminer le nombre de séquences comportant exactement deux fois la lettre A majuscule.

Partie B
On s’intéresse à la transmission d’une séquence de 250 caractères d’un ordinateur à un autre. On suppose que la probabilité qu’un caractère soit mal transmis est égale à 0,01 et que les transmissions des différents caractères sont indépendantes entre elles.
On note XX la variable aléatoire égale au nombre de caractères mal transmis.

  1. On admet que la variable aléatoire XX suit la loi binomiale. Donner ses paramètres.

  2. Déterminer la probabilité que tous les caractères soient bien transmis. On donnera l’expression exacte, puis une valeur approchée à 10310^{-3} près.

  3. Que pensez-vous de l’affirmation suivante : « La probabilité que plus de 16 caractères soient mal transmis est négligeable » ?

Partie C
On s’intéresse maintenant à la transmission de 4 séquences de 250 caractères.
On note X1,X2,X3X_1, X_2, X_3 et X4X_4 les variables aléatoires correspondant aux nombres de caractères mal transmis lors de la transmission de chacune des 4 séquences. On admet que les variables aléatoires X1,X2,X3X_1, X_2, X_3 et X4X_4 sont indépendantes entre elles et suivent la même loi que la variable aléatoire XX définie en partie B.
On note S=X1+X2+X3+X4S = X_1 + X_2 + X_3 + X_4.

Déterminer, en justifiant, l’espérance et la variance de la variable aléatoire SS.

Révéler le corrigé

Partie A

Dans cette partie, on s'intéresse aux séquences de 4 caractères en base64.
Par exemple, ''gP3g'' est une telle séquence.
Dans une séquence, l'ordre est à prendre en compte : les séquences ''m5C2'' et ''5C2m'' ne sont pas identiques.

  1. Nous devons déterminer le nombre de séquences possibles.

Il s'agit ici de déterminer le nombre d'arrangements avec répétition de 4 éléments pris parmi 64 éléments.

Pour le premier caractère, nous avons 64 possibilités.
À chacune de ces possibilités, nous avons 64 possibilités pour le deuxième caractère.
À chacune de ces nouvelles possibilités, nous avons 64 possibilités pour le troisième caractère.
Enfin, à chacune de ces dernières possibilités, nous avons 64 possibilités pour le quatrième caractère.

Nous obtenons ainsi 64×64×64×6464\times64\times64\times64 possibilités.
Or 64×64×64×64=644=1677721664\times64\times64\times64=64^4=16\,777\,216.
Par conséquent, il y a 1677721616\,777\,216 séquences possibles.

  1. Nous devons déterminer le nombre de séquences si l'on impose que les 4 caractères sont différents deux à deux.

Il s'agit ici de déterminer le nombre d'arrangements simples de 4 éléments pris parmi 64 éléments.

Pour le premier caractère, nous avons 64 possibilités.
À chacune de ces possibilités, il y a 63 possibilités pour le deuxième caractère.
À chacune de ces nouvelles possibilités, il y a 62 possibilités pour le troisième caractère.
Enfin, à chacune de ces dernières possibilités, il reste 61 possibilités pour le quatrième caractère.

Nous obtenons ainsi 64×63×62×6164\times63\times62\times61 possibilités.
Or 64×63×62×61=1524902464\times63\times62\times61=15\,249\,024.
Par conséquent, il y a 1524902415\,249\,024 séquences que les 4 caractères sont différents deux à deux.

  1. a) Nous devons déterminer le nombre de séquences ne comportant pas de lettre A majuscule.

Pour le premier caractère, nous avons 63 possibilités.
À chacune de ces possibilités, nous avons 63 possibilités pour le deuxième caractère.
À chacune de ces nouvelles possibilités, nous avons 63 possibilités pour le troisième caractère.
Enfin, à chacune de ces dernières possibilités, nous avons 63 possibilités pour le quatrième caractère.

Nous obtenons ainsi 63×63×63×6363\times63\times63\times63 possibilités.
Or 63×63×63×63=634=1575296163\times63\times63\times63=63^4=15\,752\,961.
Par conséquent, il y a 1575296115\,752\,961 séquences ne comportant pas de lettre A majuscule.

  1. b) Nous devons en déduire le nombre de séquences comportant au moins une lettre A majuscule.

De toutes les séquences possibles, nous retirons les séquences ne comportant pas de lettre A majuscule.
Nous obtenons ainsi 167772161575296116\,777\,216-15\,752\,961 possibilités.
Or 1677721615752961=102425516\,777\,216-15\,752\,961=1\,024\,255.
Par conséquent, il y a 10242551\,024\,255 séquences comportant au moins une lettre A majuscule.

  1. c) Nous devons déterminer le nombre de séquences comportant exactement une fois la lettre A majuscule.

La lettre A majuscule peut occuper 4 positions dans la séquence.
À chacune de ces positions, il y a 63×63×6363\times63\times63 possibilités pour les trois autres caractères.

Nous obtenons ainsi 4×63×63×634\times63\times63\times63 possibilités.
Or 4×63×63×63=4×633=10001884\times63\times63\times63=4\times 63^3=1\,000\,188.
Par conséquent, il y a 10001881\,000\,188 séquences comportant exactement une fois la lettre A majuscule.

  1. d) Nous devons déterminer le nombre de séquences comportant exactement deux fois la lettre A majuscule.

Il y a (42)=6\begin{pmatrix}4\\2\end{pmatrix}=6 manières de choisir 2 emplacements pour la lettre A majuscule parmi les 4 emplacements.
À chacune de ces manières, il y a 63×6363\times63 manières d'occuper les 2 autres positions avec les 63 caractères restants.

Nous obtenons ainsi 6×63×636\times63\times63 possibilités.
Or 6×63×63=6×632=238146\times63\times63=6\times 63^2=23\,814.
Par conséquent, il y a 2381423\,814 séquences comportant exactement deux fois la lettre A majuscule.

Partie B

On s'intéresse à la transmission d'une séquence de 250 caractères d'un ordinateur à un autre.
On suppose que la probabilité qu'un caractère soit mal transmis est égale à 0,01 et que les transmissions des différents caractères sont indépendantes entre elles.
On note XX la variable aléatoire égale au nombre de caractères mal transmis.

  1. On admet que la variable aléatoire XX suit la loi binomiale.
    Nous devons donner ses paramètres.

Lors de cette expérience, on répète 250 fois des épreuves identiques et indépendantes.
Chaque épreuve comporte deux issues :
Succès : ''le caractère est mal transmis'' dont la probabilité est p=0,01p=0,01.
Échec : ''le caractère est bien transmis'' dont la probabilité est 1p=0,991-p=0,99.

La variable aléatoire XX compte le nombre de caractères mal transmis, soit le nombre de succès à la fin de la répétition des épreuves.
D'où la variable aléatoire XX suit une loi binomiale B(250;0,01)\mathscr{B}(250\,;\,0,01).

Cette loi est donnée par :
P(X=k)=(250k)×0,01k×0,99250k\boxed{P(X=k)=\begin{pmatrix}250\\k\end{pmatrix}\times0,01^k\times0,99^{250-k}}

  1. Nous devons déterminer la probabilité que tous les caractères soient bien transmis, soit P(X=0)P(X=0).

P(X=0)=(2500)×0,010×0,992500P(X=0)=\begin{pmatrix}250\\0\end{pmatrix}\times0,01^0\times0,99^{250-0}
P(X=0)=1×1×0,99250\phantom{P(X=0)}=1\times1\times0,99^{250}
P(X=0)=0,99250\phantom{P(X=0)}=0,99^{250}

P(X=0)=0,992500,081\Longrightarrow\quad\boxed{P(X=0)=0,99^{250}\approx0,081}

Par conséquent, la probabilité que tous les caractères soient bien transmis est égale à 0,992500,99^{250}, soit à environ 0,081.

  1. Nous devons émettre un avis sur la phrase suivante :
    ''La probabilité que plus de 16 caractères soient mal transmis est négligeable''.

Nous obtenons, par la calculatrice :
P(X>16)=P(X17)1,04×109P(X>16)=P(X\geq17)\approx\boxed{1,04\times10^{-9}}

Donc, l'affirmation est parfaitement sensée.

Partie C

On s'intéresse maintenant à la transmission de 4 séquences de 250 caractères.
On note X1,X2,X3X_1, X_2, X_3 et X4X_4 les variables aléatoires correspondant aux nombres de caractères mal transmis lors de la transmission de chacune des 4 séquences.
On admet que les variables aléatoires X1,X2,X3X_1, X_2, X_3 et X4X_4 sont indépendantes entre elles et suivent la même loi que la variable aléatoire XX définie en partie B.
On note S=X1+X2+X3+X4S = X_1 + X_2 + X_3 + X_4.

Nous devons déterminer, en justifiant, l'espérance et la variance de la variable aléatoire SS.

• Déterminons l'espérance de la variable aléatoire SS.

E(S)=E(X1+X2+X3+X4)E(S)=E(X_1+X_2+X_3+X_4)
E(S)=E(X1)+E(X2)+E(X3)+E(X4)(par lineˊariteˊ de l’espeˊrance)\phantom{E(S)}=E(X_1)+E(X_2)+E(X_3)+E(X_4)\quad\text{(par linéarité de l'espérance)}
E(S)=E(X)+E(X)+E(X)+E(X)\phantom{E(S)}=E(X)+E(X)+E(X)+E(X)
E(S)=4×E(X)\phantom{E(S)}=4\times E(X)
E(S)=4×n×p\phantom{E(S)}=4\times n\times p
E(S)=4×250×0,01\phantom{E(S)}=4\times 250\times 0,01
E(S)=10\phantom{E(S)}=10

E(S)=10\Longrightarrow\quad\boxed{E(S)=10}

• Déterminons la variance de la variable aléatoire SS.

V(S)=V(X1+X2+X3+X4)V(S)=V(X_1+X_2+X_3+X_4)
V(S)=V(X1)+V(X2)+V(X3)+V(X4)(car les variables sont indeˊpendantes)\phantom{V(S)}=V(X_1)+V(X_2)+V(X_3)+V(X_4)\quad\text{(car les variables sont indépendantes)}
V(S)=V(X)+V(X)+V(X)+V(X)\phantom{V(S)}=V(X)+V(X)+V(X)+V(X)
V(S)=4×V(X)\phantom{V(S)}=4\times V(X)
V(S)=4×n×p×(1p)\phantom{V(S)}=4\times n\times p\times (1-p)
V(S)=4×250×0,01×(10,01)\phantom{V(S)}=4\times 250\times 0,01\times (1-0,01)
V(S)=4×250×0,01×0,99\phantom{V(S)}=4\times 250\times 0,01\times 0,99
V(S)=9,9\phantom{V(S)}=9,9

V(S)=9,9\Longrightarrow\quad\boxed{V(S)=9,9}