Plus la technologie progresse, plus la quantité d’informations enregistrées est grande. Pour conserver ou reproduire ces informations avec fidélité, une compression des données est nécessaire.

I Taille d’un fichier audio

1 Paramètres qui influencent la taille d’un fichier audio

La taille d’un fichier audio dépend de différents paramètres liés à la fidélité recherchée :

– la fréquence d’échantillonnage ;

– le nombre de bits pour la quantification ou résolution ;

– la durée de l’enregistrement.

À partir des trois paramètres précédents, on peut calculer la taille du fichier audio en bits, grâce au calcul suivant :

Taille (bits) = résolution (bits) × fréquence d’échantillonnage (Hz) × durée (s)

La taille d’un fichier s’exprime en octets. Un octet correspond à 8 bits, soit une série de huit chiffres, 0 ou 1. Donc $Taille (octet) = \frac{Taille (bits)}{8}$ .

2 Le stockage

L’oreille humaine entend jusqu’à 20 000 Hz. D’après le théorème de Shannon, on doit utiliser une fréquence d’échantillonnage double, donc 40 kHz. Par convention, on utilise une fréquence de 44,1 kHz et une quantification de 16 bits. Pour un fichier son de 4 minutes, la taille du fichier est donc égale à 16 × (44,1 × 10³) × (4 × 60) = 1,69 × 10⁸ bits = 21 Mo. Comme l’enregistrement est en stéréo, le fichier brut aura une taille d’environ 42 Mo.

CD		DVD

Doc Tailles comparées du faisceau lumineux et des gravures

La faible capacité de stockage des premiers supports numériques et les faibles débits d’Internet ont nécessité la diminution de la taille des fichiers sonores.

La différence de capacité de stockage entre le CD et le DVD (650 Mo contre 4,7 Go) vient de la taille des sillons gravés sur le support et de la taille du faisceau laser.

II Compression

1 Techniques de compression

Il existe de nombreuses techniques de compression. Certaines d’entre elles entraînent une perte d’informations ; on dit qu’elles sont destructrices.

Les techniques destructrices reposent sur les propriétés de l’oreille humaine. Si un son comporte des fréquences en dehors de la gamme [20 Hz-20 kHz], on peut les éliminer puisqu’elles ne sont pas perçues. On peut aussi décider d’enlever des fréquences dont le niveau sonore, en décibels, est très faible.

Les techniques non destructrices utilisent un codage informatique. Par exemple, si dans une suite d’échantillons une même fréquence apparaît dix fois, on ne stockera que la valeur de la fréquence et le nombre de fois où elle apparaît, donc seulement deux informations. Un exemple de cette méthode est l’algorithme de Huffman.

2 Taux de compression

Repère
À NOTER
Les normes de compression les plus connues sont : WMA, MP3, Ogg Vorbis, AAC…

Il y a plusieurs normes de compression. Le taux de compression choisi dépend de l’usage futur du fichier : CD, téléphone, streaming…

Le taux de compression est le rapport de la taille du fichier après et avant compression :

$τ = 1 - \frac{taille finale}{taille initiale}$

Plus le taux de compression est élevé, plus le fichier sera petit, mais moins la qualité sera bonne.

Taille d’un fichier audio et compression du son