Logo Le Polyscope
De toute façon, on est les meilleurs depuis 1967.

L’encodage en format MP3

L’avènement « du MP3 » est sans aucun doute l’un des plus grands bouleversements qu’a connu l’industrie de la musique. Tout le monde est au courant de ce qu’est un MP3. Si vous lisez cet article, il y a même de fortes chances que vous en possédiez plusieurs dizaines (de milliers ?) sur votre ordinateur. Contrairement au bon vieux « tape à cassette » et au disque compact, le fichier MP3 n’a pas été commandé par l’industrie elle-même, mais elle a tout de même dû se conformer à ce mouvement issue d’Internet. Ce format numérique aura eu sans aucun doute un impact énorme sur la façon que les gens consomment, écoutent et partagent la musique. Vous vous demandez « comment ça marche ? » Cet article est pour vous !

Le MP3 « MPEG Audio Layer 3 » est un format de compression de données audio. Il a été développé par le groupe MPEG (« Moving Picture Experts Group »), lequel se spécialise dans la compression vidéo et audio. Par exemple, les DVD se basent sur les travaux de ce groupe pour compresser les données avec le moins de perte de qualité possible. Le MP3 est donc un sous-système du MPEG permettant strictement de compresser les données audio.

On dit de la compression « MPEG audio layer 3 » qu’elle est destructive. En fait, la compression des données se fait en retirant des informations inaudibles pour le commun des mortels dans le signal audio, tout en conservant une qualité sonore très acceptable. Il s’agit donc d’analyser le signal dans le domaine des fréquences (analyse spectrométrique) afin de ne conserver que les sons audibles. Pour vous rappeler de bons souvenirs, l’analyse dans le domaine des fréquences se fait à l’aide de la transformée de Fourier. On peut certainement dire que le fichier MP3 est une application directe de cette approche mathématique.

Pour vous mettre en contexte, lorsqu’on enregistre une chanson au format digital sur un disque compact (conversion analogique/numérique), la musique est échantillonnée 44 100 fois par secondes. Chaque échantillon est enregistré sur 16 bits. On répète cette opération pour chaque canal stéréo (droite/gauche). Un disque compact enregistre donc un très grand nombre de bits pour chaque seconde de musique : 44 100 échantillons/seconde * 16 bits/échantillon * 2 canal = 1 411 200 bits/secondes Cela correspond à 176 000 octets /seconde. Une seule chanson de trois minutes prend donc 32 Megaoctets d’espace sur le disque compacte. L’encodage au format MP3 permet de réduire la taille d’une chanson dans une proportion de 1 :12. À l’aide de ce format, on peut donc arriver à graver l’équivalent de douze albums de musique sur un seul disque compact ! Le but premier de ce format étant évidemment de faciliter l’échange de musique sur l’Internet.

Comment peut-on réduire de par douze la taille d’un fichier musical ?

Petit rappel des cours de physique (YEAH !)… L’oreille humaine ne peut discerner que des sons compris entre 0.002kHz et 20kHz environ. Certains chanceux entendront des fréquences plus élevées. Cependant, la sensibilité de notre oreille suit une courbe en fonction de la fréquence, cette sensibilité étant maximale entre 2 et 5 kHz. Par exemple, un son à une fréquence de 18 kHz devra être très fort pour être entendu, alors qu’un son à 4 kHz peut être beaucoup plus faible. Ainsi donc, l’encodage MP3 s’appuie sur ces deux premiers principes :
• L’oreille humaine ne peut pas entendre certains sons ;
• Il y a certains sons que l’oreille humaine perçoit mieux que d’autres ;
Un troisième principe important pour l’encodage au format MP3 est l’effet de masque. Lorsqu’il y a des sons de fortes amplitudes, ils « camouflent » les sons de plus faibles amplitudes. De cette manière, on peut supprimer les sons plus faibles qui n’aurait pas été perçus par notre oreille de toute manière. En s’appuyant sur ces trois derniers principes, on peut supprimer plusieurs sons dans le fichier audio qui ne sont pas audibles pour notre pauvre oreille. C’est pour cela qu’on dit que l’encodage MP3 est destructif. Une dernière méthode utilisée est le « joint stereo ». En dessous d’une certaine fréquence, l’oreille humaine n’est plus capable de faire la distinction spatiale du son. Lorsqu’on active l’option « joint stereo » dans l’encodage MP3, on permet à l’algorithme de convertir en MONO certaines fréquences qui auraient été converties inutilement en stéréophonie. Finalement, on réduit davantage la taille du fichier en utilisant l’algorithme Huffman, algorithme de codage (et non de compression) qui agit à la fin de la compression. Cet algorithme crée des codes de longueurs variables. Les segments qui reviennent plus souvent dans notre signal audio seront encodés sur un plus petit nombre de bits. Une table de conversion permet de restituer le signal correctement. Ce type d’encodage permet de gagner en moyenne un peu moins de 20% d’espace.

Pas si compliqué finalement l’encodage MP3 ! On voit quand même que la technologie du MP3 n’a rien de très sorcier et qu’elle s’appuie principalement sur l’observation de principes physiques et acoustiques. En fin de compte, on se retrouve avec un fichier audio très près de la qualité CD, mais douze fois plus petit. Toute cette analyse du signal audio se fait dans le domaine des fréquences, en utilisant nulle autre que la fameuse transformée de Fourier. De quoi trouver quelques utilités à notre cours d’Équations Différentielles ! !




*Les auteurs ont l’entière responsabilité de leurs articles et n’engagent d’aucune façon l’équipe du Polyscope ou de l’AEP, sauf lorsque la signature en fait mention. Nous laissons au lecteur la jugeote de déceler le sarcasme saupoudré sur nos pages.

Dans la même catégorie

Alcooliquement vôtre

10 septembre 2004

Qui l'aurait cru il y a même une semaine ? Certainement peu des anciens qui nous visitent régulièrement en disant : « Dans mon temps... ». Et pourtant, des prospectus avertissant des dangers du calage de bière fleurissent partout dans l'École. Avec une grosse semaine de retard, diront les mauvaises langues, mais c'est l'occasion de réfléchir rien qu'un peu sur le contenu de ce message. Bien entendu, tout cela part d'une opération de...

La seule rubrique qui prend soin de votre culture

5 novembre 2004

L'acteur américain David Hasselhoff a été condamné jeudi à suivre un programme de désintoxication de six mois après avoir été arrêté pour conduite en état d'ivresse en juin dernier. Le juge Elizabeth Lippitt l'a également condamné à une amende de 390 dollars, à des travaux d'intérêt général et à une suspension de permis de conduire. David n'a pas pris la peine de venir à l'audience. Il avait été arrêté en juin dernier avec un...

Kogals, kest ce ke c que ca ?

17 septembre 2004

Le mot en tant que tel viendrait des raciness kou, de kougakko, qui veut dire lycée et gals vient du mot gyaru qui est la japanisation du mot « girl ». Etant d'abord une tendance populaire auprès des lycéennes, ce mot a été utilisé pour décrire une plus grande étendue de jeunes femmes dernièrement. Et d'hommes par ailleurs, et oui, cette tendance n'a pas de sexe, elle sevit aussi chez la gent masculine(mais je...