Logo Le Polyscope
De toute façon, on est les meilleurs depuis 1967.

L’encodage en format MP3

L’avènement « du MP3 » est sans aucun doute l’un des plus grands bouleversements qu’a connu l’industrie de la musique. Tout le monde est au courant de ce qu’est un MP3. Si vous lisez cet article, il y a même de fortes chances que vous en possédiez plusieurs dizaines (de milliers ?) sur votre ordinateur. Contrairement au bon vieux « tape à cassette » et au disque compact, le fichier MP3 n’a pas été commandé par l’industrie elle-même, mais elle a tout de même dû se conformer à ce mouvement issue d’Internet. Ce format numérique aura eu sans aucun doute un impact énorme sur la façon que les gens consomment, écoutent et partagent la musique. Vous vous demandez « comment ça marche ? » Cet article est pour vous !

Le MP3 « MPEG Audio Layer 3 » est un format de compression de données audio. Il a été développé par le groupe MPEG (« Moving Picture Experts Group »), lequel se spécialise dans la compression vidéo et audio. Par exemple, les DVD se basent sur les travaux de ce groupe pour compresser les données avec le moins de perte de qualité possible. Le MP3 est donc un sous-système du MPEG permettant strictement de compresser les données audio.

On dit de la compression « MPEG audio layer 3 » qu’elle est destructive. En fait, la compression des données se fait en retirant des informations inaudibles pour le commun des mortels dans le signal audio, tout en conservant une qualité sonore très acceptable. Il s’agit donc d’analyser le signal dans le domaine des fréquences (analyse spectrométrique) afin de ne conserver que les sons audibles. Pour vous rappeler de bons souvenirs, l’analyse dans le domaine des fréquences se fait à l’aide de la transformée de Fourier. On peut certainement dire que le fichier MP3 est une application directe de cette approche mathématique.

Pour vous mettre en contexte, lorsqu’on enregistre une chanson au format digital sur un disque compact (conversion analogique/numérique), la musique est échantillonnée 44 100 fois par secondes. Chaque échantillon est enregistré sur 16 bits. On répète cette opération pour chaque canal stéréo (droite/gauche). Un disque compact enregistre donc un très grand nombre de bits pour chaque seconde de musique : 44 100 échantillons/seconde * 16 bits/échantillon * 2 canal = 1 411 200 bits/secondes Cela correspond à 176 000 octets /seconde. Une seule chanson de trois minutes prend donc 32 Megaoctets d’espace sur le disque compacte. L’encodage au format MP3 permet de réduire la taille d’une chanson dans une proportion de 1 :12. À l’aide de ce format, on peut donc arriver à graver l’équivalent de douze albums de musique sur un seul disque compact ! Le but premier de ce format étant évidemment de faciliter l’échange de musique sur l’Internet.

Comment peut-on réduire de par douze la taille d’un fichier musical ?

Petit rappel des cours de physique (YEAH !)… L’oreille humaine ne peut discerner que des sons compris entre 0.002kHz et 20kHz environ. Certains chanceux entendront des fréquences plus élevées. Cependant, la sensibilité de notre oreille suit une courbe en fonction de la fréquence, cette sensibilité étant maximale entre 2 et 5 kHz. Par exemple, un son à une fréquence de 18 kHz devra être très fort pour être entendu, alors qu’un son à 4 kHz peut être beaucoup plus faible. Ainsi donc, l’encodage MP3 s’appuie sur ces deux premiers principes :
• L’oreille humaine ne peut pas entendre certains sons ;
• Il y a certains sons que l’oreille humaine perçoit mieux que d’autres ;
Un troisième principe important pour l’encodage au format MP3 est l’effet de masque. Lorsqu’il y a des sons de fortes amplitudes, ils « camouflent » les sons de plus faibles amplitudes. De cette manière, on peut supprimer les sons plus faibles qui n’aurait pas été perçus par notre oreille de toute manière. En s’appuyant sur ces trois derniers principes, on peut supprimer plusieurs sons dans le fichier audio qui ne sont pas audibles pour notre pauvre oreille. C’est pour cela qu’on dit que l’encodage MP3 est destructif. Une dernière méthode utilisée est le « joint stereo ». En dessous d’une certaine fréquence, l’oreille humaine n’est plus capable de faire la distinction spatiale du son. Lorsqu’on active l’option « joint stereo » dans l’encodage MP3, on permet à l’algorithme de convertir en MONO certaines fréquences qui auraient été converties inutilement en stéréophonie. Finalement, on réduit davantage la taille du fichier en utilisant l’algorithme Huffman, algorithme de codage (et non de compression) qui agit à la fin de la compression. Cet algorithme crée des codes de longueurs variables. Les segments qui reviennent plus souvent dans notre signal audio seront encodés sur un plus petit nombre de bits. Une table de conversion permet de restituer le signal correctement. Ce type d’encodage permet de gagner en moyenne un peu moins de 20% d’espace.

Pas si compliqué finalement l’encodage MP3 ! On voit quand même que la technologie du MP3 n’a rien de très sorcier et qu’elle s’appuie principalement sur l’observation de principes physiques et acoustiques. En fin de compte, on se retrouve avec un fichier audio très près de la qualité CD, mais douze fois plus petit. Toute cette analyse du signal audio se fait dans le domaine des fréquences, en utilisant nulle autre que la fameuse transformée de Fourier. De quoi trouver quelques utilités à notre cours d’Équations Différentielles ! !




*Les auteurs ont l’entière responsabilité de leurs articles et n’engagent d’aucune façon l’équipe du Polyscope ou de l’AEP, sauf lorsque la signature en fait mention. Nous laissons au lecteur la jugeote de déceler le sarcasme saupoudré sur nos pages.

Dans la même catégorie

Polytechnique en grève !

11 mars 2005

Poly est en grève ! C'est une première historique. Les hausseurs d'épaules ont remué l'échine et ont organisé une assemblée générale de 890 personnes, soit près du tiers de l'ensemble des étudiants. La majorité s'est exprimée avec force. Le propos était sans équivoque. Le OUI l'a remporté par 595 voix contre 274 pour le NON, et 21 abstensions. Ainsi, le mercredi 16 mars 2005, Polytechnique fermera ses portes, baissera ses fanions, érigera des...

Toute l’actu des stars

17 septembre 2004

Nicole Kidman, âgée de 37 ans, est devenue la femme de moins de 40 ans la plus riche d'Australie, selon le magazine BRW. Son patrimoine s'élèverait à 155 millions de dollars australiens (soit 139 millions de dollars canadiens). Monica Belluci et Vincent Cassel viennent d'avoir une petite fille. Elle se prénomme Deva et elle est née samedi. Noah Wyle a annoncé qu'il quitte la série Urgences. L'un des derniers survivants du casting original (avec...

Prêts de bourses

3 septembre 2004

Nouvelle exceptionnelle : Le gouvernement Charest a décidé de revoir sa politique sur les prêts et bourses, et de réviser de fond en comble le système d'aide financière aux études. De récentes études ont été déposées sur les bureaux du Premier Ministre et celui du ministre Reid, faisant la démonstration du fait incontestable qu'un financement accru des études universitaires, notamment par le biais d'un allègement de l'endettement étudiant, voire l'éradiction pure et simple du...