vendredi 26 juin 2009

LES QUATRE FORMATS AUDIO LES PLUS RÉPANDUS EN 2009 À BAS DÉBIT

LES QUATRE FORMATS AUDIO LES PLUS RÉPANDUS EN 2009 À BAS DÉBIT

Notes explicatives

§ Ce topic ne fait que donner mon point de vue sur les quatre formats audio les plus en vogue. Il ne s’agit nullement d’un historique, mais juste d’une série de commentaires aussi objectifs que possible.

§ Par « bas débit », j’entends des fichiers dont le bitrate maximal ne dépasse pas 128 kb/s.

§ Par « bitrate » (appelé également « débit » ou encore « vitesse de transmission »), comprenez le nombre de bits que, chaque seconde, l’encodeur utilise dans un fichier en vue de coder du son (ou des images, mais ce n’est pas le sujet ici…).

§ Le VBR est un mode d’encodage de fichiers tel que le bitrate varie dynamiquement chaque seconde au sein dudit fichier en fonction de la nature et de la complexité des données, ce qui confère une qualité audio constante et souvent bonne. Le CBR, lui, encode à bitrate quasi-constant

§ Par « encodage », veuillez saisir diminution de la taille d’un fichier son en un fichier de format plus compact, par suppression d’informations redondantes ou jugées telles

1. Le MP3

Il s’agit de l’un des premiers formats audio à être connus du grand public, surtout internaute. Conçu par l’institut Fraunhofer déjà depuis fin 80, il s’est sans cesse amélioré depuis. De plus, cette ancienneté dans la conception lui confère une compatibilité quasi-parfaite avec les lecteurs du moment (radios, baladeurs, platines DVD, téléphones), ce qui fait de lui un format souple et polyvalent.

Bien entendu, polyvalence ne rime que rarement avec qualité et c’est le cas de le dire pour le MP3. En effet, l’audiophile averti sentira qu’à 128 kb/s, malgré les améliorations des algorithmes d’encodage, le son manque de certaines notes dans les aigus extrêmes. En dessous de ce bitrate, c’est le cauchemar auditif assuré où métallisation du son cohabite avec pertes profondes des sons aigus ou proches des aigus, particulièrement quand le bitrate maximal est de 64 kb/s… Notons en passant qu’outre le bitrate, la qualité sonore est grandement fonction de l’encodeur utilisé. Alors que les algorithmes récents (du genre Lame 3.9xx) accomplissent des exploits, les encodeurs de premières générations piétinent parfois sérieusement ! Ainsi, une chanson X codée à 128 kb/s aura un son plus ou moins irrespectueux de l’original selon l’algorithme utilisé.

Comme j’y suis, l’encodage en MP3 prend du temps même avec un ordi puissant style Pentium IV. Certes, l’encodeur Xing est rapide, mais seule la dernière version (payante…) produit des MP3 écoutables. Et je vous épargne les péroraisons sur la lenteur extrême lorsqu’on encode en VBR… Certes, le mode VBR, du fait qu’il adapte le débit binaire à la complexité du son, donne des résultats louables, mais la taille des MP3 créés, si l’on désire bénéficier de ladite qualité louable, grossit démesurément (plus de 160 kb/s) et… sort par conséquent de mon topic !

Bref, le MP3 n’est pas très fameux en bas débit. Heureusement pour lui, l’espace de stockage des disques durs et des baladeurs ne cesse d’augmenter. Format archi-répandu, le MP3 a encore de très très longs jours devant lui.

2. Le WMA

N.B. : Ma prolixité pour ce format ne doit que ne pas vous inquiéter. Ce n’est pas par hasard que je me nomme WMA Imperator…

Créé sous sa syntaxe binaire actuelle en fin 99, le WMA est le format de la cupide Micro$oft. Il utilise, semble-t-il, du moins globalement, des algorithmes de compression similaires à ceux du MP3. Toutefois, des améliorations notables sont apportées par rapport à l’ancêtre. Dès les origines, à des débits inférieurs à 128 kb/s, le WMA produit un son plus net et plus riche que le MP3. Ce n’est pas si terrible, Madame Métallisation sévissant en ces si bas débits, mais c’est appréciable… La version 9 du WMA, sortie fin 2002, améliore encore le rendu sonore, bien qu’on ne soit pas au niveau du MP3 Pro. Il est vrai qu’à 128 kb/s, la qualité du son dépasse très légèrement celle du MP3 (et encore pour certaines chansons), mais à 96 kb/s et surtout à 64 kb/s, ses concurrents (AAC et Ogg Vorbis) donnent des résultats des plus appréciables.

Question vitesse d’encodage, elle est l’une des plus rapides parmi les formats audio, en tout cas la plus rapide des cinq formats et ce, même en mode VBR[1] ! Et celui-ci produit un son fort convenable à des débits compris entre 50 et 100 kb/s à partir de VBR 50 (qualité dite moyenne). En effet, Micro$oft est parvenu à soigner la restitution des sons de bas volume et à réduire la métallisation, mais au détriment des basses quand le débit est aussi faible. En mode VBR, préférez l’encodeur 9.0 ou 9.2 et non 9.1 qui produit des fichiers inutilement lourds, mais de qualité étrangement identique aux mêmes fichiers produits en 9.0 et 9.2 ! Allez-y comprendre quelque chose… Dieu merci, l’encodeur WMA est gratuit.

Cela n’empêche cependant pas Micro$oft de jouer à l’ultra-capitaliste, notamment en étant en bonne intelligence avec des individus partageant sa tendance. Il a ainsi réussi à doter les WMA, de manière optionnelle (ouf !), de tout un système de protections alias DRM qui restreint singulièrement l’utilisateur des fichiers dans ses manœuvres peu innocentes sur lesdits fichiers, je veux dire par là gravure (limitée généralement à moins de sept fois) et la copie (proscrite sur un autre ordi, limitée à très peu de fois sur un baladeur). Cette option, qui fait la joie des maisons de disques, est kafkaïenne pour l’utilisateur lambda. En effet, non seulement que les lecteurs des WMA protégés ne courent pas les rues et coûtent nettement plus cher que leurs homologues incapables de lire du DRM, mais en outre, la manipulation future desdits WMA s’avère ardue, voire à risque, tant pour le fichier que pour la machine. C’est la raison pour laquelle des logiciels de crack du genre FairUse4WM sont, pour beaucoup, un petit moïse du piratage…

Afin de damer le pion à ses concurrents, la firme de Redmond a jugé utile de décliner son format en multiples variantes. À côté de la version basique, dite standard (ou classique, la plus répandue), on retrouve la version vocale, la version lossless (sans perte de qualité audio, du VBR pur) et la version dite Professional. Ces deux dernières variantes, non contentes de coder des sons multicanaux (jusqu’à huit), améliorent sensiblement la qualité auditive. À des débits aussi bas que 48 ou 64 kb/s, il arrive que le WMA Professional (notamment dans sa version 10, fortement améliorée par rapport à la version précédente) fasse mieux que de l’AAC ou de l’Ogg Vorbis (voir infra). Mais son mode VBR est perfectible en ces bas bitrates. Le hic dans tout ça, c’est que très peu de dispositifs lisent couramment toutes ces subdivisions du WMA. Les variantes vocale et lossless sont quasiment ignorées. La variante Pro n’est lue que par le baladeur Zune (en stéréo), les téléphones tournant sous Windows Mobile (peu répandus), la XBOX 360 et les platines Blu-Ray. Le WMA standard, pour sa part, a des chances d’être décodé presque à 100 % dans les baladeurs à mémoire flash ou à disque dur (excepté les iPod). Pour les radios, chaînes hi-fi et autres Smartphones, il faut fouiller pour dégoter du matériel compatible…

Somme toute, le WMA est un bon format si on veut économiser de l’espace de stockage. Il est plus compatible que tous ses concurrents (mis à part le MP3), mais s’avère globalement moins performant en fait de qualité audio. Mais à vouloir trop faire (cf. DRM), Micro$oft est butée à la grogne des consommateurs.

3. L’Ogg Vorbis

Le format Ogg Vorbis est la propriété de la Xiph Foundation. Sa version stable date de fin 2001 et il a depuis connu pas mal d’améliorations. Son avantage principal est qu’il s’agit d’un format libre de droits, c'est-à-dire à partir duquel l’utilisateur peut créer des milliers et des milliers de fichier sans être inquiété par quelque redevance inhérente audit format[2]. Pour les radios virtuelles et celles en chair et en os, c’est un soulagement !

Par ailleurs, Ogg Vorbis est un format essentiellement VBR, ce qui lui donne une grande qualité d’encodage. Dans les bitrates inférieurs ou égaux à 128 kb/s, il restitue un son impeccable, même à 64 kb/s. Il est juste que certains aigus paraissent augmentés, mais la métallisation se retrouve ici fortement réduite. Les procédures d’encodage en Ogg Vorbis disposent d’un modèle psycho-acoustique qui diffère largement des autres formats de compression, notamment par la possibilité d’user de plusieurs schémas prédéfinis de réduction de données (même dans une seule chanson) en fonction du contexte musical (les fameux codebook). Le WMA standard ferait pareil, mais cela reste du domaine de la spéculation. Du Par ailleurs, Ogg Vorbis offre théoriquement un son véritablement multicanal, le nombre de canaux audio pouvant atteindre le faramineux chiffre de… 256 !

Ogg Vorbis pèche cependant essentiellement dans sa popularité. C’est que seuls les audiophiles bidouilleurs de l’audio connaissent ce format. Les marques qui proposent le décodage de l’Ogg Vorbis ne sont pas des plus nombreuses quant aux baladeurs. Toutefois, les platines divX tendent systématiquement à lire ce format. Et je ne vous parle pas de la souffrance mentale qu’endure le processeur lors de l’encodage et du décodage. Les algorithmes utilisés suivent en effet, je l’ai dit, une logique fort peu apparentée à celle dont usent ses concurrents. Et ces algorithmes s’érigent en virtuoses de la complexité…

Bref, Ogg Vorbis est un excellent format plein d’avenir. Gratuit au sens total du terme, il est néanmoins encore buté à des problèmes de compatibilité et de puissance de calcul. Dès qu’ils seront levés, l’Ogg Vorbis est en passe de détrôner le MP3, voire le WMA.

4. L’AAC

Conçu en partie par Coding Technologies et en partie par Fraunhofer, l’AAC est censé corriger les artefacts indissociables du MP3, voire de l’éradiquer… Force m’est de l’avouer, il a tous les atouts quant à ce. Il ne se contente pas d’être multicanal (jusque 48 canaux audio !) et de jongler comme il se doit avec le mode VBR. L’AAC, autrement appelé MP4, accomplit des prouesses à bas débit. À 96 kb/s, ce format sonne légèrement mieux que du MP3 à 128 kb/s. À 64 kb/s, on dirait du Ogg Vorbis à ce débit, mais sans saturation d’aigus. C’est vous dire la haute qualité auditive de l’AAC. Le seul format digne de rivaliser avec le MP4 est le WMA Pro de Microsoft, dont le rendu sonore est très proche, surtout à des débits binaires inférieurs ou égaux à 96 kb/s avec la version 10.

Une évolution de l’AAC, baptisée AAC+, se tape le luxe de créer des fichiers assez corrects à 48 kb/s, grâce à un algorithme baptisé « stéréo paramétrique » (Parametric Stereo »). À ce bitrate particulièrement bas, il délivre le meilleur rendu sonore des trois formats précédents.

Revers de la médaille, l’AAC encode ses fichiers avec une lenteur désespérante. Pour ce qui est de la compatibilité, elle n’est pas très assise, l’un des rares dispositifs pouvant les décoder étant les baladeurs Ipod, heureusement de plus en plus répandus. Quant aux platines de salon et aux chaînes hi-fi qui lisent ce format, elles n’abondent guère. Notez enfin qu’à l’instar de Micro$oft, de manière optionnelle, une protection restrictive de copie et de gravure est proposée pour l’AAC, au grand dam des pirates de tout bord.

Au demeurant, le MP4, bien qu’étant presque parfait en termes de qualité audio, ne fait pas de bons points dans les branches compatibilité et vitesse d’encodage, à l’instar de l’Ogg Vorbis.

Conclusion finale

Quel format audio faut-il alors adopter ? Tout dépend de l’usage destiné aux fichiers encodés. Si votre mélomanie ne s’exprime que sur PC, seul votre organe auditif sera l’ultime juge. Et là, tout format peut faire l’affaire.

Si votre audiomanie vous tourne du côté des baladeurs à disque dur ou à mémoire flash, l’économie d’espace de stockage sans sacrifice de la qualité sonore s’impose. Ici, on fait de grands signes d’adieu au MP3 qui, on l’a vu, est une injure pour l’ouïe à bas débit.

Pour l’écoute à une chaîne hi-fi de la musique gravée sur CD ou DVD, le format qui vaut est le WMA. En effet, pour peu que ladite chaîne lise ce format, il produit des fichiers de qualité acceptable et de taille réduite, surtout en mode VBR 50 ou 75. De plus, sa compatibilité grandissant, vous ne serez pas dépaysé.

Au cas où vous désireriez diffuser sur le Net ou en radiodiffusion standard avec un son net et tolérable, seuls trois formats attirent mon humble attention : l’AAC, le WMA et l’Ogg Vorbis, avec une préférence pour ce dernier. C’est que le format de la Xiph Foundation, je vous l’ai dit, est libre de droits, ce qui signifie que la station de radio ou le serveur Internet n’auront pas à payer de redevances qui seraient rattachées au format (les redevances musicales demeurant…).



[1] Du moins dans la version classique, la version Pro et la version Lossless multicanale n’étant pas des plus véloces dans l’encodage… Voir infra.

[2] Ce qui ne veut nullement dire que la musique enregistrée échappe à la redevance audiovisuelle !