dimanche 20 janvier 2008

LE WMA, UN MAUVAIS FORMAT ?

LE WMA, UN MAUVAIS FORMAT ?

Lorsqu'on visite les forums sur le Net avec comme objectif de savoir comment le WMA est vu par l'opinion « webatique », on flippe grave, surtout si on s'avère être un inconditionnel du format de Microsoft, comme moi. Mis à part la mauvaise foi pathologique qui anime quantité d'intervenants, notamment sur le site http://forum.hardware.fr, s'il s'agit d'opérer une synthèse des avis et considérations, il se dégage trois plaintes essentielles :

  • Le WMA est de piètre qualité
  • Le WMA n'est pas compatible
  • Le WMA est bourré de protections handicapantes

Essayons, dans la mesure du possible, de remettre les choses en ordre, car la confusion due à l'ignorance de certaines notions de base a élu domicile dans les espaces virtuels de discussion.

  • Le WMA est de mauvaise qualité

La cause principale des WMA de mauvaise qualité réside dans l'usage des débits trop bas lors de l'encodage. La pierre est ici à lancer avec vigueur à Micro$oft qui a fait croire dès le départ que ripper des CD à 64 Kbits/s constituait l'idéal… Or à ce débit, aucun format audio n'offre une qualité finale satisfaisante. Fort malheureusement, par défaut, Windows Media Player pour XP encodait à cette valeur, au grand dam des audiophiles. À partir d'un débit binaire de 96 Kbits/s, le WMA et tous ses concurrents, excepté le MP3 (même avec Lame 3.98), encodent avec qualité.

La qualité de la source doit également être prise en compte bien avant d'incriminer hâtivement le WMA. En effet, quand un son d'origine est déjà de qualité discutable, au mieux, après conversion, ladite qualité sera conservée et au pire, elle sera davantage dégradée. Ainsi par exemple, ne vous attendez pas à un miracle style multiplication des pains si vous encodez en WMA un MP3 issu d'un très mauvais encodeur ou le son d'une énième copie d'un album antédiluvien des Boney'M.

Enfin, la variante du WMA utilisée influe beaucoup sur la qualité audio du fichier de destination. Encoder notamment sa musique favorite à l'aide du codec WMA Voice serait une grave erreur, cette variante du WMA ne codant correctement que les fréquences vocales. Je me garde de dire que la version du WMA a une incidence sur la qualité. Globalement, depuis 1998, année de la première version du WMA, jusqu'en 2006, date de sa dernière mise à jour, du moins en bitrate constant (CBR) et ce, à partir de 96 Kbits/s, le WMA a toujours fait preuve d'une excellente compression des données audio…

  • Le WMA est incompatible

En cette année 2008 commençant, affirmer que la compatibilité du WMA est chancelante s'avère téméraire. Et ici, je parle du WMA standard, les autres variantes ayant chacune un usage bien spécifique, consacré soit à l'archivage ou au streaming sur le Net, donc réservé au monde du PC, soit à la haute définition, donc destiné aux platines DVD haut de gamme. Le WMA standard, en effet, est lu par quasiment tous les baladeurs numériques sortis après 2005, y compris les iPod de dernière génération. Un nombre sans cesse croissant de chaînes hi-fi et d'autoradios lit ce format sans problèmes.

Bien entendu, la compatibilité du WMA ne vaut pas celle du vénérable MP3 qui a eu plus de 15 ans à s'affirmer. C'est ainsi que rares sont les téléphones portables et les lecteurs DVD qui lisent le format de Micro$oft. Par ailleurs, dans les pays dits émergents ou carrément à la traîne, le WMA passe totalement inaperçu, sauf peut-être au niveau des baladeurs à mémoire flash qui inondent le marché informatique grâce à nos amis les Chinetoques.

Toutefois, il convient d'avoir l'honnêteté intellectuelle de déclarer que par rapport aux autres formats audio, le WMA standard dispose réellement d'une vaste gamme de consommables pouvant le décoder. L'AAC, alias MP4, par exemple, à part sur iPod et quelques rares Nokia série N, est illisible sur d'autres équipements qui décodent pourtant correctement le MP3 ou le WMA. Ne parlons même pas de l'Ogg Vorbis, certes excellent en fait de qualité sonore finale, mais reconnu par moins de dix marques de baladeurs et par quelques lecteurs de DVD qui peuvent lire des DivX.

  • Le WMA est bourré de protections handicapantes

Je partage sincèrement le désarroi de ceux qui, sans pénétrer les options du Lecteur Windows Media, ont encodé des dizaines de CD audio en WMA. Ils ont eu la légitime et désagréable surprise de voir leurs fichiers illisibles une fois leur disque système formaté ou dès que ces fichiers étaient transférés sur une autre machine. Les malheureux utilisateurs en question avaient simplement omis de désactiver la case à cocher du genre « Protéger contre la copie », accessible dans le menu Outil, puis Option (lisez l'aide du lecteur pour plus de détails). Comprenant sa bêtise (bien tardivement), Micro$oft, Dieu merci, a désactivé par défaut cette case dans la version 10 de son Lecteur. Quant à la version 11, du moment que je ne compte pas la tester de sitôt (j'adore XP et le mien est craqué ; je me méfie comme du Diable de Vista), je ne peux rien vous affirmer.

Je partage tout autant la consternation de ceux qui ont transformé leur carte de crédit en carte de visite à force d'acheter en ligne des WMA. Une restriction pire que celle de Prison Break fut subie par ces mélomanes friands de hi-tech. Transferts extrêmement limités et lectures problématiques constituaient leur pain quotidien. L'expert pirate, utilisant sa carte son comme un enregistreur, peut, au prix d'une faible perte en qualité, contourner ces fâcheuses emmerdes. L'utilisateur lambda, cependant, vit ici dans une angoisse teintée d'absurdités et de sourde colère, digne d'un roman de Kafka.

Que les choses soient bien claires ici ; tout WMA n'est pas protégé ! Hormis les outils (payants en plus) de Micro$oft de sa plate-forme Windows Media Technologies aux allures de sbire du Gouvernement Mondial, et hormis Windows Media Player (gratuit ?), très rares sont les logiciels qui encodent les WMA avec protection du contenu. Un WMA n'est protégé que si telle est la volonté de celui qui encode, volonté, avouons-le, parfois relative, à la manière d'un dol (cas de la protection par défaut du Lecteur Windows Media dans la plupart de ses versions). Ainsi, tous les freewares de conversion des fichiers audio ne créent pas des WMA protégés. Même le Codeur Windows Media, outil de Micro$oft pourtant, ne protège pas les fichiers par défaut.

  • Le WMA n'est pas si parfait que cela, malgré tout…

Lorsqu'on possède toute une collection de WMA issus de diverses sources, il est archi-certain que le niveau sonore est différent d'un fichier à un autre. Il serait hyper-intéressant que tous les morceaux, quand on les écoute à travers un baladeur, sonnent avec un niveau de volume presque identique. Pour les MP3, le problème est résolu grâce à l'outil MP3Gain, très efficace. Un tel logiciel manque cruellement pour la gestion du format de Micro$oft. Ça lui apprendra à chercher à tout prix à protéger ses codes sources…

En outre, quasiment aucun éditeur audio, de nos jours, ne peut décoder en import ni exporter le format WMA, même le plus standard possible. Encore la faute à la firme à Billou, pour les mêmes raisons que celles évoquées supra…


 

LE WMA ET SA CACOPHONIE DE VERSION

LE WMA ET SA CACOPHONIE DE VERSION

Dès 1998, Microsoft ambitionnait de créer un format censé virer du monde multimédia le vénérable MP3. Aussi créa-t-elle le WMA. (Windows Media Audio) version 1, qui fut suivie peu de temps après par la version 2 en 1999. Il est vrai que déjà à ce stade de développement, le WMA surpassait en qualité le MP3 à bas débit (< 96 Kbits/s). Il est tout aussi vrai que la métallisation du son à ces bitrates sonnait plus que clairement, ce qui eut l'effet inverse escompté par la firme de Redmond : l'impopularité du format, rendue rapide entre autres par sa diffusion via l'ancêtre du Divx créé par qui vous savez et dont l'audio était du WMA version 2 et la vidéo du MPEG 4 façon Microsoft. Mais là n'est pas la question...

La version 7 (qui, en fait, est la version 2 à peine améliorée…) du format, distribuée essentiellement par Windows Media Player de la même version, en 2000, se devait de corriger certains artefacts de compression. Elle ne le fit pas trop bien. Les ingénieurs à Billou le savaient sûrement, car aucun battage médiatique quant à l'amélioration de qualité ne fut observé sur le Net. En fin 2001 apparaissait Windows Media Player 8 et Windows Media Audio 8. Microsoft osa prétendre que cette version à 64 Kbits/s sonnait comme du MP3 à 128 Kbits/s... Mensonge grossier qui discrédita son format de plus belle. Les détracteurs en firent des gorges chaudes. Et avec raison. En effet, certes le WMA 8 améliorait nettement le rendu sonore à bas débit, en y enjoignant plus d'aiguës. Toutefois, la métallisation à 64 Kbits/s est tout simplement effrayante, parfois pire que celle du WMA version 2 avec certains morceaux ! Même l'audiophile radin sentirait le désagrément.

De peur de perdre définitivement la face à leurs concurrents, Billou et ses potes, en fin 2002, présenta au public mélomane une pure merveille (il faut avouer) : le WMA version 9. Différents artefacts à bas débit étaient nettement atténués, y compris la métallisation. À partir de 96 Kbits/s, la courbe sonore s'enrichissait nettement en aigues, au point que du WM A 9 à 128 Kbits/s, à moins d'une oreille très sensible, est très peu différent de l'original pour certains morceaux. Par ailleurs, le WMA 9 se permit de se scinder en plusieurs variantes en fonction des besoins. Ainsi, la version classique, lue par nombre d'équipements audio, convient à l'audiophile lambda. La version dite Professional (WMA Pro) augmente encore la qualité de restitution et se tape le luxe de coder des sons multicanaux. Malheureusement, sa lecture hors du PC s'avère anecdotique. Alors que la version dite sans perte (Lossless) faire le bonheur de l'audiophile confirmé (perte quasi-nulle de qualité par rapport au son d'origine), la version vocale (WMA Voice) sera utilisée pour des extraits purement vocaux où elle s'en sort assez bien, même à des débits inférieurs à 20 Kbits/s. Encore malheureusement, WMA Lossless comme WMA Voice souffrent d'un très sévère défaut de compatibilité avec les appareils du moment. Enfin, le WMA (sauf dans sa variante Voice) -- il était temps -- fut dotée, dans cette version 9e du nom, d'un mode VBR optionnel (sauf en WMA Lossless où il est imposé) qui a le don de créer d'excellents fichiers à débit réduit et ce, avec un minimum de métallisation. Bref, WMA 9 est une bombe et là, le battage médiatique de Microsoft fut pleinement justifié...

Depuis lors, les développeurs de la firme de Redmond semblent bloqués quant à faire évoluer le WMA. C'est ici que débute une cacophonie de versions, aussi inutiles les unes que les autres, généralement basées sur la version 9.

Fin 2004, Windows Media Player passe de la version 9 à la version 10, et, avec lui, le WMA passe de la version 9 à la... 9.1. ! En mode CBR, quel que soit le débit, du moins pour le WMA classique, sauf erreur de ma part, l'amélioration de qualité est presque indécelable rapport à la version 9 ! En mode VBR, pareil, avec comme bonus désagréable que le bitrate augmente dangereusement et inutilement. Cependant, des améliorations notables sont ressenties en WMA Pro, CBR comme VBR, notamment à des débits inférieur à 96 Kbits/s pour du WMA Pro CBR stéréo et, pour du WMA Pro VBR qualité de 50 à 10, pour du son multicanal. Quant au WMA Lossless et au WMA Voice, je mets au défi les ingénieurs de Microsoft de démontrer une once d'amélioration...

Juin 2006, Windows Media Player passe la version 10 à la version 11 et le WMA passe de la version 9.1 à la version... 9.2, voire 10 selon les variantes ! Ainsi, WMA Pro passe carrément à la version 10 et WMA Lossless passent de la version 9.1 à la version 9.2. Je ne crois pas qu'il existe à ce stade du WMA Voice 9.2... Le WMA classique, quant à lui, est estampillé 9.2. Question qualité, avouons que Billou et ses potes ont quand même fait des progrès avec la version 10 du WMA Pro. WMA 9.2, quant à lui, surtout en modes VBR 10 à VBR 75, respecte mieux les instruments jouant faiblement que les versions antérieures, mais ces changements ne sont pas trop décelables... Il est cependant quelque chose que je ne pige pas. Pourquoi WMA Pro 10 est incompatible avec les décodeurs WMA Pro 9.1 et 9 ? Pourquoi faire évoluer WMA Lossless qui est déjà sans perte ? Aux développeurs de Microsoft de répondre...

Force m'est de soupçonner qu'à partir de 2004, la firme de Redmond semble incapable de faire évoluer la courbe fréquentielle et auditive du format WMA classique sans nuire à sa compatibilité avec les équipements actuels. Elle a osé se risquer en apportant des correctifs au WMA Lossless (Dieu sait pourquoi...) et au WMA Pro, probablement parce que ces deux formats ne sont pas répandus.

Il y a aussi un aspect des plus importants qui peut expliquer ces sauts lilliputiens de version : la gestion du DRM dont les règles et les implémentations semblent évoluer avec le format lui-même...

Décidément, Microsoft, tes plans sont tortueux à n'y rien voir...

PETIT GUIDE CHIFFRÉ DES PARAMÈTRES AUDIO ET VIDÉO DE CAPTURE DANS L’UNIVERS WINDOWS MEDIA POUR UN USAGE ORDINAIRE

PETIT GUIDE CHIFFRÉ DES PARAMÈTRES AUDIO ET VIDÉO DE CAPTURE DANS L'UNIVERS WINDOWS MEDIA POUR UN USAGE ORDINAIRE

  • Que ceux qui s'imaginent que je vais donner des astuces chiffrées en vue de l'audio impeccable (style 5.1) ou de la capture HD passent leur chemin. Par ailleurs, que sautent également ces lignes ceux qui comptent trouver d'autres outils de capture que ceux proposés par Microsoft
  • Pour comprendre ce topic, une bonne connaissance de Windows XP est requise, ainsi qu'une bonne maîtrise des notions de codecs
  • Les pré-requis
  • Pour l'audio
    • Hardware
    • Un Pentium III à 800 Mhz peut faire l'affaire. 30 Go de disque dur et 128 Mo de RAM, c'est un bon début
    • Une carte son dans le PC avec les trois entrées habituelles (entrée ligne, Mic et Speaker). Voir le topic http://wmaimperator.afrikblog.com/archives/2006/11/26/3270684.html pour plus de détails. Même une carte son intégrée à la carte mère peut faire l'affaire
    • Toute la connectique câblée qui reliera la source audio de capture à l'ordi (voir topic susmentionné)
    • Software
    • Présence fortement recommandée du Lecteur Windows Media Série 9 qui installe les codecs WMA (Windows Media Audio) estampillés 9.0. Les versions suivantes du lecteur installent les codecs estampillés 9.1 (version 10) ou 9.2 (version 11). Ces deux dernières versions ont la fâcheuse tendance de grossir démesurément les fichiers issus de la capture si le mode VBR a été utilisé. Dans la mesure du possible, cantonnez-vous à l'utilisation du Lecteur dans sa 9e version. Mais cela n'est nullement obligatoire
    • Présence obligatoire du Codeur Windows Media Série 9, de préférence la version datant de 2003 avec codecs non mis à jour vers les versions 9.1 ou 9.2
    • Présence nécessaire, au choix, du logiciel dBPoweramp ou Free Wma MP3 Converter pour la conversion. Le premier est gratuit pour la conversion de tout format vers un autre, sauf pour la conversion MP3 qui est gratuite durant 30 jours. En revanche, le second est totalement gratuit, mais nécessite une connexion Internet à l'installation pour le téléchargement d'un composant qui permette la conversion en WMA
  • Pour la vidéo
    • Hardware
    • Un Pentium IV à 2 GHz avec 256 Mo de RAM constitue un minimum. Le disque dur, de préférence doit posséder une capacité supérieure ou égale à 40 Go pour éviter la surprise de la saturation.
    • Une carte d'acquisition vidéo interne (port PCI) ou externe (port USB)
    • Un câble S-Vidéo, composite (RCA) ou RF IN, selon le cas. Le câble composite, très bon marché, a l'avantage d'être très répandu et facilement allongé (voir topic susmentionné)
    • Software
    • Le système d'exploitation obligatoire est Windows XP, de préférence XP Professionnel. En effet, cette version permet une meilleure distribution des charges de calcul d'encodage dans les cartes mères dotées de plusieurs processeurs ou d'un processeur double cœur (Dual Core), l'encodage vidéo étant très friand de calculs fort complexes
    • Présence recommandée du Lecteur Windows Media Série 9
    • Présence obligatoire du Codeur Windows Media Série 9
    • Un logiciel gratuit ou payant de conversion est nécessaire si vous voulez lire vos vidéos sur platine DVD, VCD, voire DivX. Je pense notamment aux produits comme Adobe Premiere, Virtual Dub ou TmpGenc
    • Capture audio

Je ne le répéterai jamais assez, le mode VBR basé sur la qualité (appelé également VBR en une passe) est excellent pour la capture audio. Il réduit en effet les distorsions audibles (pré-écho, métallisation) tout en maintenant une qualité acceptable et ce, même à débit réduit (du moins quand la version 9.0 des codecs est utilisée)

  1. Si vous êtes sur que l'audio capturé ne sera pas reconverti plus tard
    1. Pour l'audio musical (chansons)

Capturez en VBR 50 (qualité dite moyenne) si le son provient d'une source « fiable » (comme une sortie audio décodeur satellite ou une sortie audio stéréo d'un lecteur DVD). Capturez en VBR 75 (paramètre dit de bonne qualité audio) si le son manque quelque peu d'aigues (son provenant d'une vieille K7 audio ou vidéo, vieilles chansons en clips vidéo passant notamment dans des émissions comme Trace Legend) ou si le son est monophonique

  1. Pour l'audio tourné vers la parole (documentaires généralistes, journal radio ou télé)

Capturez en VBR 10 si le son est stéréophonique ou en VBR 50 si le son est monophonique

  1. Si l'audio capturé est susceptible de retouches et/ou de conversion vers un autre format et/ou vers un autre bitrate

Les paramètres de capture doivent être réglés dans des valeurs telles que les pertes de qualité finale soient très négligeables, voire inexistantes. Capturez donc en VBR 100 (sans perte ou Lossless) si vous êtes un puriste, en VBR 98 ou VBR 90. Le dernier mode est recommandé
si vous désirez économiser de l'espace disque dur

  • Capture vidéo

Ici également, le mode VBR est fortement recommandé : il crée des fichiers vidéo de taille réduite, mais de qualité appréciable, avec réduction de la pixellisation autant que nécessaire.

  1. Si vous voulez conserver votre vidéo au format WMV
    1. Capture des clips musicaux (Trace TV, MCM, etc.)
  • Paramètre audio : WMA VBR 75
  • Paramètre vidéo : WMV9 VBR 83, qui est une qualité satisfaisante. Vous avez le choix de la résolution : 320*240 ou 640*480. Pour le premier cas, selon la complexité des scènes, le fichier final aura une taille oscillant entre 120 Mo et 400 Mo en moyenne pour une heure de capture. La qualité sera supérieure à celle d'un VCD (moins de pixellisation) mais à taille de fichier réduite. Elle sera inférieure à celle d'un DVD, vu la pixellisation encore décelable et le léger effet de flou dans le résultat final. Si vous optez pour une résolution de 640*480, le fichier vidéo sera plus lourd (entre 400 et 900 Mo pour une heure de capture) et les calculs de compression plus complexes, mais la qualité sera nettement
    améliorée, très proche de celle d'un DVD, mais environ trois fois et demie plus léger ! Ici, la pixellisation est très difficilement décelable, à moins que la source vidéo soit vraiment pourrie
  1. Capture des émissions diverses, hormis les clips audio (films, séries, journaux télévisés, etc.)
  • Paramètre audio : WMA VBR 50 est amplement suffisant
  • Paramètre vidéo : WMV VBR 83, résolution 320*240 ou 640*480, selon vos besoins
  1. Si la vidéo capturée est susceptible de retouches et/ou de reconversion
  • Paramètre audio : WMA VBR 90, qui est un sous-paramètre de haute qualité audio
  • Paramètre vidéo : WMV VBR 95, qui est un sous-paramètre de haute qualité vidéo. La résolution sera ici de 320*240. Le fichier final, pour une heure de capture, peut atteindre 4 Go si les scènes sont très détaillées (changements rapides et fréquents de plans, mouvements rapides, etc.) ! Cependant, la qualité finale est identique à l'original et pour une source de très haute facture, la qualité peut dépasser celle du DVD !

Évitez de capturer avec des résolutions supérieures, du genre 720*576 (résolution native DVD), 1080*720 ou même 1920*1080 (résolutions HD), surtout en VBR : votre PC risque d'accuser des signes de fatigue à l'encodage (le processeur étant soumis à rude épreuve, ce qui occasionne de dangereuses surchauffes) et votre disque dur risque de saturer rapidement (le flux pouvant dépasser allègrement 8 Mbits/s !)

LES CINQ PIÈGES QU’UN TESTEUR AUDIO DU FORMAT WMA DOIT ÉVITER

LES CINQ PIÈGES QU'UN TESTEUR AUDIO DU FORMAT WMA DOIT ÉVITER

  1. Évaluation de plusieurs variantes du WMA

Le testeur audio du format WMA ne peut objectivement comparer une variante particulière de ce format avec une variante normale d'un autre format. Exemple : établir un comparatif audio entre le format AAC normal à 96 kb/s et le format WMA Pro à 96 kb/s. Les plus raisonnables de comparer par exemple le WMA standard avec l'AAC normal ou encore le WMA Pro avec l'AAC amélioré appelé HE-AAC.

  1. Le respect du bitrate, du nombre d'échantillons par secondes et de la résolution en bits

Exemple : il serait aberrant de tester un WMA à 64 kb/s, 44 kHz, 16 bits, avec un ogg vorbis à 96 kb/s, 48 kHz et 16 bits. En effet, la qualité audio est directement proportionnelle au débit, au taux d'échantillonnage et au nombre des bits de codage par échantillon. Il convient que ces trois valeurs soient rigoureusement identiques d'un format à un autre pour espérer obtenir des résultats objectifs.

  1. Le respect du mode CBR ou VBR

Exemple : on ne peut comparer un WMA à 96 kb/s avec un MP3 VBR à débit moyen de 96 kb/s. En effet, cela serait pécher contre la règle précédente dans la mesure où le mode VBR crée des fluctuations de débit, ce qui fait qu'on triche en quelque sorte sur la qualité du fichier encodés en ce mode (car le mode VBR améliore la qualité). La grande exception est le format ogg vorbis qui est nativement du VBR pur, même si des options CBR sont proposées. C'est peut-être pour cela que la qualité sonore des fichiers qu'il produit est généralement très bonne, même en bas débit.

  1. Analyse fréquentielle

Il est vrai que dans des débits inférieurs à 192 kb/s, du point de vue spectral, le format WMA supprime plus de fréquences aiguës que le MP3. En effet, avec l'encodeur LAME version 3.97 et suivantes, les pics de fréquences atteignent 16 kHz, même à 96 kb/s, alors qu'ils nagent aux alentours de 15.4 kHz pour afficher WMA 9.2 à ce même débit. De même, à 160 kb/s, MP3 atteint presque 19 kHz, alors que WMA atteint péniblement 18 kHz. Beaucoup de testeurs ont vu en cela une déficience du WMA au niveau de l'encodage des hautes fréquences. Il convient de se garder de tirer pareille conclusion, le dernier arbitre étant l'oreille humaine. Pour un débit de 96 kb/s, à l'écoute, il est plus que clair que WMA conserve plus d'aigues et une plus grande richesse instrumentale que le MP3 ! Certains disent même qu'à 160 kb/s, voire à 128 kb/s, le son en WMA paraît plus naturel que le même son en MP3 en ces bitrates. Tout est question de modèle mathématique utilisé lors de la suppression des sons dits inutiles. Apparemment, dans ces vitesses de transmission, WMA dispose d'un modèle plus raffiné.

  1. Bruits blancs et autres complications sonores

N.B. : Ce point est un complément du point précédent.

Je ne vois pas en quoi on peut dire qu'un encodeur est mauvais si un son composé uniquement de castagnettes ou de bruits blancs est mal rendu par ledit encodeur, en écoute comme en spectre. Il s'agit là des situations rares que l'on ne rencontre qu'occasionnellement. En effet, en ce qui concerne les castagnettes et autres sons aigus hyper-répétitifs, du moins pour le WMA, ils sont bien rendus à partir de 128 kb/s ou à partir de VBR 75. Seule une écoute d'experts ou avec du matériel haut de gamme peut déceler des imperfections à ces bitrate et mode. Avouons-le, le commun des mortels dont je fais partie n'a que faire de telles considérations...

Quant au bruit blanc (le fameux « souffle » qui se fait entendre lorsqu'aucune station radio n'est captée, notamment sur des postes analogiques), quel intérêt pratique que de le tester, du moment que dans la musique quotidienne, tous genres musicaux confondus, ils n'interviennent qu'en petites séquences de quelques secondes et encore de manière fort occasionnelle, par effet de style ? Par ailleurs, en WMA, même en VBR 25 ou en CBR 48 kb/s, le bruit blanc est identique au son original, malgré la coupure du spectre ! A fortiori à des débits plus élevés...

CODER EN WMA VBR À L’AIDE DES CODECS WINDOWS MEDIA AUDIO SÉRIE 9

CODER EN WMA VBR À L'AIDE DES CODECS WINDOWS MEDIA AUDIO SÉRIE 9

  1. INTRO

WMA est un acronyme signifiant Windows Media Audio. Il s'agit d'un format de compression de données audio permettant de convertir, en occupant le moins de place possible, des sons provenant de diverses sources (CD, fichiers, captures extérieures provenant d'une radio, d'une télé, d'un décodeur satellite, …). On appelle codecs l'ensemble de programmes et d'algorithmes permettant justement la compression, voire la décompression, desdites données. Tout format audio (MP3, OGG Vorbis, Real Audio, …) a recours à ses propres codecs pour sa lecture ou la création de ses fichiers. Moi, j'ai craqué pour le WMA, format de Microsoft, qui l'a créé et promu. À mon avis, il n'a qu'un seul concurrent sérieux sur le marché quant à la qualité auditive : l'OGG Vorbis. En effet, ce dernier, à taille de fichier égale, offre une meilleure restitution sonore que le WMA. Le hic, c'est que OGG Vorbis demeure incompatible avec non seulement la majorité de logiciels de gravure standard, mais en plus et surtout avec les baladeurs numériques (baladeurs CD ou avec mémoire flash). WMA, lui, ne cesse de gagner en compatibilité.

Que signifie « VBR » ? Il s'agit d'un autre acronyme voulant dire « Variable Bitrate », en français « débit variable ». Le bitrate, appelé également vitesse de transmission ou encore débit, est le nombre de uns et de zéros (bits) qui est alloué à une seconde de son pour son codage. Plus il est élevé, meilleure est la qualité du son codé par rapport au son d'origine. L'unité de mesure du bitrate est le kilobit par seconde (kb/s ou Kbits/s). Le débit est dit variable lorsqu'à l'intérieur d'un fichier codé (son comme image), ledit débit fluctue chaque seconde à plusieurs reprises en fonction de la nature du son. Lorsque celui-ci est complexe (ex : s'il comporte beaucoup d'aiguës), il est codé avec un débit élevé. À l'inverse, si le son est simple (ex : les basses et les voix) ou même nul, le débit chute. Le résultat ? Le son est codé avec une qualité constante, très souvent supérieure à celle qu'offre le codage à débit constant (codage dit CBR : Constant Bitrate) en valeur moyenne. Ex : en mode VBR 50, le débit fluctue environ entre (théoriquement) 50 et 95 kb/s (en pratique, ce n'est pas toujours le cas). La moyenne de cette fourchette est de 72 kb/s. En mode CBR, un son codé même à 80 kb/s a une qualité inférieure au même son codé en mode VBR à bitrate moyen de 72 kb/s.

D'aucuns me demanderont pourquoi j'ai choisi le WMA comme format de codage de mes sons et non le MP3 qui est un format plus répandu et, il est vrai, plus compatible. Il est des raisons valables qui m'ont poussé à négliger le MP3 :

  • Pour une qualité acceptable, le bitrate du MP3 doit être au minimum de 128 kb/s en CBR, alors que le MP3 se contente de 96 kb/s. en mode VBR, WMA peut même descendre jusque 50 kb/s, là où MP3 devra utiliser une vitesse de transmission d'au moins 80 kb/s ! Comme vous le voyez, on gagne nettement de place en codant en WMA
  • Le codage WMA est très rapide, même en VBR. De plus, la capture du son en temps réel monopolise très peu de ressources processeur. Je ne connais pas de logiciels qui font de la capture en MP3 VBR en temps réel sans que le processeur ne peine dur
  • Les deux autres raisons qui suivent, bien qu'elles ne m'aient pas particulièrement motivé pour le choix du WMA, l'ont grandement influencé :
  • Le format WMA Professional permet de capter ou de convertir du son avec une haute qualité due soit à la fréquence de codage et du nombre de bits par échantillon élevés (ex : 24 bits, 96 kHz, au lieu de 16 bits, 44 kHz), soit à cause du nombre d'enceintes (ex : système Home Cinema : 5.1). Ce format sort du cadre de notre exposé et nous ne l'aborderons pas ici.

Le format WMA sans perte (Lossless) permet de capter ou de convertir de la musique sans perte de qualité auditive ni fréquentielle du son d'origine, en haute résolution comme le WMA Pro ou en résolution normale (16 bits, 44 kHz)

Ces deux avantages supra sont néanmoins assez relatifs. En effet, le WMA Pro comme le WMA Lossless sont très peu compatibles avec les appareils du marché (les marques des lecteurs tiennent sur le doigt d'une main). Par ailleurs, sur PC, Windows XP doit être installé pour profiter pleinement desdits formats, notamment en mode capture. Enfin, le WMA Pro et le WMA Lossless haute résolution ou multicanal demandent, pour de meilleures performances, une carte son dédiée et qui coûte la peau des fesses…

  1. CARACTÉRISTIQUES AUDITIVES DES CODAGES VBR

J'ai usé du Codeur Windows Media Série 9 pour la capture en temps réel. Pour la conversion, je me suis servi du même logiciel, mais surtout de DBPowerAmp. Comme lecteur, le Lecteur Windows Media Série 9 a parfaitement fait l'affaire. Il a également été des plus utiles pour l'extraction des CD audio.

  1. VBR 100

C'est la qualité dite sans perte. Le codec utilisé est le WMA Lossless. Un son codé à ce mode est identique à l'original. Le bitrate varie souvent entre 420 kb/s et 1 100 kb/s, ce qui est très élevé, car quatre minutes de son peuvent peser entre 12,6 Mo et 33 Mo ! Avec un disque dur de taille moyenne, c'est la saturation garantie avec moins de 500 chansons…

Le mode VBR 100 est usé généralement à l'occasion des enregistrements temporaires, soit en vue d'une gravure de qualité, soit pour une capture optimale. Il est fortement recommandé soit d'effacer le fichier capturé, soit de le reconvertir en un mode qui prend moins d'espace.

  1. VBR 98 (« qualité optimale » du Lecteur Windows Media)

Le bitrate va environ de 200 à 450 kb/s. La qualité de son convertie est également identique au son capté. Un fichier de quatre minutes pèse entre 6 Mo et 13,5 Mo, ce qui est toujours lourd pour un usage courant. Tout comme le mode VBR 100, ne conservez des fichiers codés en VBR 98 que pour les besoins de la gravure ou de la conversion.

  1. VBR 90 (« qualité élevée » du Codeur, « bonne qualité audio » du Lecteur)

Le bitrate varie approximativement entre 105 kb/s et 250 kb/s, ce qui fait qu'un fichier de quatre minutes pèse entre 3,2 Mo et 7,5 Mo, ce qui, à mon sens, est encore lourd. Question qualité, elle est équivalente de très près à l'original, si ce n'est quelques différences presque inaudibles dans les basses qui sont très légèrement atténuées. Personnellement, j'use de VBR 90 pour la capture en temps réel, et uniquement pour ça. Ne convertissez habituellement vos morceaux en ce mode que si vous avez un disque dur suffisamment balèze (au moins 120 Go).

  1. VBR 75 (« bonne qualité audio » du Codeur, « qualité moyenne » du Lecteur)

Le bitrate varie environ entre 64 kb/s et 175 kb/s. Ainsi, un fichier de quatre minutes pèse entre 1,9 Mo et 5,3 Mo. La qualité en écoute VBR 75 est très légèrement inférieure à celle d'un MP3 CBR à 128 kb/s, du fait d'une faible perte de basses assez remarquable, alors que les aiguës sont correctement conservées. C'est le mode idéal de conversion si l'ordy dispose d'un disque dur d'au moins 40 Go. Je vous déconseille néanmoins VBR 75 pour la capture en temps réel, vu la perte audible de certaines basses fréquences.

  1. VBR 50 (« qualité moyenne » du Codeur, « basse qualité » du Lecteur)

Le débit varie entre environ 40 kb/s et 112 kb/s. Un fichier de quatre minutes peut peser entre 1,2 Mo et 3,3 Mo, ce qui représente une énorme économie d'espace disque. Côté qualité, VBR 50 retire à la musique d'origine certaines basses de manière assez audible. Les aiguës extrêmes sont atténuées, voire éliminées, lorsqu'elles n'ont pas une forte intensité. Ainsi, un instrument du genre cymbale, s'il est joué à bas volume dans le son d'origine, sera inaudible ou quasi-imperceptible dans le fichier converti ou capturé.

En somme, VBR 50 produit le son d'une station FM analogique stéréo d'excellente qualité. Pour un usage audio courant, c'est l'idéal. Il suffit de bien ajuster les égaliseurs graphiques en rehaussant comme il se doit les aiguës et les basses pour retrouver presque le son d'origine, sans distorsions de type son « métallique ». Personnellement, je convertis ma musique en ce mode de manière définitive.

  1. VBR 25

Le débit varie entre 32 et 85 kb/s, ce qui fait qu'un fichier de quatre minutes ne pèsera qu'entre 960 Ko et 2,6 Mo. Le gain d'espace est encore plus grand qu'en mode VBR 50. Néanmoins, la qualité en pâtit. En effet, les basses sont manifestement atténuées et les aigus extrêmes, outre leur diminution sensible, résonnent au niveau des harmoniques, ce qui donne l'impression d'un léger son métallique lorsqu'elles sont de forte intensité. Malgré cette perte assez notable de qualité, l'effet stéréo est toujours présent. Un MP3 CBR à 96 kb/s est plus désagréable à écouter qu'un WMA codé en VBR 25, du fait d'un manque plus remarquable d'aiguës et d'une résonance métallique plus accentuée.

Seules deux raisons peuvent vous conduire à coder en ce mode :

  • La qualité CD ne vous dit pas grand-chose
  • Le son que vous codez est à prédominance vocale. En effet, le codage de la voix utilise très peu de bits et ne génère pas de distorsions audibles en VBR 25
  1. VBR 10

Le bitrate varie approximativement entre 27 kb/s et 64 kb/s. Ce mode crée les fichiers les plus légers en VBR. Ainsi, quatre minutes de son pèsent entre 810 Ko et 1,9 Mo ! En fait de qualité, il ne faut pas s'attendre à des miracles : le mode VBR 10 supprime presque totalement les sons les plus aigus et métallise les fréquences qui avoisinent lesdits sons. Dans des cas extrêmes (surtout si le son originaire est monophonique ou de piètre qualité), la voix elle-même, lorsqu'elle atteint des notes assez aiguës, résonnent légèrement des harmoniques.

N'usez de VBR 10 que pour le codage définitif de la voix dans un discours (voix parlée), jamais pour le codage de la voix chantée ou de la musique.

  1. CONFRONTATION DE QUALITÉ VBR ET ÉQUIVALENT CBR

QUALITÉ VBR 

ÉQUIVALENT CBR 

AVANTAGES DU MODE VBR

AVANTAGES DU MODE CBR 

VBR 100
 

Aucun équivalent

Qualité sans perte du spectre audio (selon les graphiques visualisés via les logiciels de traitement de son)

Aucun avantage (le bitrate CBR commun le plus élevé, qui est de 320 kb/s, tronque généralement les fréquences supérieures à 20 kHz)

VBR 98 

WMA 256 kb/s

WMA 320 kb/s 

Aucun avantage 

Aucun avantage 

VBR 90 

WMA 160 kb/s

WMA 192 kb/s 

Plus grande conservation d'aiguës 

Plus grande conservation de basses 

VBR 75 

WMA 96 kb/s

WMA 128 kb/s 

Plus grande conservation d'aiguës que le WMA 96 kb/s 

Le WMA 128 kb/s conserve plus de basses et plus d'aiguës que le WMA VBR 75. Le WMA 96 kb/s, quant à lui, conserve plus de basses (mais pas plus d'aiguës)

VBR 50 

WMA 64 kb/s

WMA 96 kb/s 

Légèrement plus d'aiguës que WMA 64 kb/s

Absence de distorsions audibles, en comparaison au WMA 64 kb/s qui crée de légers sons métalliques dans les aiguës

Plus grande conservation de basses

WMA 96 kb/s conserve en outre plus d'aiguës que WMA VBR 50

VBR 25 

WMA 48 kb/s 

Moins de distorsions métalliques et un peu plus d'aiguës

Un peu plus de basses 

VBR 10 

WMA 32 kb/s

WMA 48 kb/s 

Moins de distorsions et plus d'aiguës que le WMA 32 kb/s

WMA 48 kb/s génère moins de distorsions, plus de basses et plus d'aiguës que VBR 10


 

LE WMA EN DIX QUESTIONS-RÉPONSES


 

  • WMA, QUID ?

WMA signifie Windows Media Audio. Il s'agit d'un format de compression de données audio créé par Microsoft et utilisant des algorithmes de codage et de décodage presque similaires à ceux usés par les fichiers MP3, mais avec une compression améliorée, surtout dans la dernière version (9.2), très efficace.

  • WMA, le meilleur format audio ?

Le WMA a des avantages, parmi lesquels on peut citer le taux de compression élevé pour une qualité audio raisonnable, la vitesse de compression et la possibilité de protéger les fichiers codés. La compatibilité pas très assise du WMA constitue son défaut majeur, défaut qui devra s'estomper avec le temps.

Bien entendu, en termes de qualité, il est des formats audio de meilleure facture que le WMA. Ainsi, l'OGG VORBIS de la Xiph Foundation sonne plus nettement que le format de Microsoft, même à des débits inférieurs à 96 kb/s ! De même, le MP3 Pro et l'AAC (appelé parfois MP4), respectivement de Coding Technologies et de Apple, codent mieux que le WMA les sons à 96 kb/s et à 64 kb/s. D'aucuns disent même que le WMA à 128 kb/s et à 160 kb/s aurait un son plus « étouffé » que le MP3 à ces bitrates.

Cependant, les formats précités ont également des défauts non négligeables, du moins à l'heure actuelle. Ainsi, tous sont moins rapides que le WMA dans l'encodage. De plus, MP3 Pro, AAC et OGG Vorbis demeurent moins compatibles que le WMA (très peu de baladeurs, de radios et de platines DVD lisent ces trois formats).

Somme toute, ayant pesé le bon comme les mauvais côtés du WMA, face à ses concurrents, je peux dire (n'en déplaise à ses détracteurs) qu'il est actuellement le meilleur format audio qui allie compression efficace à vitesse d'encodage.

  • Quel logiciel pour la lecture ?

De nos jours, presque tous les logiciels freeware ou payants dont la vocation est de lire des contenus multimédias lisent sans problème toutes les versions du WMA « classique », mais pas les WMA « spéciaux » (voir point 5). Seul le Lecteur Windows Media Série 9, le Lecteur Windows Media 10 et le lecteur Windows Media 11 lisent correctement les WMA de tous types, logiciels téléchargeables à volonté et gratuitement sur le site de Microsoft.

  • Quel logiciel pour l'encodage ?

La plupart des logiciels gratuits ou payants de conversion peuvent encoder en WMA classique. DbPoweramp Music Converter (gratuit si on cherche bien) convertit en WMA « spéciaux », mais assez difficilement en WMA Pro, à moins d'avoir une source WAV multicanale. Seul le Codeur Windows Media de Microsoft code en WMA de tous types sans trop d'emmerdes.

  • Combien de types de WMA ?

WMA est un format comprenant plusieurs variantes demandant chacune un algorithme spécifique de codage et de décodage (appelé codec) pour la compression ou la lecture :

  • WMA « classique » : lu par une grande partie de baladeurs, de radios et par quelques lecteurs DVD. Il compresse à 32, 44 ou 48 kHz dans des bitrates allant de 5 à environ 384 kb/s et ce, en mono ou en stéréo à 16 bits par échantillon
  • WMA Professional ou WMA Pro : lu par quelques lecteurs DVD hauts de gamme. Il compresse à 16 ou à 24 bits par échantillon à 44, 48 kHz ou 96 kHz, en stéréo, en 5.1 (six canaux) ou en 7.1 (huit canaux). La qualité audio du WMA Pro pour un bitrate donné est supérieure à du WMA classique. L'encodage et le décodage consomment des ressources processeur appréciables (de préférence un Pentium III pour la lecture et un Pentium IV pour l'encodage). Le WMA peut atteindre des bitrates supérieurs à 700 kb/s, la marge moyenne étant de 128 à 768 kb/s
  • WMA Lossless ou sans perte : il encode le son avec une perte de qualité inaudible et quasi-inexistante. La compression se fait à 44, 48 ou 96 kHz, à 16 ou 24 bits par échantillon, en stéréo, en 5.1 ou en 7.1. Le bitrate va généralement de 470 kb/s à 1100 kb/s. Le WMA sans perte est lu par quelques baladeurs (sauf en mode multicanal) et très peu de platines DVD
  • WMA Voice : compresse en mono à 8, 11, 16 ou 22 kHz, avec 16 bits d'échantillon et un bitrate n'excédant point 20 kb/s. WMA Voice n'est lu que sur PC.

Je recommande le WMA classique à l'audiophile ordinaire. Le WMA Pro convient au codage en haute qualité ou au codage des pistes sons multicanales d'un film en DVD. Alors que le WMA Lossless produit un son irréprochable par rapport à la source de codage, WMA Voice dégrade fortement le son, seules les voix étant codées de manière acceptable. Ainsi, l'un convient à l'archivage de très haute qualité, l'autre à l'envoi par mail (ou par d'autres protocoles du réseau) des courts extraits vocaux du genre reportage (surtout pas de la voix chantée).

  • WMA peut-il être lu avec du dispositif courant ?

Seul le WMA classique a des chances d'être lu avec du dispositif courant, la gamme de produits s'étendant au fil des mois (baladeurs, lecteurs de salon, chaînes hi-fi, lecteurs DVD, voire téléphones, etc.). Les autres variantes du WMA sont plus réservées à des usages sur PC, sur platines DVD dernier cri (comme le WMA Pro) ou encore sur du matériel très récent (comme le WMA Lossless).

  • Quid du CBR, VBR, une passe, deux passes ?

Le CBR (Constant Bitrate) est un mode de codage dans lequel un nombre presque constant de bits est alloué à chaque seconde de son encodé ou compressé. À partir de 96 kb/s, il crée des sons riches en basses et d'une lourdeur identique à l'original. En dessous de ce bitrate, il engendre de la distorsion dans les sons aigus.

Le VBR (Variable Bitrate), quant à lui, adapte automatiquement le débit au sein du fichier codé et ce, en fonction de la complexité du son, le bitrate maximal étant fixé par l'utilisateur ou par le mode choisi (VBR 100, 98, 90, 75, 50, 25 et 10). À titre d'exemple, le bitrate varie généralement en moyenne entre 40 et 112 kb/s à l'intérieur d'un fichier codé en VBR 50 à l'aide du WMA « classique ». Le mode VBR (sauf en VBR 100 et en VBR 98) atténue quelque peu les basses dans une chanson, mais réduit notablement les déformations dans les aigus. Généralement, à bitrate égal en mode CBR, VBR procure une bien meilleure qualité audio, homogène dans tout le fichier encodé. À mon sens, c'est le mode idéal de codage. Notez que WMA Lossless code en VBR 100, 100 étant le niveau théorique de qualité en %.

Coder en une passe signifie que l'encodeur convertit en temps réel le son de la source au format WMA. C'est la compression la plus classique. Coder en deux passes sous-entend une première passe à travers laquelle le son à coder est finement analysé. Ce n'est qu'à la deuxième passe que le codage imposé par l'utilisateur se déroulera en fonction des résultats de l'analyse effectuée à la première passe. Ledit utilisateur peut demander à l'encodeur de conserver un bitrate X moyen ou un bitrate X moyen et un bitrate Y maximal. En valeur moyenne, à bitrate donné, la qualité sonore s'avère sensiblement supérieure à ce que fournit le codage en une passe. Le codage en deux passes est mieux adapté au mode VBR, mais peut s'appliquer en CBR.

Notez que certains codecs ou certains scénarii ne marchent pas avec le codage en deux passes. Ainsi, celui-ci ne s'applique pas au codage d'une capture audio en temps réel. De même, WMA Lossless et WMA Voice ne codent qu'en une passe.

  • À partir de quel bitrate WMA se métallise-t-il ?

En mode CBR, les distorsions des sons aigus se font ressentir très souvent lorsque le bitrate est inférieur à 96 kb/s. En mode VBR, la métallisation se fait ressentir à partir de VBR 25 (bitrate moyen dans la fourchette 40 à 85 kb/s).

Je signale néanmoins que si la source présente déjà des distorsions dans les aiguës ou est de qualité assez basse (monophonique, souffles importants), la sensation de métallisation se fera ressentir même à bitrates plus élevés. Spécialement pour les sources mono ou riches en souffle, le son se métallise très souvent si le bitrate du WMA converti est, en moyenne, inférieur à 160 kb/s.

C'est ainsi qu'il ne faut jamais croire qu'un fichier encodé à 128 kb/s est de bonne qualité. En effet, sa qualité sera d'autant pire que la source est médiocre.

  • Quelle configuration PC pour le WMA ?

Pour le WMA « classique » et le WMA Voice, l'encodage, même en mode VBR, peut s'effectuer sur un simple Pentium II à 233 MHz ! Le WMA Lossless demande tout de même un Pentium III à 450 Mhz pour un encodage dans de bonnes conditions de vitesse. Toutefois, lorsque plus de deux canaux sont usés dans le codage ou lorsque le nombre de bits d'échantillon est supérieur à 16, un Pentium IV à 1,5 GHz sera le bienvenu. Quant au WMA Pro, un Pentium IV à 2 Ghz est recommandé pour l'encodage.

Le décodage des WMA est peu gourmand en calculs. Un Pentium II suffit généralement. Toutefois, le WMA Lossless multicanal ou de haute résolution (24 bits), ainsi que le WMA Pro, exigent, pour une lecture fluide, au moins un Pentium III à 550 MHz.

  • Quel format est en mesure de détrôner le WMA ?

Procédons par élimination à travers le tableau ci-dessous :

FORMAT 

LECTURE COURANTE HORS PC 

QUALITÉ À 64 KB/S 

QUALITÉ À 96 KB/S

WMA 

Baladeurs, radios, chaînes hi-fi, platines DVD, téléphones

Légères diminutions de basses et quelques pertes en aiguës + son métallique

Son quasi-CD, avec de très légères pertes en aiguës extrêmes

MP3 

Polyvalent 

Son presque monophonique avec forte atténuation des basses. Aiguës fortement tronquées et métallisation désagréable.

Pertes sensibles en aiguës, diminution des basses, métallisation assez audible, stéréo réduite

MP3 Pro 

Baladeurs, platines DVD, téléphones 

Légères diminutions des aiguës, métallisation faible

Qualité supérieure au MP3 à 128 kb/s 

AAC (alias MP4) 

Baladeurs (surtout des Ipod) 

Métallisation assez sensible des aiguës (mais moins que le WMA). Bonne restitution des autres fréquences 

MP3 à 128 kb/s 

OGG VORBIS

Baladeurs, platines DVD, quelques radios

Presque pas de métallisation. Excès de certains sons aigus par rapport à l'original

Excès de certains sons aigus par rapport à l'original 


 

Il n'y a pas photo : le gagnant est bel et bien OGG VORBIS ! En effet, il encode à bas débit avec le moins d'artefacts désagréables. De plus, sa compatibilité ne cesse de s'étendre.

QUID DES DERNIERS CODECS WMA ?

QUID DES DERNIERS CODECS WMA ?

Ma curiosité l'emportant sur toute autre considération, je me suis décidé (bien en retard, il faut l'avouer) de jeter un bref coup d'œil sur les codecs audio mis à jour de Windows. Nul n'a été besoin d'installer Windows Media Player 11 ou Windows Vista (dans un topic précédent, j'ai d'ailleurs écrit que ce n'est pas de sitôt que mon ordi tournera sous ces logiciel et système d'exploitation). J'ai plutôt installé un composant nommé wmfdist que j'ai téléchargé dans l'excellent site http://windows-media.net (je remercie Jonathan au passage). À noter que les codecs mis à jour ne marchent que sous Windows XP Service Pack 2. Toute tentative d'installation sur une autre version d'un XP sans SP2 ou d'une autre version de Windows se soldera par un échec certain.

Après redémarrage du système obligatoire, j'ai perçu quelques changements non négligeables dans les gammes de bitrates proposés, par rapport à la version 9 que j'utilise depuis 2003. Le codec WMA standard, lu par la quasi-totalité des baladeurs non-iPod, est pourvu d'une fonction déjà bien implantée dans la version 9.1 des codecs : le mode Low Delay. Celui-ci permet, notamment dans certains bitrates, en mode CBR, de réduire le temps de silence (qui peut atteindre plusieurs millisecondes) nécessaire au décodage d'un fichier WMA. Le mode Low Delay permet également, aux dires de Micro$oft, de réduire sensiblement le temps de mise en mémoire tampon du fichier lors du streaming. Pour une raison qui nous échappe, les bitrates concernés par ce mode se retrouvent amputés d'un kbit/s par rapport au bitrate courant. Ainsi, au lieu de 128 ou de 192 Kbits/s, vous verrez 127 ou 191 Kbits/s quant aux bitrates bénéficiant du mode Low Delay.

Par ailleurs, désormais, le WMA standard ne porte plus la mention Windows Media Audio 9, mais plutôt Windows Media Audio 9.2.

Quant au WMA Professional, il utilise une gamme de bitrates plus variée. Le débit minimal n'est plus de 128 Kbits/s, mais de 32 ! Le codage 7.1 s'ajoute pour certains bitrates et le son peut être encodé en 96 Kbits/s en mode 5.1 !! En fait, pour descendre si bas en bitrate dans cette variante Professional tout en maintenant, paraît-il (je n'ai pas testé) une qualité bluffante, les amis à Billou n'ont pas inventé la roue. Ils ont fait appel à une technique qui, dans le concept, est similaire à ce que réalise le MP3 Pro : le codage des basses fréquences en syntaxe binaire du WMA Professional et les codages des aigues en une structure bizarroïde censée (théoriquement) reconstituer au décodage lesdites aigues, structure qui a le mérite d'économiser pas mal d'espace. Ce raffinement dans l'encodage a tout naturellement un prix : les anciens décodeurs WMA Professional ne verront que les fréquences basses et vocales, ce qui implique que le son ne sera pas très agréable. Quand Micro$oft raconte que les nouveaux fichiers WMA Professional (qui passe à juste titre de la version 9.1 à la version 10) sont compatibles avec les anciens décodeurs WMA Professional 9 ou 9.1, c'est à ce prix-là…

Pour ce qui est du WMA Lossless qui, à l'instar du WMA standard, est estampillé 9.2, j'ai l'impression que le débit du fichier créé semble quelque peu élevé, du moins par rapport à l'encodage du même fichier avec la version 9 tout court. Autrement dit, on perd quelques kilooctets tout en maintenant une qualité sans perte. Pas très réussie…

Je ne sais pas comment le codec se comporte face aux sources multicanales, n'ayant pas personnellement testé.

Concernant le WMA Voice, étant toujours estampillé 9, je ne pense guère qu'il y ait quelque différence avec le codec WMA Voice de 2003.

Question qualité du son, comme je n'utilise pas d'autres variantes du WMA que la version standard, je n'ai testé que cette dernière. En mode CBR, la qualité sonore me semble identique à celle des codecs version 9 de 2003, même si la courbe fréquentielle accuse une perte en aigues de 200 kHz en moyenne. Pareil pour le mode VBR, où même le bitrate est un tantinet supérieur à ce que produisait le codec de 2003, mais nettement inférieur à ce qu'accomplissait le codec 9.1 (bogué en mon sens) de 2004. Tout comme en mode CBR, une chute moyenne en aigues de 200 kHz, heureusement inaudible, est remarquée au niveau de l'analyse spectrale. Paradoxalement, à moins que ma psychologie ne trouble mon sens critique et mon organe auditif, une infime amélioration est ressentie dans les instruments à volume faible qui semblent mieux rendus.

CONCLUSION

Contrairement à la version des codecs de 2004 (version 9.1) qui est le pur fruit d'une rare précipitation, les codecs de 2006 sont globalement bons dans l'ensemble. Cependant, hormis les améliorations manifestes apportées à la variante WMA Professional, rien de bien particulier n'a été fait du côté des variantes WMA standard et WMA Lossless. Rien du tout n'a été apporté à la variante WMA Voice.

Au demeurant, une mise à jour vers les codecs de 2006 me semble parfaitement inutile…

DÉFAUTS AUDIBLES DU WMA SELON LES BITRATES

  1. Mode CBR

192-320 kbps 

Seul un animal du genre chauve-souris ou chien sentira la différence avec l'original. Aucune distorsion audible pour un humain normalement constitué. Ceux qui disent le contraire sont des fieffés menteurs.

160 kbps

Seule une ouïe très exercée peut déceler quelques très légères pertes en aiguës, notamment lorsque des castagnettes ou de la musique classique fort contrastée jouent.

128 kbps

Personnellement, je ne vois pas trop la différence en qualité sonore entre ce bitrate et 160 kbps. Je peux affirmer sans crainte de me tromper que la qualité CD est presque atteinte ici.

96 kbps

Un mélomane verra difficilement la différence entre le CD audio d'origine et la musique encodée à ce bitrate pour les genres musicaux de type R&B ou RAP. Toutefois, lorsque des styles assez complexes sont mis à contribution, comme les technos dures et certaines musiques classiques, voire quelques rares formes de salsa, une certaine perte en aigues est décelable, mais elle s'avère négligeable. La métallisation dont parlent quelques testeurs dans des forums, personnellement, je ne l'ai jamais ressentie pour quelque genre musical que ce soit, y compris dans les a capella.

64 kbps

Est de mauvaise foi ou d'une oreille déficiente l'individu qui ose dire ici que la musique à ce bitrate atteint la qualité d'un CD audio original ! Bien au contraire : les basses sont assez bien respectées, mais pas totalement. En revanche, les sons aigus, surtout dans les instruments jouant faiblement, sont soit fortement atténués, soit rendus avec une résonance métallique. Il arrive même, dans des cas extrêmes, lorsqu'un son est assez haut en fréquence dans le CD d'origine, qu'il ne soit même pas reproduit dans la musique compressé à ce débit.

48 kbps 

C'est du 64 kbps en pire : les basses sont plus atténuées et les aigues plus rares et plus déformées. Convertir sa musique favorite en cette vitesse de transmission constitue un choix à éviter à tout prix…

32 kbps 

Son assez cauchemardesque où tout est métallisé, sauf les basses. Les voix semblent doublées d'échos et les aigues extrêmes sont rendues ternes à défaut d'être inexistantes. Il faut être malentendant pour aimer une musique encodée à ce bitrate.

  1. Mode VBR

vbr 98 et vbr 100

La qualité vaut l'original et je mets au défi quiconque de me démontrer le contraire.

vbr 90

Le son produit dans ce mode est quasi-identique à l'original, un peu comme du WMA à 128 ou à 160 kbps. Toutefois, si votre oreille est celle d'un connaisseur, vous remarquerez, mais vraiment à peine, de très légères atténuations de basses extrêmes, surtout dans du gangsta rap ou de la techno de type gay pride...

vbr 75

C'est du VBR 90, mais en moins bien. En effet, les aigues sont quasiment respectées comme dans le CD d'origine, avec quelques rares atténuations des sons très hautes fréquences. Toutefois, les basses, en général, sont quelque peu atténuées, notamment lorsqu'elles sont assez lourdes, comme dans certaines pops. Pour le remarquer, il faut de très bonnes oreilles ! On se croirait en CBR à 96 kbps, sauf que le mode CBR à ce bitrate conserve nettement moins d'aigues.

vbr 50

Ce mode contentera l'audiophile ordinaire et nécessite, pour un confort d'écoute appréciable, l'intervention des égaliseurs pour retrouver une qualité sonore voisine de celle d'un fichier CBR à 96 kbps. C'est que les fortes basses sont légèrement atténuées, quasiment comme en VBR 75. Les fréquences aigues sont nettement affaiblies lorsqu'elles atteignent des valeurs assez élevées, au point même de sembler s'estomper lorsque le volume des instruments est trop bas. Du WMA CBR à 64 kbps délivre un son plus riche en basses (et encore faut-il un bon organe auditif), mais moins riche en aigues et moins respectueux des passages à faible volume ou à des sons doux. VBR 50 métallise le son dans de très rares cas, notamment lorsque la source audio est de mauvaise qualité (absence d'aigues extrêmes) ou monophonique avec souffle. Cependant, ladite métallisation est beaucoup moins audible que ce que produit le mode CBR à 64 kbps.

vbr 25

C'est du VBR 50 en pire, quasiment comme du CBR à 48 kbps : les basses sont assez atténuées et même l'audiophile peu exigeant le sentira. La métallisation gagne du terrain dans les hautes fréquences déjà assez amorties, un peu comme du CBR à 64 kbps, mais moins que du CBR à 48 kbps. VBR 25 est un mode d'encodage des CD audio à fuir comme la peste, comme d'ailleurs son frère cadet infra.

vbr 10

Très mauvais mode pour enregistrer de la musique : les sons monophoniques sont métallisés, surtout les voix, mais c'est nettement moins dramatique que ce qu'offre le mode CBR à 32 kbps. Les aigues de fréquence supérieure à 12 kHz sont tronquées, parfois déformées par la résonance métallique. VBR 10 convient à l'encodage des voix de type reportages à deux balles organisés entre potes ou à la capture en temps réel des extraits essentiellement vocaux, comme le journal de RFI ou de France 2.

CONVERSION EN WMA VBR LORSQUE LA SOURCE EST EN MP3 OU EN WMA

CONVERSION EN WMA VBR LORSQUE LA SOURCE EST EN MP3 OU EN WMA

  • Pourquoi convertir en WMA ?
  • À qualité égale, il occupe moins d'espace mémoire que le MP3, ce qui implique l'enregistrement d'un plus grand nombre de chansons sur baladeur, sur CD ou sur disque dur
  • Beaucoup de lecteurs lisent correctement de nos jours les WMA

    N.B. : Durant tout ce test, je travaille avec du WMA « classique », excluant le WMA Professional et le WMA Lossless

    • Pourquoi convertir en WMA VBR ?
  • Le mode VBR offre une qualité audio constante du fait qu'il adapte dynamiquement le débit à la nature du son codé
  • En WMA VBR, on peut obtenir des fichiers exceptionnellement petits en taille mémoire, mais de très bonne qualité audio, là où le MP3 demandera des débits beaucoup plus importants
    • Quels débits seront utilisés dans le test perso ?

MP3 (encodeur LAME 3.96)

  • CBR
    • De 192 à 320 kb/s : qualité CD : même les pros du son le reconnaissent
    • 160 kb/s : qualité quasi-CD : pertes infimes en aiguës
    • 128 kb/s : qualité quasi-CD : pertes infimes en aiguës, en tout cas plus qu'en 160 kb/s
    • 96 kb/s : qualité K7 audio moyenne facture + son métallique dans les aiguës
    • 64 kb/s : qualité SW (ondes courtes) d'excellent signal : pertes cruelles en aiguës + son métallique assez désagréable
    • < à 64 kb/s : son cauchemardesque métallisé, digne d'un enregistrement K7 raté
  • VBR
    • Bitrate moyen (ABR) > à 256 kb/s : qualité CD
    • ABR de 160 à 256 kb/s : MP3 à 160 kb/s
    • ABR de 96 à 160 kb/s : légèrement que du MP3 à 128 kb/s, c'est-à-dire, au meilleur des cas, le son d'une K7 Type I (Normal) très bien enregistrée
    • ABR < à 96 kb/s : qualité à mi-chemin entre du MP3 à 64 kb/s et du MP3 à 96 kb/s, c'est-à-dire du n'importe quoi…

WMA

  • CBR
    • De 192 à 320 kb/s : qualité CD
    • 160 kb/s : MP3 à 160 kb/s : qualité quasi-CD
    • 128 kb/s : MP3 à 128 kb/s : qualité quasi-CD
    • 96 kb/s : presque du MP3 à 128 kb/s, mais avec quelques aiguës en moins : qualité K7 Type II (chromée) originale neuve
    • 64 kb/s : quelques pertes en aiguës et en basses + son légèrement métallique : qualité K7 Normal très bien enregistrée
    • 48 kb/s : WMA 64 kb/s avec un peu plus de son métallique et un peu moins d'aiguës : K7 Normal de qualité moyenne, mais avec plus d'aiguës que du MP3 à 96 kb/s
    • 32 kb/s : sévères pertes en aiguës, son métallique assez gênant, mais mieux que du MP3 à 64 kb/s
  • VBR
    • VBR 98 (débit théorique de 240 à 355 kb/s) : qualité CD
    • VBR 90 (débit théorique de 135 à 215 kb/s) : qualité quasi-CD : aiguës très correctes, mais basses très légèrement atténuées
    • VBR 75 (débit théorique de 85 à 145 kb/s) : qualité à mi-chemin entre WMA à 96 kb/s et WMA à 128 kb/s + légères pertes de basses : qualité K7 chromée originale neuve
    • VBR 50 (débit théorique de 50 à 95 kb/s) : qualité voisine à celle du WMA à 64 kb/s, mais avec un peu plus d'aiguës et sans son métallique : qualité K7 Normal très bien enregistrée
    • VBR 25 (débit théorique de 40 à 75 kb/s) : presque du VBR 50, mais avec moins d'aiguës et un certain son métallique et une perte plus sensible de basses : qualité K7 Normal de qualité moyenne, mais mieux que du WMA à 48 kb/s
    • VBR 10 (débit théorique de 32 à 64 kb/s) : presque du WMA à 32 kb/s, mais avec plus d'aiguës et moins de son métallique
      • Tableaux de conversion

MP3

QUALITÉ DE LA SOURCE 

CONVERSION CONSEILLÉE EN WMA VBR 

MP3 CBR de 192 à 320 kb/s 

VBR 75, VBR 50, VBR 25, VBR 10 

MP3 CBR à 160 kb/s

Idem 

MP3 CBR à 128 kb/s 

VBR 50, VBR 25, VBR 10 

MP3 CBR à 96 kb/s 

VBR 25, VBR 10 

MP3 CBR à 64 kb/s 

VBR 10 

MP3 CBR < à 64 kb/s 

Conversion vivement déconseillée 

MP3 ABR > à 160 kb/s 

VBR 75, VBR 50, VBR 25, VBR 10 

MP3 ABR de 96 à 160 kb/s 

VBR 50, VBR 25, VBR 10

MP3 ABR < à 96 kb/s 

VBR 25, VBR 10 


 

WMA

QUALITÉ DE LA SOURCE 

CONVERSION CONSEILLÉE EN WMA VBR 

WMA CBR de 192 à 320 kb/s 

VBR 75, VBR 50, VBR 25, VBR 10 

WMA CBR à 160 kb/s 

Idem 

WMA CBR à 128 kb/s 

VBR 50, VBR 25, VBR 10 

WMA CBR à 96 kb/s

VBR 25, VBR 10 

WMA CBR à 64 kb/s 

VBR 10 

WMA CBR < à 64 kb/s 

Conversion vivement déconseillée 

WMA VBR 98 

VBR 90, VBR 75, VBR 50, VBR 25, VBR 10 

WMA VBR 90 

VBR 75, VBR 50, VBR 25, VBR 10 

WMA VBR 75 

VBR 25, VBR 10 

WMA VBR 50 

VBR 25, VBR 10 

WMA VBR 25

VBR 10 (à la rigueur)

WMA VBR 10 

Conversion vivement déconseillée 


 

N.B. : Il est sous-entendu que toutes les pistes qui ont été converties en MP3 ou en WMA proviennent des CD audio originaux, avec toutes les fréquences du studio d'enregistrement. En effet, une musique de qualité dégradée, lorsqu'elle subit une compression, même à haut débit (tout de même inférieur à 160 kb/s), se transforme en quelque chose qui choque l'ouïe. Je signale que la plupart des CD audio vendus dans le marché noir kinois ont une qualité tronquée.


 

WMA VBR VS WMA CBR EN SPECTRE ET EN ÉCOUTE (CODEC 9.0)

WMA VBR VS WMA CBR EN SPECTRE ET EN ÉCOUTE (CODEC 9.0)

MODE VBR

MODE CBR ÉQUIVALENT

FRÉQUENCE DE COUPURE VBR

FRÉQUENCE DE COUPURE CBR

QUALITÉ AUDIO

VBR 10

CBR à 32 Kbits/s

≈ 12 kHz

≈ 12 kHz

VBR 10 conserve plus d'aigues que CBR 32 Kbits/s et le son métallique de ce dernier est plus accentué.

VBR 25

CBR à 48 Kbits/s

≈ 13 kHz

≈ 13 kHz

Même remarque que supra, mais CBR 48 Kbits/s conserve mieux les basses fréquences.

VBR 50

CBR à 64 Kbits/s

≈ 14 kHz

≈ 13 kHz

VBR 50 conserve plus d'aigues que CBR 64 Kbits/s, mais moins de basses que ce dernier. Son métallique quasi-imperceptible en VBR 50.

VBR 75

CBR à 96 Kbits/s

≈ 16 kHz

≈ 15 kHz

VBR 75 conserve plus d'aigues que CBR 96 Kbits/s et a un son plus raffiné. Toutefois, VBR 75 conserve moins de basses.

VBR 90

CBR à 160 Kbits/s

≈ 18 kHz

≈ 18 kHz

À l'écoute, VBR 90 semble mieux respecter les aigues que CBR 160 Kbits/s, mais sacrifie très légèrement les basses. Mais cela est presque inaudible.

VBR 98

CBR à 320 Kbits/s

≈ 20 kHz

≈ 20 kHz

Ici, les modes CBR et VBR ont une qualité audio identique à l'original.

VBR 100

CBR à 320 Kbits/s

≈ 22 kHz

≈ 20 kHz

Impossible de distinguer en écoute VBR 100 et CBR 320 Kbits/s, même si VBR 100 code sans la moindre perte d'informations.

OPTIMISER LE COMPORTEMENT D’AUDIOBABA

OPTIMISER LE COMPORTEMENT D'AUDIOBABA

N.B. : Certaines sections du contenu de cet article sont purement spéculatives et n'engagent que moi.

  1. Quant aux titres qui se retrouvent un peu trop fréquemment dans les sélections générées

Force est de l'avouer, à l'usage, surtout lorsqu'on détient une discothèque parcimonieuse de moins de 500 titres, Audiobaba devient lassant. En effet, le fait est que les mêmes chansons, parfois avec le même ordre, se répètent dans les sélections successives créées automatiquement par ce fantastique logiciel. Voyons voir comment réduire notablement un tel comportement.

  1. Pourquoi les morceaux se répètent-ils d'une sélection à une autre ?

Lorsque la fonction AutoGJ est en cours d'exécution, la grande majorité des titres qu'elle génère automatiquement sont considérés comme « spéciaux » et, ipso facto, il est fréquent de les retrouver au sein des sélections créées postérieurement. Plus la sélection générée sera courte, plus les agencements des chansons tel que générées par les diverses utilisations d'AutoGJ seront respectés, parfois à la chanson près !

Par ailleurs, durant un certain temps, les morceaux récemment ajoutés dans la base de données d'Audiobaba se retrouvent dans les sélections créées, surtout si parmi les chansons servant de pivot à la sélection, au moins l'une d'elle a été ajoutée récemment à la bibliothèque multimédia.

Enfin, il est de ces morceaux qui se retrouvent quasiment de manière systématique dans presque toutes les sélections générées par Audiobaba. La cause d'une telle répétition des titres n'est pas claire et est intimement liée à la fois à la nature mélodique desdits titres et aux algorithmes nébuleux de génération des titres.

  1. Quelle solution ?
  2. Pour le cas des sélections automatiquement créées par AutoGJ, l'idéal est de ne jamais déclencher cette fonction. Au besoin, désinstallez et réinstallez Audiobaba afin de réinitialiser le network.
  3. Quant au fait que les chansons récemment intégrées dans la bibliothèque multimédia
    se retrouvent fréquemment dans les sélections générées, cela s'estompera avec le temps à force d'usage
  4. Pour ce qui est des morceaux qui répondent presque toujours présents aux sélections générées par Audiobaba, aucune solution n'existe, à mon sens. Vous devrez faire avec
  5. Quant à l'harmonie mélodique des chansons qui se suivent dans une sélection générée
  6. Les facteurs qui conditionnent grandement les correspondances mélodiques entre chansons
  7. Le tempo et le rythme : Audiobaba détermine ces deux paramètres pour chaque morceau analysé
  8. Les composantes vocales, s'il y en a
  9. Le nom de l'artiste, inscrit dans les valeurs ID3 du fichier analysé. Toutefois, Audiobaba peut extraire le nom de l'artiste automatiquement dans le nom même du fichier, si les balises ID3 associées à l'artiste sont vides. Pour cela, il convient, entre autres, que la syntaxe suivante soit respectée : <
    nom de l'artiste, espace, tiret, espace, titre de la chanson
    >
  10. Le nom de l'album dont est tiré le morceau analysé, toujours inscrit dans ses valeurs ID3
  11. Le genre du morceau analysé, une fois de plus inscrit dans ses valeurs ID3
  12. La date de création du fichier
  13. À l'aide d'algorithmes particulièrement sophistiqués, Audiobaba combine tous ces paramètres en sus de certains autres critères dont il a le secret. En fin de compte, un code musical crypté en MD5 est généré pour chaque morceau analysé et Audiobaba détermine, au fur et à mesure de l'utilisation du Lecteur Windows Media, les liens mélodiques entre morceaux
  14. Comment Audiobaba associe-t-il mélodiquement les chansons dans une sélection ?
  15. En règle générale, les chansons ayant des rythmes ou des tempos voisins se suivent par groupes de trois ou de quatre
  16. À défaut, Audiobaba fait correspondre des morceaux dont les parties vocales ont des timbres ou des sonorités voisines
  17. Audiobaba fait également souvent correspondre des morceaux d'un même album dont il juge voisines les sonorités et ce, selon la logique des points a et b précédents

    Par conséquent, Audiobaba fait correspondre très fréquemment les chansons d'un même album ET d'un même artiste

  18. Si les balises ID3 de l'album manquent pour toutes les chansons, ou si la sélection générée comporte beaucoup de morceaux (souvent plus de 150), il arrive qu'Audiobaba fasse correspondre des morceaux créés à la même date ou à des dates proches dans le temps, morceaux dont il juge les ressemblances mélodiques voisines et ce, selon les critères a et b du point 1
  19. Habituellement, si plus d'une cinquantaine de titres sont regroupés au sein d'un ou de plusieurs albums, Audiobaba fera correspondre des morceaux de même genre par groupe de trois ou plus, sans que lesdits morceaux soient forcément du même album
  20. Comment optimiser les choix mélodiques d'Audiobaba ?
  21. Les sélections trop courtes (moins de 15 chansons) présentent bien souvent des « cassures mélodiques » entre morceaux voisins et les chansons ont la fâcheuse tendance à se répéter d'une sélection à une autre. C'est pourquoi je vous recommande des sélections de plus de 15 chansons pour une meilleure harmonie mélodique
  22. De même, des sélections trop longues (plus de 150 morceaux) ont tendance à occasionner des discordances harmonieuses mélodiques entre les chansons qui se suivent.

    Il est donc conseillé que les sélections générées par Audiobaba comportent entre 15 et 150 chansons pour éviter des cassures mélodiques peu agréables

Pour évitez qu'Audiobaba ne sélectionne des chansons d'un même artiste à la suite, laissez vides les balises réservés au nom de l'album. Du reste, quand c'est fait, évitez des sélections dont une ou plusieurs chansons appartiennent à un artiste ayant lui-même plusieurs autres chansons dans votre bibliothèque