LE MODE VBR AU SEIN DES MP3, DES WMA ET DES OGG VORBIS
À la différence du mode d'encodage dit à débit constant (CBR) qui permet de conserver une valeur relativement fixe de bitrate au sein d'un même fichier, le mode d'encodage à débit variable (VBR), comme son nom l'indique, engendre des fluctuations de vitesse de transmission dans le morceau. Le mode CBR, notamment à bas débit, est utilisé en vue de produire un fichier de taille prédictible et facilement diffusable sur Internet qui a horreur des débits fluctuants lors des transmissions des données audio et/ou vidéo. Le mode VBR, quant à lui, garantit une qualité constante au sein du fichier, du moins théoriquement, ce que n'assure pas l'encodage CBR à bas débit. En revanche, les fluctuations parfois importantes de bitrate compliquent sérieusement la diffusion de contenu sur le Net. Par ailleurs, en VBR, il n'est pas toujours aisé de connaître la taille finale du fichier en vertu de sa durée par règle des trois simples, comme en CBR.
Dans ce topic, je m'emploie à détailler le comportement de l'encodage à débit variable des fichiers encodés en MP3, en WMA et en OGG VORBIS, qui sont les trois formats les plus couramment proposés par les encodeurs audio gratuits. L'AAC, certes très performant, a été écarté du fait de la rareté des convertisseurs qui offrent la compression en VBR de ce format. Je me focaliserai sur les trois modes d'encodage VBR les plus répandus : le mode VBR pur, le mode ABR et le mode VBR à contrainte maximale de débit. Notez également qu'il s'agit dans cet article d'une analyse de débit, et non d'une analyse de qualité ni d'une analyse de fréquence de coupure.
Le mode VBR pur
Il s'agit du mode VBR par excellence au travers lequel l'utilisateur indique à l'encodeur le niveau de qualité voulu. En fonction dudit niveau, l'algorithme de compression créera automatiquement des variations de bitrates au sein du fichier encodé en vue de répondre aux exigences de qualité. Les segments audio complexes seront encodés à des bitrates aussi élevés que nécessaire et les signaux faibles à des valeurs basses, mais pas au point de sacrifier le niveau désiré.
MP3
L'encodeur LAME possède des préréglages allant de V1 (la plus haute qualité) à V9 (la pus basse), c'est-à-dire neuf paliers de qualité. Quel que soit le palier utilisé et quelle que soit la complexité du morceau encodé, l'algorithme de LAME s'arrange à ce que la valeur moyenne de la vitesse de transmission corresponde bel et bien à l'intervalle proposé par le palier concerné, tout en maintenant une qualité constante. Toutefois, la lenteur occasionnée par ces artifices s'en ressent à l'encodage.
WMA
Le format de Microsoft est également encodable en VBR, selon des paliers de qualité chiffrés en pourcentages théoriques : 10, 25, 50, 75, 90 et 98. Le palier de qualité 100 est celui du codec WMA Lossless que je n'examinerai pas ici. Contrairement à l'encodeur LAME qui s'efforce de ne pas quitter certaines limites de débit, l'algorithme du WMA alloue autant de bits qu'il juge utile pour conserver le niveau de qualité recherchée. Cela peut poser problème lors des lectures sur baladeurs numériques des fichiers comportant des sections à hauts bitrates. Sachez, juste pour information, que le mode VBR pur du WMA s'exécute très rapidement, parfois plus rapidement qu'un encodage CBR ordinaire !
OGG VORBIS
Ce format est essentiellement VBR (les tentatives d'encodage en CBR se soldent très souvent la plupart du temps par des crashs du logiciel). Tout comme le WMA, sont également fournis ici des indices de qualité allant de -2 (la plus basse qualité) à 10 (la plus élevée). À l'inverse du MP3 et du WMA cependant, à chaque palier correspond une valeur fixe de débit (sauf si ces paliers ont une valeur décimale). Mais en réalité, après encodage, il est constaté que le bitrate moyen final s'écarte de la valeur fixée. L'écart est souvent de 10% maximum, mais peut augmenter pour des morceaux particulièrement faciles/difficiles à compresser (le débit moyen baisse/augmente drastiquement). Ainsi, de manière globale, vu la faible différence entre le débit fixé théoriquement et le débit réel final, je peux affirmer que l'OGG VORBIS use d'un mode plus proche de l'ABR (voir infra) que du VBR pur.
Le mode ABR
L'ABR (Average BitRate) est un mode à partir duquel il est demandé à l'encodeur de convertir un morceau à un bitrate moyen fixe tout en produisant le meilleur niveau de qualité possible à ce bitrate moyen, ce qui fait qu'il surviendra nécessairement des fluctuations de vitesse de transmission, mais dans une marge tolérable (± 10%). Tout comme le mode VBR à contrainte maximale de débit (que nous examinerons plus bas), l'encodeur analyse généralement le contenu audio en deux ou plusieurs passes. Dans la première passe, les données intrinsèques sonores (blocs à traiter, fréquences, etc.) sont analysées. Dans la ou les passe(s) suivante(s), l'algorithme s'évertue à obtenir le compromis idéal entre la qualité et le débit cible, tâche ardue et souvent longue.
Le MP3
Certains convertisseurs proposent dans leurs options le codage ABR en MP3. Force est de le reconnaître, ce format s'en sort sacrément bien et il est ressenti une amélioration de qualité par rapport au mode CBR à bitrate équivalent, amélioration qui peut aller de légère à nette. Du reste, la durée d'encodage est similaire à celle de la conversion en mode VBR pur.
Le WMA
Le codeur Windows Media est le seul outil gratuit qui encode des WMA en ABR, mode que Microsoft nomme « mode VBR basé sur la vitesse de transmission ». Le confinement de bitrate est encore plus grand qu'en MP3 et la qualité n'est pas grandement améliorée par rapport à un fichier encodé en CBR à débit équivalent. Retenez aussi que l'encodage en mode ABR au format WMA prend vraiment du temps. Je me demande à quoi pensaient les ingénieurs à Billou lorsqu'ils élaborèrent ce mode.
L'OGG VORBIS
En soi, les encodeurs de la Xiph Foundation n'offrent guère par défaut à l'utilisateur l'encodage ABR. Les résultats obtenus à l'aide des paliers de qualité évoquent en fait que ceux-ci usent d'une forme d'ABR. Il est certes vrai qu'en ligne de commande, le bidouilleur peut se plaire à simuler un encodage à bitrate moyen en imposant une valeur non officielle. Mais cela se fera aux risques et péril de l'encodeur qui plantera le plus souvent lors de ces manipulations. Des auditeurs ont même signalé ici une profonde dégradation du son d'origine, incompatible avec le débit imposé.
Le mode VBR à contrainte maximale de débit
Dans cette hypothèse, l'utilisateur fixe un bitrate maximal à l'encodeur, parfois associé à un débit minimal, mais toujours associé à un débit moyen. L'algorithme de compression fera alors de son mieux pour enregistrer le son dans la marge de vitesses de transmission proposée tout en gardant le plus possible le meilleur niveau de qualité envisageable. Généralement, ce mode exige un encodage en deux passes. Depuis peu néanmoins, on rencontre des outils de capture audio qui permettent l'encodage en temps réel en ledit mode.
MP3
L'encodeur LAME se comporte ici comme du VBR pur, mais avec comme cahier de charges que le débit ne peut dépasser le maximum prévu ni descendre en dessous du bitrate minimal. Il peut même largement s'écarter du débit moyen si l'écart entre le bitrate minimal et le bitrate maximal est trop grand, l'essentiel étant de se retrouver dans ces deux intervalles. LAME remplit correctement ces conditions et assure réellement la meilleure qualité possible, ce qui est à féliciter de la part de ses développeurs.
WMA
Le codeur Windows Media ne propose pas de bitrate minimal lorsqu'il convertit en mode VBR à contrainte maximal de débit (que Microsoft nomme « mode VBR basé sur la vitesse de transmission maximale »). Après observations, j'ai la nette impression que durant l'encodage, l'algorithme du codec ne profite que très rarement de l'opportunité qui lui est offerte de pouvoir à volonté augmenter le débit global du fichier par rapport à la valeur moyenne. Ce qui fait que dans la pratique, et en qualité et en bitrate, l'encodage à contrainte maximale de débit du WMA est similaire, si pas identique, au mode ABR. On se demande une fois de plus où les ingénieurs de la firme de Redmond avaient la tête.
OGG VORBIS
En ce mode à contrainte maximale de débit, OGG VORBIS se comporte quasiment à la manière de l'encodeur LAME, le compromis qualité et vitesse de transmission étant bien respecté.
Conclusion
En mode VBR pur, le format OGG VORBIS est celui qui opère le bon compromis entre qualité et bitrate fixé. Le WMA, par contre, est celui qui pousse le débit le plus haut possible pour respecter à tout prix la qualité.
En mode ABR, le compromis entre qualité et bitrate fixé est mieux effectué par le MP3. Il en est de même pour le mode VBR à contrainte maximale de débit. Le WMA, en ces deux domaines, foire sérieusement, au point qu'on se demande si ce n'est pas une blague d'un drôle de goût que les techniciens à Billou voulaient nous faire.