Fiche projet

Audio : la conversion de l’analogique en numérique au coeur d’un choix esthétique

Difficulté: Avancé

Dernière MàJ: 06/11/2024

J’ai commencé à composer de la musique avec un ordinateur vers l’an 2000. À l’époque, faire entrer un son du monde « réel » dans un ordinateur n’était étonnamment pas si simple. Quand j’ai enfin réussi en trafiquant un mic input 1/8 (entrée pour microphone 1/8), ce fut l’épiphanie. 24 ans plus tard, ce moment digne d’Archimède reste au centre de ma création et c’est le sujet que j’avais envie d’aborder ici : l’instant crucial dans la création audio reste celui où les sons du monde analogique sont transférés vers le monde numérique, que ce soit pour des fins pratiques (édition, mixage, publication, etc.) ou pour des raisons créatives (ajouter des pistes, montage créatif, effets numériques, etc.)

Dans le langage courant, on dit simplement qu’on va « enregistrer », mais en réalité, c’est plus complexe que ça. Dans ce texte, je vais expliquer pourquoi je crois que la conversion de l’analogique en numérique est au centre d’un choix esthétique important.

Mon bon vieux convertisseur Rosetta 200 pour mon studio maison.

De l’infini au discret

C’est courant de dire : « On peut faire tout ce qu’on veut avec le numérique! » C’est effectivement très pratique et simple, mais d’un point de vue prenant en considération le signal audio, c’est exactement le contraire : on ne peut plus faire ce qu’on veut une fois dans le monde numérique. Comme expliqué plus loin, les signaux analogiques possibles sont infinis, mais les signaux numériques sont contraints et régis par un cadre relativement serré.

Un signal audio analogique est essentiellement un signal électrique dont le voltage varie dans le temps. On parle d’électrons qui bougent, de particules qui se promènent dans l’infiniment petit. On retrouve des signaux qui varient entre différents voltages selon les appareils. Un niveau de ligne est d’environ 1 volt. Certains appareils utilisent 5V, d’autres 10V, etc. Bref, ça varie, mais ce qui reste constant, c’est que le nombre de valeurs de voltage possibles entre 0V et le maximum est toujours infini. C’est l’amplitude (hauteur) du signal.

Le signal audio se déploie évidemment dans le temps. Bien sûr, le temps est infini lui aussi (pour les besoins de la cause, considérons le temps de Planck comme infiniment petit).

Convertisseur

Pour convertir le signal en numérique, il faut un convertisseur A/D (Analog/Digital). Si on utilise une carte de son, par exemple, le convertisseur A/D est intégré à même l’interface. Ce n’est pas toujours le cas, et à mes débuts en audio, je ne comprenais pas l’intérêt d’avoir une carte de son qui ne faisait pas la conversion A/D.

Pour convertir le signal analogique en numérique, le convertisseur sonde de façon périodique le signal analogique. Par exemple, à la seconde 1, on mesure 0,5V. Le convertisseur écrit cette valeur en bits. À la seconde 2, on mesure 0,25V. Le convertisseur écrit une nouvelle valeur, et ainsi de suite.

Le convertisseur peut faire cette opération 44 100 fois par seconde, ou 48 000 fois, ou autres. Cette valeur est périodique et se mesure donc en Hertz. C’est ce qu’on appelle le taux d’échantillonnage (sample rate).

Chaque mesure prise est interprétée et transformée en un nombre en bits sur le convertisseur. Par exemple, une mesure de 0V peut être enregistrée comme 0, et une mesure de 1V peut être écrite comme 255. Aujourd’hui, on parle plutôt de 65 536 valeurs possibles en 16 bits et 16 777 215 valeurs possibles en 24 bits. C’est ce qu’on appelle la résolution (resolution). Chaque valeur en voltage est approximée à la valeur numérique la plus proche selon des algorithmes d’approximation qui peuvent être complexes.

Un convertisseur est donc une machine qui prend une mesure au moins 44 100 fois par seconde, le plus régulièrement possible, et qui approxime la valeur de voltage en bits. Ça paraît extrêmement précis? Ça l’est et c’est pour ça que ce n’est pas une science exacte, loin de là!

 

Erreurs

Quand j’ai commencé à faire de l’audio, j’utilisais l’entrée de mon ordinateur directement pour m’enregistrer. Je ne comprenais pas exactement pourquoi, mais ça ne sonnait pas super bien.

J’ai ensuite acheté une MOTU 828 aux alentours de 2008. C’est une carte de son avec entrées pour microphones, convertisseur A/D et D/A, et qui s’interface avec l’ordinateur. Ça sonnait vraiment mieux. Par contre, chaque fois que je comparais mes résultats à des parutions professionnelles, quelque chose manquait.

La conversion se fait avec une horloge. Chaque mesure doit être exactement au même intervalle. Que se passe-t-il si on décale d’une microseconde, d’une nanoseconde? Ça crée une erreur dans la représentation du signal analogique, potentiellement assez importante pour être perçue comme un clic, ou pour allonger un peu le signal. Que se passe-t-il si l’approximation de la valeur de voltage en bits est faite trop bêtement et qu’elle n’est pas tout à fait juste? Que se passe-t-il si une fois, le chiffre est arrondi au bit le plus haut, et l'autre fois au bit le plus bas? Cette erreur est presque pire en fait : s’il y a trop d’erreurs consécutives, toutes les hautes fréquences se retrouvent à être représentées un peu au hasard. On obtient un son numérique qui, je trouve personnellement, s’apparente un peu à un mauvais MP3. Un néophyte dirait : «Le son n'est pas clair ».

Exemple d’une très mauvaise conversion : le signal numérique ne représente pas bien les fréquences analogiques trop rapides (hautes fréquences).

Différences entre conversions lo-fi (basse fidélité) et conversions hi-fi (haute fidélité). À gauche : basse résolution et bas taux d'échantillonnage.

Esthétique lo-fi

Il y a une dizaine d’années, je travaillais chez Avatar, un centre d’artistes en art audio et numérique de Québec qui reçoit surtout des artistes provenant des arts visuels. Les artistes avaient souvent enregistré des sons sur une Zoom ou sur leur téléphone. Les sons étaient souvent ensuite transférés dans leur ordinateur, et finalement joués dans une salle d’installation avec de la spatialisation, ou dans une œuvre vidéo projetée sur grand écran.

Écoutés à l’aide de haut-parleur à volume fort, les sons ne sonnaient évidemment pas bien, et l’artiste disait : « Mais ça sonnait bien dans mes écouteurs! » Il ne s’attendait pas à quelque chose d’aussi basse qualité. Le son semblait naturel dans ses essais et il ne s’était jamais posé de questions là-dessus.

Lors de la diffusion, le son numérique est reconverti en analogique une dernière fois et amplifié à nouveau. La mauvaise qualité apparait évidemment bien plus. L’artiste se retrouve alors devant des choix : recommencer l’enregistrement, corriger le son numériquement ou accepter l’esthétique lo-fi

Voici un exemple simplifié du chemin que prend le son d’un enregistrement d’une voix, par exemple, jusqu’au moment où il est rejoué dans des haut-parleurs de diffusion. C’est le même chemin avec un téléphone cellulaire ou un studio de qualité. Dans l’exemple, la conversion A/D n’est pas de bonne qualité et le signal est un peu déformé.

L’exemple est un peu extrême, mais on voit qu’à la fin, on ne fait qu’amplifier un signal de mauvaise qualité qui ne représente pas tant le signal de voix initiale, qui brise certaines fréquences.

On se retrouve donc à diffuser un son appartenant à une esthétique qualifiée de lo-fi (basse fidélité). Pour faire un parallèle avec l’art visuel, ça revient à prendre une photo JPG mal compressée que l’on agrandirait 10 fois pour le grand écran.

C’est peut-être correct dans certaines situations, mais il faut d’abord en être conscient et faire le choix de l’esthétique qui en résulte. Je connais des projets de musique où la voix lead a été enregistrée avec le micro d’un MacBook. C’est parfaitement correct, dans la mesure où l’artiste comprend que le signal est plein d’erreurs de conversion, et que ça donne une facture punk/maison au projet.

Il y a quelques années, j’ai donc décidé d’acheter cette fameuse boîte : un convertisseur Apogee Rosetta 200. Même si ce n’est pas le convertisseur le plus dispendieux de l’histoire, la différence était évidente. Mes mêmes microphones étaient tout à coup plus clairs, mes projets audio déjà entamés étaient soudainement plus définis. J’avais enfin l’impression de travailler avec du « vrai son ».

Bien sûr, aujourd’hui, certaines cartes de son ont des convertisseurs de meilleure qualité que ma vieille MOTU, mais je conseille à tous ceux qui s’intéressent moindrement à l’audio sérieusement de ne pas lésiner sur la conversion, ou du moins d’y réfléchir comme un outil étant au cœur de l’enregistrement audio.

La grille

Je disais tout à l’heure que les signaux analogiques étaient infinis, et que les signaux numériques étaient régis par un cadre relativement serré. 

Admettons que vous avez « enregistré » des pistes et que votre signal est maintenant converti avec un taux d’échantillonnage de 44,1kHz et une résolution de 16 bits. Votre ordinateur est maintenant capable de traiter ces informations et vous utilisez Logic, Protools, Reaper, Audacity, Ableton Live, ou autres.

À partir de maintenant, vous êtes dans le monde numérique, et tout ce que vous pouvez créer est régi par cette grille qui comprend maintenant 44 100 cases de large par seconde et 65 536 cases de haut. Impossible de dépasser la grille si vous trouvez que ce n’est pas assez fort. 

Voici un son de bassdrum (grosse caisse) que j’ai utilisé dans un projet, et sur lequel j’ai zoomé dans Reaper (mon logiciel préféré). Chaque point est un échantillon numérique. Chaque vibration est représentée le mieux possible, et elles sont toutes importantes pour la qualité du son de kick global. On constate aussi que les possibilités par rapport à l’amplitude ne sont pas si nombreuses, et on n’a pas à zoomer tant que ça pour voir les points apparaître.

Alors qu’en analogique on peut par exemple mettre un signal trop fort dans un ampli et obtenir une saturation intrigante à cause de la réaction des circuits, en numérique, ces concepts n’existent plus. On peut clipper (écrêtement qui crée une distorsion) un signal en le mettant trop fort, mais on ne sort toujours pas de la grille numérique. Pour créer des sons intéressants, il faut alors utiliser des trucs, des passe-passe, des outils numériques qui créent des simulations. Des plug-ins (plugiciels)!

Je ne veux pas entrer trop là-dedans, mais si vous aimez les effets spéciaux, je recommande l’abonnement à des bundles de plugins comme Plugin Alliance, qui vous offreront des tonnes de possibilités de création numérique. D’ailleurs, si vous souhaitez recréer volontairement une conversion de mauvaise qualité, je conseille d’utiliser un plug-in de type « bitcrusher », qui vous permet de réduire la résolution et le taux d’échantillonnage pour produire des sons avec une facture numérique prononcée et très intéressante.

Exemple d'un effet de Bitcrusher

Bref, la comparaison est peut-être boiteuse mais ça revient un peu à la réalisation d’un film. Certains préfèrent des effets pratiques lors du tournage, d’autres préfèrent utiliser du CGI pour leurs effets. Personnellement en audio, je ne préfère rien, je trouve simplement que c’est un choix esthétique. J’aime la création dans le monde analogique. J’aime les outils du monde numérique.

Projets de réalisation

Je suis réalisateur de musique. Voici des exemples de mes réalisations où le travail dans le monde analogique était maximal et le travail dans le numérique plus minimal, et d’autres où c’était l’inverse. Dans tous les cas, la conversion A/D est au centre des choix esthétiques.

 

Jane & Compagnie
https://janeetcompagnie.bandcamp.com/album/qu-bec-moncton

Un projet qui se veut ancré dans la tradition du country et du rock and roll. Le numérique ne doit pas prendre beaucoup de place dans ce genre de réalisation. Souvent, nous passons donc beaucoup de temps à travailler le son AVANT qu’il soit converti au numérique. Comme mentionné, l’analogique nous permet plus de latitude, et c’est en phase avec l’esthétique recherchée. Choix de microphone, équipements analogiques en série, amplis, volume, instrument, distance, choix de la pièce : ce ne sont qu’une partie des facteurs qui seront déterminés avant de procéder à la numérisation de la performance.

Enregistrement du band sur 8 pistes seulement, avec une bonne quantité d’équipement analogique et une Rosetta 800 qui a converti le signal capté vers l’ordinateur pour poursuivre le travail vers les overdubs (procédés de superposition sonore). Les outils numériques utilisés étaient tous axés sur la transparence et la subtilité.

 

Gab Paquet - La Force d’Éros

https://gabpaquet.bandcamp.com/album/la-force-d-ros

L’inspiration pour ce projet était surtout de superposer des sons chaleureux des années 70 avec les sons froids précis des années 80. Dans les deux cas, c’est un travail de recherche sonore qui n’inclut pas l’ordinateur comme outil, pour ainsi rester en phase avec ces références. 90% des sons ont donc été créés de façon purement analogique avant d’être enregistrés ou convertis. L’album comprend aussi quelques chansons qui ont comme référence les années 2000 : cette fois, nous avons pu utiliser des séquences numériques et des montages par ordinateur, puisque c’était en phase avec l’esthétique de l’époque.

Sinon, nous avons utilisé largement le numérique pour ses forces : l’édition, la création de montages sonores, simulations numériques d’effets.

La particularité de ce projet est que le mixage a été effectué de façon analogique par Tonio Morin-Vargas. Bien que ça ait ajouté des étapes de conversion supplémentaires, la plus grande marge de manœuvre pour manipuler le signal analogique est la raison ultime de ce choix.

 

Anatole - Alexandre Martel

https://anatolequebec.bandcamp.com/album/alexandre-martel

L’esthétique recherchée ici en était une de sincérité et une atmosphère d’authenticité. Un peu comme les deux derniers projets, presque tout a été créé dans le monde analogique avant d’être converti pour l’ordinateur. Le numérique ne contribue pas vraiment à cette atmosphère d’authenticité, mais il peut permettre de créer des contrastes. Nous avons donc utilisé certains plug-ins numériques quand ça semblait approprié. Le mixage était presque entièrement numérique. Le mélange crée finalement une atmosphère d’authenticité « fabriquée », ce qui est en fait au cœur du discours du projet Anatole.


Alexandra Lost - Smoke

https://alexandralost.bandcamp.com/album/smoke

Finalement, à l’inverse, voici un autre projet où les sons ont été faits et les décisions ont été prises dans le domaine numérique, à partir de sons provenant de l’analogique et du numérique dans un ratio beaucoup plus axé vers le numérique. Ça crée un mélange organique éthéré, moins ancré dans le réel, et surtout en phase avec une facture sonore plus contemporaine.

Questions

Deux questions de type FAQ pour finir.

 

Quelles sont les bonnes marques de convertisseurs?

Je dirais que contrairement à mon expérience des années 2000 avec ma vieille MOTU, aujourd'hui la différence entre une carte audio abordable et un convertisseur de haute qualité n’est plus si importante. Par contre, si vous êtes sérieux avec ça, c’est un peu comme acheter une bonne perceuse pour ses projets de construction : ça vaut toujours la peine si vous comprenez la différence et que vous vous en servez.
Liste non exhaustive de bons convertisseurs : Apogee, RME, Black Lion, Antelope, Lynx.

 

Qu'est-ce que tu utilises comme taux d'échantillonnage et résolution?

En général, j’utilise 48kHz et 24 bits. J’ai déjà utilisé 44,1kHz et 96 kHz aussi. À mon avis, le taux d’échantillonnage, c’est un peu à votre guise. Si 96kHz ça vous fait sentir hi-fi, bien allez-y! Il faut savoir que les multiples de 48kHz s’agencent mieux en synchro avec l’image (pour fonctionner avec 24fps, 30fps, 60fps, etc.) Par contre, pour la résolution, convertir en 24 bits, c’est un minimum pour plein de raisons acoustiques et numériques.

Raccords

Projets connexes

Les écosystèmes logiciels pour la création temps-réel

Spatialisation sonore pour la poète Daphné B.

Aucune ressource n'est associé à cette fiche pour le moment.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *


Rechercher
Fermer ce champ de recherche.

Vous voulez contribuer au Robinet?