Le son : de l'analogique au numérique

 

Le son

Tout son produit est le résultat d'une mise en mouvement de l'air (par la vibration d'un objet), ce qui conduit à faire varier la pression atmosphérique (l'air se comporte alors comme l'eau lorsqu'on jette un caillou). On observe des hauts et des bas, des pressions et des dépressions, à partir de la vibration émise, comme les vagues concentriques qui se forment autour du caillou lancé dans l'eau. Si vous placez un bouchon sur les vagues ainsi créées, vous voyez bien ce bouchon monter et descendre, mais notez que le bouchon ne se déplace que verticalement, ce qui indique que l'eau ne se déplace pas. Il en est de même pour l'air qui ondule ainsi verticalement et non latéralement. Seule l'énergie initiale se déplace dans l'air qu'elle fait osciller en avançant. Cette variation de pression plus ou moins importante selon la vibration émise au départ (nous parlerons plus loin de fréquence) va atteindre les fabuleux organes récepteurs que sont nos oreilles, qui réagiront à ces variations de pression et les transformeront en signal électrique analysable par notre cerveau.

Comment ressentirons-nous le son émis? Et bien l'acuité de nos sens auditifs nous permet de définir un son selon 4 critères différents :

son intensité : on pourrait dire son volume, sa puissance (plus le son est fort, plus les pressions et dépressions d'air vont être importantes, et plus notre tympan en subira l'action)

sa fréquence : il s'agit de sa hauteur dans le sens d'aiguë ou grave (il faut savoir que plus l'onde est "serrée", plus nous ressentirons le son comme aigu, et plus elle sera large, plus le son sera grave). Si vous avez lu les pages de Solfège, vous avez pu y lire que la note "La" qui sert de référence pour accorder les instruments (le célèbre diapason produit donc un La), est un "La" qui vibre à une fréquence de 440 Hertz.

son timbre : Faisons jouer le fameux "La" dont nous venons de parler par une guitare puis par un piano. La différence est flagrante. Le son n'est pas le même, et pourtant il s'agit de la même note. Comment expliquer cette différence de son? Cette différence est due à la constitution physique des instruments (dimensions, matière... même deux guitares sèches de marque différentes produiront un son différent). Cette différence qui caractérise la personnalité de chaque instrument, on l'appelle le timbre, et elle s'explique par les petites ondes "parasites" (ou plutôt ondes "résultantes" car il s'agit de lois physiques) qui gravitent autour de l'onde principale et qui apporte sa couleur au son. Ces ondes s'appellent les harmoniques.

sa durée : le temps durant lequel le son persiste

 

On représente souvent le son selon comme une belle sinusoïde. Cette courbe caractérisant un son pur n'est en réalité guère représentative des sons émis dans la nature compte tenu de ce que nous venons de dire. Les logiciels audionumériques vous montrerons des formes d'ondes caractéristiques, propres à chaque instrument, comme une photo d'identité.

 

ci-dessous, un son audio tel que le représentent les logiciels audio : rien à voir avec l'onde pure d'une sinusoïde. Différents paramètres modèlent la forme de l'onde d'un son :

 

 

 

 

 

 

 

Le long d'une onde pure... cette courbe pure nous permet tout de même de vérifier le phénomène de pression et dépression qui influence le son. l'axe horizontal des abscisses représente le temps. On se rend compte qu'au bout d'une période T, qui correspond à une dépression et une pression, le cycle va recommencer. Le nombre de fois que se reproduira ce cycle en 1 seconde déterminera la fréquence du son. L'axe vertical nous donne l'amplitude du son, donc son volume :

 

 

 

 

 

 

courbe d'un son grave :

 

 

 

 

 

courbe d'un son aigu : on peut vérifier ici que les pressions et dépressions sont plus serrées que pour un son grave. La fréquence d'un son aigu est plus élevée que celle d'un son grave :

 

 

 

 

La mise en vibration d'une corde de guitare sèche, un arbre qui tombe, un éclat de rire..., tous ces phénomènes produisent donc ce que l'on appelle le son analogique (dont la courbe représentative varie de façon continue). Nous allons bientôt voir la différence avec le son analysé de façon numérique et ce que cela implique.

 

 

Nos capacités auditives

Beaucoup d'animaux ont une ouïe beaucoup plus fine que nous. ce qui signifie que nous ne captons qu'une partie de l'éventail des sons, en particulier des fréquences. Quelle plage de fréquence l'homme est-il capable de capter? L'oreille humaine peut capter des sons compris entre 20 Hertz et 20.000 Hertz.

 

 

La numérisation du son

Comment rendre toutes les caractéristiques de l'infinité de sons analogiques se trouvant dans la nature par le biais d'une machine, l'ordinateur, ne parlant que le langage chiffré à base de 0 et de 1? En convertissant les sons analogiques en séries de nombres, donc en données numériques.

 

La numérisation se passe en deux étapes :

L'échantillonnage

Il s'agit de diviser une seconde de son en une série d'échantillons sonores, un peu comme un photographe de sport va photographier en rafale une scène de sport. Sa suite de photos retracera l'action, mais il manquera les étapes intermédiaires entre chaque photo. Pour être fidèle au son analogique original, il va donc falloir prendre un maximum d'échantillons par seconde, ce qui alourdira d'autant le fichier son produit de façon numérique. L'échantillonnage se mesure en Hertz parce qu'on établit qu'1 Hertz = 1 échantillon par seconde.

 

 

 

Pendant l 'échantillonnage, on prélève un certain nombre d'échantillons de son dans une période de temps (axe des abscisses). Plus on en prélèvera meilleure sera la qualité du son. Pour obtenir une qualité CD, il faut prélever environ 44.000 échantillons par seconde (la qualité Cd est de 44.100 Hertz ou 44,1 KHz).

 

 

 

 

 

 

 

 

 

Nous avons dit que l'oreille humaine captait une plage de fréquences comprise entre 20 Hz et 20 KHz. Et pourtant on échantillonne en 44,1 KHz pour un son qualité CD. C'est pour être sûr d'avoir une qualité parfaite. Mais aujourd'hui les logiciels permettent de monter à 88, 96 voir 192 KHz! Ce qui donne une résolution beaucoup plus fine évidemment.

 

 

 

Regardez la différence entre les deux courbes suivantes du même son.

Le son analogique original est fluide, ininterrompu :

 

 

 

 

 

 

Et le même son échantillonné faiblement apparaît hâché et n'est qu'une caricature de la réalité :

 

 

 

 

 

 

C'est pourquoi un théorème définit que pour assurer un parfait rendu d'un son analogique en numérique, il faut l'échantillonner deux fois plus que ce que l'oreille humaine est capable d'entendre. D'où la norme CD à 44,1 KHz qui représente deux fois les fréquences audibles par l'homme (20KHz maxi)

 

 

Le codage

 

Si l'échantillonnage indique le nombre de prélèvements sur une durée, le codage indique plutôt la qualité de ces prélèvements. Il est visible ici sur l'axe des ordonnées (donc sur l'amplitude du son) et s'exprime en bits :

 

 

 

 

 

 

Un codage en 8 bits donnera seulement 256 valeurs possibles, et risque de raboter le haut et le bas d'une onde, tandis qu'un codage de qualité CD se fera en 16 bits, soit 65 536 valeurs, ce qui donnera un son plus fidèle au son analogique original (exactement comme le codage en photographie numérique permet de jouer sur un plus grand nombre de nuances de couleurs). La technologie actuelle le permettant, les pros préfèrent travailler en 24 bits, ce qui permet un codage nettement plus fin puisqu'on passe à 16.777.216 valeurs. Le résultat se vérifie sur la dynamique du son qui s'en trouve grandement améliorée. Les ingénieurs du son travaillent donc sur un morceau dans cette qualité maximum de 24 bits et à 88 ou 96 KHz tout au long de leurs opérations de mixage jusqu'au mastering final. Ils reviendront à la norme 16 bits et 44,1 KHz pour le passage sur CD.

 

 

On l'a compris, numériser un son en qualité CD soit en 16 bits et 44,1 KHz, aboutira à des tailles de fichiers sons très importantes. Votre carte son doit être capable de convertir un son analogique en données numériques au standard qualité Cd. Tout dépendra de la qualité de ses convertisseurs. Un conseil, mieux vaut attendre et investir dans une carte "sûre" que regretter ensuite d'avoir un son sans "patate". Vous seriez l'éternel insatisfait. Il ne suffit pas de se fier aux caractéristiques affichées sur la boîte. Toutes les cartes sont vendues comme capables de faire de la qualité Cd et même plus. Mais vous serez sûrs de trouver la qualité au rendez-vous chez certaines marques qui utilisent des composants au niveau des ambitions affichées. Je vous l'ai déjà dit, bons composants = prix plus élevés (ne vous leurrez pas vous-même). Vous trouverez de bons produits chez M-Audio, RME, Digidesign, MOTU, Echo, ESI, Edirol... N'hésitez pas à consulter les forums et à considérer l'avis de plusieurs utilisateurs avant de trancher pour telle ou telle carte.

Au sujet des convertisseurs : répétons-le, ce sont des éléments clés, aussi bien pour la numérisation d'un son analogique (A/N), que pour sa restitution du numérique vers l'analogique (N/A). Ces composants sont très sensibles, en particulier aux radiations électromagnétiques et autres parasites (provenants du processeur haute fréquence et des autres périphériques...) qu'on trouve nécessairement dans un ordinateur. Donc, bien que les ordinateurs disposent de convertisseurs intégrés, il est préférable d'utiliser des convertisseurs externes.

Un autre paramètre vient encore alourdir les fichiers sons

 

 

 

Le nombre de canaux

Tout le monde sait qu'en audio, on peut être en mono ou en stéréo! Et mieux vaut être en stéréo pour écouter de la musique. Qui dit stéréo dit un canal Gauche et un canal Droit, ce qui multipliera par deux la taille du fichier!

D'où l'importance des disques durs de grande capacité. D'autant qu'un morceau en cours de composition pourra être encore bien plus lourd comme nous le verrons.

Il est courant de dire qu'une minute de son stéréo en qualité Cd prendra 10 Mo sur votre disque dur. Sachant que le standard d'une chanson est entre 3'30" et 4'30", çà fait 40 Mo la chanson en moyenne.

 

 

ADSR

Tous les sons sont caractérisés par une enveloppe ADSR : Attack, Decay, Sustain, Release

En reliant toutes les crêtes qui forment ce son, on peut tracer son enveloppe pour se rendre compte qu'elle est composée de 4 parties distinctes :

1) une montée subite, l'Attack (A) qui représente la montée en impulsion du son à partir du moment ou il a été produit ou attaqué. Cette phase ne dure qu'un bref instant pour laisser la place 2) au Decay (D) qui est une petite chute menant 3) au Sustain (S), c'est-à-dire une tenue dont la longueur peut varier. Enfin, lorsque la note est relâchée, 4) le Release (R) pendant lequel le son va décroître.

Chaque son des différents instruments présentera une enveloppe ADSR caractéristique de cet instrument. On se doute que l'enveloppe ADSR d'un son de piano ne ressemblera pas à celle d'un son percussif de batterie, qui ne présentera pas ou très peu de sustain.

Nous retrouverons les termes qui caractérisent l'enveloppe ADSR lorsque nous parlerons des effets de traitements audio.

 

Maintenant que nous en savons un peu plus sur le son, nous allons parler de l'utilisation de la norme MIDI dans le domaine de la musique.

 

Menu MAO

Page suivante