• le son pour les nuls Syndicate content

Son analogique / Son numérique

Par François Groult - Publié le 08 May 2009

Son analogique / Son numérique

SON ANALOGIQUE / SON NUMERIQUE

On aborde maintenant la transformation des vibrations sonores, c'est à dire des variations de pression acoustique, sous des formes manipulables pour être modifiées et stockées pour être reproduites à volonté. Les variations de pression acoustique (l'origine du son) sont en effet transformables en variations électriques pratiquement identiques.

Il existe deux "images électriques" du son: le son analogique et le son numérique.

Le son analogique est la transformation des vibrations sonores en signaux électriques variant exactement dans le même temps et dans les mêmes proportions.

En d'autres termes, on dit qu'un signal électrique généré par un micro est transporté, à travers un câble puis une console et enfin à travers un ampli et son haut-parleur, d'une façon analogique lorsque les vibrations électriques qui parcourent ces éléments sont identiques, c'est à dire analogues, en fréquence et en amplitude aux variations de pression, donc aux vibrations de l'air.

Prenons l'exemple enfantin du téléphone à fil tendu. Deux boites de conserve, avec un fond assez large pour résonner comme un tambour, et une ficelle tendue entre les deux.Boite à fil

Si je fais "Big Bang" devant la boite A, le fond de la boite va vibrer au rythme de ma parole.

Les vibrations vont être transmises au fil attaché dans le fond de la boite puis vont parcourir le fil sur toute sa longueur et faire vibrer d'une façon semblable le fond de la boite B.

Si quelqu'un colle son oreille devant la boite B, il entendra "Big Bang".

C'est magique, le fil transporte l'onde sonore comme l'air le fait dans la nature

On peut maintenant imaginer que le transport de la vibration peut se faire avec autre chose qu'un fil tendu.

Par exemple si à la place du fil attaché au fond de la boite on fixe une aiguille pointue, elle va vibrer de la même façon que le fond de la boite et va pouvoir creuser sur un matériau tendre (comme un rouleau de cire ou un disque que l'on fait tourner devant l'aiguille) des cavités analogues aux vibrations de la boite, donc de l'air, donc de ma voix.

Une fois le disque ainsi buriné, il suffit de poser sur les sillons une autre boite avec une aiguille identique et les aspérités du sillon vont faire vibrer pareillement le fond de cette boite.

C'est à la fois une autre façon de transporter une onde sonore d'un point à un autre et la possibilité de stocker du son.

Avant l'électricité, c'est ce qu'on a inventé de plus simple pour transporter et stocker les vibrations sonores, c'est à dire reproduire les sons: une reproduction mécanique.

Principe de gramophone

Puis l'électricité est arrivée et d'autres solutions sont apparues pour le transport, le stockage et même le traitement ou la manipulation des informations sonores.

Il faut savoir qu'un courant électrique alternatif traversant un fil conducteur quelqu'il soit, peut être transformé en ce qu'on appelle un flux magnétique qui lui est directement lié, exactement similaire. Cette énergie magnétique impalpable est si jumelle du courant électrique qu'a été inventé tout exprès le terme générique de "électromagnétisme" pour en analyser les effets.

Donc qu'on se le dise: qui dit courant électrique dit flux magnétique.

Parlons donc "son électrique".

 

Ainsi un microphone est comparable à la boite A. Sa membrane est comme le fond de la boite mais au lieu d'y accrocher une ficelle ou une aiguille on y a fixé une bobine de fil électrique (comme une bobine de fil à coudre) qui peut bouger (vibrer donc) dans le centre d'un aimant.

Or, miracle de la physique et de l'électromagnétisme, il se trouve que chaque déplacement de cette bobine dans l'aimant crée un courant électrique aux deux bouts du fil ainsi bobiné. Lorsque la bobine avance elle crée un courant positif, lorsqu'elle revient à sa position initiale un courant négatif  et lorsqu'elle s'arrète un courant nul,.

Et ainsi de suite, ou vice versa, etc... .    Ca rappelle la lame de scie, non ?

L'amplitude et la fréquence du courant est donc fonction de l'amplitude et de la fréquence des déplacements de la bobine. C'est l'électro-aimant.

Le courant électrique ainsi créé est en tout point identique (analogue) aux vibrations de la membrane du microphone, c'est à dire de la bobine, donc...  de la source sonore.

De plus, deuxième miracle, le phénomène physique de l'électro-aimant est totalement réversible.

Ainsi mettons un fil électrique à la place de la ficelle du téléphone primaire à boites de conserve. A la place de la boite B mettons un autre microphone plus costaud qu'on appellera haut-parleur. 

Le fil électrique relie les deux bobines à chacun de ses bouts. Le courant électrique va progresser dans la première bobine, puis dans le fil électrique, et enfin traverser la deuxième bobine et ainsi faire se analogiedéplacer d'une façon analogue la membrane de ce haut-parleur qui lui est accrochée.

 

 

La membrane fait vibrer la bobine qui en se déplaçant dans l'aimant génère de l'électricité.

L'électricité traverse la deuxième bobine et fait vibrer la membrane du haut-parleur.

Il y a analogie entre la pression sur la membrane exprimée en décibels  ......................    

                                          .......................  et le niveau électrique exprimé en volts.

Par contre les mouvements de la ficelle du téléphone d'enfant ou les variations électriques dans la bobine du micro sont très très faibles et s'affaiblissent très vite sur la longueur du fil.

C'est l'amortissement, bien connu dans d'autres domaines. D'où un vrai problème de restitution parfaite de l'amplitude et de la fréquence d'un son. Il a fallu imaginer un système capable de résoudre ces difficultés de transmission.

On imagine aisément la suite des événements. Si on insère un appareil électronique adéquat entre le micro et le haut-parleur, on va pouvoir modifier le courant électrique à sa guise:  l'amplifier, le filtrer, le couper, le manipuler, en totalité ou en partie.

On va même pouvoir lui ajouter d'autres signaux électriques pour l'embellir ou le maquiller.

C'est ce que permet une console de mixage avec ses filtres et ses potentiomètres de niveau: plusieurs signaux électriques modifiables à volonté pour en faire un seul, résultant de leur somme, un son mélangé ("mixé") à partir de plusieurs originaux différents.

Malheureusement avec les systèmes analogiques on ne peut pas modifier directement la fréquence originale d'un son (à moins de faire défiler le son plus ou moins vite).

Par contre on peut augmenter ou diminuer le niveau du signal électrique "image" du son sur une partie précise de sa gamme de fréquences (son spectre de fréquences) et ainsi donner l'illusion que le son a changé de "couleur".

Par exemple si on augmente avec un correcteur le niveau des hautes fréquences d'un son, on en change le timbre ce qui donne l'impression que le son est plus aigu.

D'autant qu'en ce faisant on aura aussi augmenté le niveau global de ses harmoniques.

Ceci est vrai pour toute la gamme des fréquences sonores.

On peut donc dire en résumant que le son analogique est un son "électrique" qui varie continuellement comme les ondes sonores dans l'air.

On sait maintenant comment intervenir sur un son par l'intermédiaire de son "image électrique". Mais jusqu'à maintenant on ne peut le faire qu'en temps réel.

On a donc cherché à le figer pour le manipuler en d'autres lieux et à d'autres moments, pour le restituer toujours identique autant de fois que nécessaire. Le vieux gramophone le conservait d'une façon mécanique, comme le microsillon, mais on ne pouvait pas le modifier.

Maintenant on sait stocker des informations sonores sous des formes "électriques" et informatiques.

Ainsi la pellicule magnétique est, comme son nom le laisse supposer,  un tapis de micro-particules magnétisables  (comme des milliards de micro-aimants) déposées en fine couche sur un support en plastique et qui ont la particularité d'être "aimantables" à volonté.

C'est comme un aimant variable

Donc au lieu d'avoir un aimant dont la "force" est fixe (on dit "flux magnétique"), on dispose d'un aimant dont la "force", le flux magnétique, peut varier dans le temps sous une influence extérieure.

Branchons les fils de la bobine du microphone non plus sur le haut-parleur mais sur une autre bobine, la tête d'enregistrement, devant laquelle passera la couche de particules magnétiques "aimantables".

Le courant électrique généré par la bobine du micro va parcourir la bobine de la tête d'enregistrement et créer ainsi un flux magnétique qui va aimanter plus ou moins la couche des particules magnétisables au même rythme que le courant.

L'aimantation résultante est donc analogue en fréquence et proportionnelle en amplitude au courant électrique qui a traversé la bobine de la tête d'enregistrement.

Le flux magnétique est identique au courant électrique.

L'aimantation obtenue est stable jusqu'à l'effacement, c'est à dire la "désaimantation" totale. Cela n'est pas tout à fait exact, en réalité, car la bande magnétique s'efface d'elle même, petit à petit. L'aimantation commence à se dégrader au bout de quelques mois. De même, la lecture répétée d'une bande magnétique provoque une dégradation assez rapide du son, c'est pourquoi le son est souvent repiqué de nouveau avant le mixage.

On l'a vu la réciprocité est vraie.

Donc si on fait passer cette couche de particules aimantées différemment devant une autre bobine de fils électriques, la tête de lecture, on obtient à ses deux bornes un courant électrique identique ..... en fréquence et en amplitude à celui qui a servi à l'aimanter.  Hé oui !

Conclusion les variations de courant électrique sont transformées en variations de flux magnétique dans une tête d'enregistrement et les variations de flux magnétique sont transformées en variations de courant électrique identiques dans .... une tête de lecture.

Il y a analogie entre le courant électrique et le flux magnétique.  L'un varie comme l'autre.

Ces signaux électriques et magnétiques sont censés être reproductibles à l'infini d'un support de stockage à l'autre. Dans la pratique cela s'avère totalement faux à cause des bruits de fond.

En analogique le transfert des signaux électriques "image" d'un son n'est jamais parfait.

Il existe en effet des mouvements vibratoires électriques infiniment petits générés par les appareils électroniques d'amplification ou de traitement, et le support lui-même n'est jamais totalement neutre "magnétiquement" parlant, même en l'absence de signal électrique "magnétiseur".

Ces signaux infiniment petits des systèmes analogiques se surajoutent à chaque transfert, ou à chaque traitement, détériorant toujours un peu plus le signal électrique original: on parle de bruit électronique et de bruit de bande.

La quantité non négligeable de ces  bruits parasites est mesurée par le rapport du niveau électrique du Signal original et du niveau électrique du Bruit de fond: S/B dont l'unité de mesure est le décibel (dB), car c'est un rapport d'amplitude. (décibel.... décibel.... encore lui).

Plus le résultat est grand, meilleure est la chaîne de traitement sonore.

Puis l'informatique est arrivée ..... et d'autres horizons se sont ouverts sur le transport, le stockage, le traitement ou la manipulation des informations sonores.

L'informatique fonctionne avec l'électricité bien sûr, mais non plus sur le principe du courant électrique alternatif dont l'amplitude et la fréquence varient continuellement dans le temps, mais tout au contraire selon un principe de discontinuité temporelle: il y a ou il n'y a pas de courant électrique, le contact est ouvert ou fermé, c'est éclairé ou éteint, blanc ou noir, il y a quelque chose ou rien du tout, ... zéro ou un.

 

Voilà le premier secret de l'informatique:  0 ou 1.

 

Ce sont les deux seuls caractères de l'alphabet informatique: l'alphabet binaire.

En effet les informations à traiter sont codées, selon un "rythme" et une "grammaire" précise, sous la forme d'une suite de présence et d'absence de signal électrique.

C'est à dire que le signal électrique représentant l'information n'est pas continu dans le temps comme en analogique, mais haché en plusieurs petits bouts qui forment une suite rythmée de présence de signal électrique et d'absence de signal électrique.

C'est un peu comme pour le morse: une suite de "bips" et de silences dont la cadence représente un caractère.

Il y a "bip" quand le courant passe, il y a "silence" quand on arrête le courant.

Pour analyser facilement les informations codées dans un ordinateur, on a choisi de donner la valeur 1 au courant électrique maximum et 0 quand il n'y a pas de courant électrique.

Le rythme des 0 et 1 par seconde est la fréquence de codage ou fréquence de calcul.

Le courant électrique utilisé pour faire "bip" est toujours de même niveau.

Ce qui compte pour décoder l'information c'est de pouvoir faire la différence entre le bip et le silence. Même si l'environnement ou le matériel génère un souffle infernal, si on peut encore "lire" la différence entre le niveau électrique du bip et l'absence de courant électrique, l'information est décodable.

Pour représenter sous forme de "chiffres" un signal électrique (qui en ce qui nous concerne serait "l'image" d'une source sonore) on ne parle plus de Hertz ou de décibels, mais de bits.


Le codage est dit binaire car fait d'une suite agencée des deux seuls états possibles représentés par 0 et 1: BInary digiTS.

 

Lorsqu'un ordinateur lit au clavier "A" il code  :  Echantillonnage

 

 c'est à dire en représentation numérique                  "   1 1 0 1 1 0 0 1 "                 bits

 


ou bien s'il lit "Z" il code        " 1 0 1 0 1 0 1 0 "            courant nul = 0      courant maxi = 1

et c'est cette suite logique de courant électrique discontinu, ce train d'impulsions électriques, qui voyage dans ses circuits et peut être enregistré sur un support de stockage quelconque, tel une disquette ou un disque dur, sous la forme donc d'un signal électrique rectangulaire.

Ces impulsions électriques peuvent également commander un faisceau laser qui va "buriner" un disque en plastique, le CD, et reproduire la suite logique informatique sous la forme de trous ou d'absence de trou.

La fréquence de codage est constante (c'est la fréquence de l'unité centrale de l'ordinateur) et l'amplitude du courant de codage toujours la même (quelques volts).

Chaque caractère dans un ordinateur est en général codé sur 8 bits: c'est un octet.

Succinctement on peut dire que tous les 8 bits l'ordinateur sait qu'il s'agit d'un nouveau caractère. Il peut ainsi restituer à l'écran la suite logique des caractères entrés au clavier ou enregistrés sur son disque. Par exemple:

 " 1 0 1 0 1 0 1 0 1 1 0 1 1 0 0 1 1 0 1 0 1 0 1 0 1 1 1 0 1 1 1 0 0 0 0 0 1 0 1 1"  =   " ZAZIE "

 

On peut donc reproduire sur papier la suite logique des états du courant électrique en les représentant sous la forme d'une suite de chiffres binaires correspondants, c'est à dire sous une forme numérique.

Le son informatique est donc le codage sous forme de discontinuité électrique d'une image électrique continue.

 

Il n'y a donc plus analogie entre les deux: l'un est lié directement aux variations des fameuses pressions acoustiques du son, l'autre est une suite d'échantillons de ces variations à différents moments.

 

On parle plus facilement de son numérique ou de digital sound en anglais.

 

Voici le principe de base de l'informatisation du son

                                              ..... ou plutôt de l' "image électrique" du son.

 

Les signaux électriques originaux venant du microphone sont analysés par échantillons plusieurs milliers de fois par secondes: 44,1 milliers de fois par seconde (les CD par exemple) ou même 48 milliers de fois par seconde.

C'est ce qu'on appelle la fréquence d'échantillonnage: 44,1 ou 48 kHz. 

Et même maintenant 96 kHz.

Cet échantillonnage est comparable à la prise de vue cinématographique:

24 images fixes par seconde d'un mouvement continu sont 24 "échantillons" photographiques qui donneront une fois projetées l'illusion du mouvement continu, sans saccade visible.

Le mouvement restitué nous semble identique à l'original. L'oeil n'y voit que du feu.

A 16 images secondes le mouvement est toujours perceptible mais saccadé: l'oeil ne dispose pas d'informations suffisamment nombreuses par seconde pour recréer l'illusion du mouvement: c'est qu'il manque des informations importantes du mouvement entre chaque prise de vue, entre chaque "échantillon". Le mouvement s'est prolongé entre deux photographies et cette partie là du mouvement est ignorée, c'est à dire non-échantillonnée.

Le principe est relativement similaire pour le son.

Cependant, la correlation avec l'image s'arrête là. La fréquence d'échantillonnage choisie est directement liée à la bande de fréquence que l'on souhaite reproduire. Il n'est, en effet, pas possible de reproduire des fréquences supérieures à la moitié de la fréquence d'échantillonage. En pratique, il faut diminuer cette limite de 10 % pour arriver à un résultat réaliste.

Les standards sont 32 (pour la radio),  44,1 ou 48 mille fois par seconde. Le standard de 44,1 permet de reproduire des fréquences jusqu'à 20 000 Hz, qui sont à la limite supérieure de l'audition humaine.

Bref, on dispose donc après échantillonnage de 44 100 ou 48 000 "photos" par seconde du niveau des déviations électriques du son analysé.

Chaque échantillon est quantifié c'est à dire qu'il lui est attribué, après calcul par le système de numérisation, une valeur numérique binaire qui est la représentation du niveau électrique du signal original.

Chaque résultat du calcul sur un échantillon est appelé mot de quantification (l'équivalent d'un photogramme du film): c'est une suite logique de 0 et de 1, une suite de bits représentative de la variation électrique originelle du son.

De nouveau la comparaison avec la photo est possible.

 

En effet suivant la qualité de la pellicule utilisée, la définition d'une image peut varier dans de grandes proportions. Toujours à 24 images seconde, si les grains d'argent ne sont pas en quantité suffisante la photo sera plus grossière, moins bien définie. Chaque grain d'argent d'une pellicule photo peut être comparé (en faisant un petit effort) à un "bit" numérique.

On a vu qu'il suffisait de 8 bits par mot numérique pour différencier chaque lettre ou caractère spécial de l'alphabet. Il faut bien plus que ça pour restituer sans altération ou perte de définition toutes les valeurs d'un signal électrique résultant d'une onde sonore complexe.

La longueur des mots numériques de quantification utilisés professionnellement sont de 16, 18 20 ou même 24 bits.

Plus le mot est long, plus il pourra représenter de nuances et de définition du signal électrique d'origine.

 

Echantillonnage

          Temps(rythme d'échantillonage)

         0 1 2 3 4 6  7 7 6  5 4 3 2 1 0  0 1 2 3 4  5 6 7 6 5  4 3 2 1 0      Valeurs de chaque échantillon en volts

0000 0001 0010 0011 1100 1011 1001  1001    etc........   Correspondance en chiffres binaires

                                                                           etc......     Signal électrique "image" des échantillons

 

Principe de l'échantillonnage informatique d'un son électrique.

A chaque déviation électrique du son original correspond une valeur exprimée en volts:

c'est l'échantillon, c'est à dire une mesure périodique de la valeur électrique du son.

Cette valeur est traduite en numération binaire (sur 4 bits dans l'exemple ci-dessus), donc une suite de 0 et de 1.

On obtient donc une suite cadencée de mots numériques qui est l'image de la déviation électrique d'origine du son.

Ici, dans l'exemple ci-dessus, elle est "chiffrée" volt par volt (échelle 1 volt).

On voit bien qu'entre chaque échantillon la valeur électrique de la déviation n'est pas mesurée.

Si on veut une plus grande définition, il faut augmenter le rythme des échantillons.

Mais, parallèlement, il faut augmenter la longueur des mots numériques afin de "chiffrer" avec une plus grande précision, de l'ordre du millionème de volt (échelle 0,000001 volt), les moindres déviations électriques du son jusqu'au plus importantes.

Il faudra pour atteindre cette définition sonore des mots numériques de 16 bits au minimum et un rythme d'échantillonnage de 44,1 ou 48 mille fois par seconde. Aujourd'hui on utilise des appareils travaillant sur 20 ou 24 bits à des fréquences de 96 kHz.

La dynamique du son numérique, c'est à dire l'écart entre les sons forts et les sons faibles, ne dépend pas des limites des appareils électroniques ou de la bande magnétique, mais bien uniquement de nombre de bits utilisé: les limites du centre de calcul.

Plus les mots numériques sont longs et fréquents, plus ils pourront quantifier avec précision une importante déviation du signal électrique d'origine.

Pour les fans de technique, chaque bit apporte une dynamique de 6 dB, c'est à dire qu'un mot de 16 bits procure une dynamique théorique de 96 dB; dans la réalité on obtient jamais ce résultat théorique, mais on s'en approche à 3 ou 4 dB près. En effet si les écarts de déviation électrique à quantifier (la dynamique) vont de 0 à 15 par exemple, on pourrait dire par comparaison que des mots numériques à 4 bits seront suffisants.

Mais si une déviation électrique atteint ou dépasse 16 elle ne pourrait être quantifiée qu'avec des mots numériques d'au moins 5 bits (jusqu'à 31). La quantification sur 16 bits permet de différencier  65 535 états différents.

Et le souffle ?   Le fameux rapport signal sur bruit ?

 

Sur un support analogique le "souffle" de la bande se rajoute au signal originel et finit par être très important et très gênant au fur et à mesure des copies successives.

En numérique, c'est seulement le résultat binaire de la quantification du signal originel qui compte et ce qui est inscrit sur la bande est la transcription électrique de ces calculs:

la suite de présence et absence de courant électrique correspondant aux chiffres binaires.

 

Dès lors qu'il est possible d'extraire le signal utile du bruit de fond, la lecture est possible sans aucune altération du signal. Contrairement à ce que l'on pourrait croire, un signal noyé dans du bruit de fond est parfaitement exploitable, car la nature des signaux inscrit sur le support est connue. Par des procédés techniques appropriés, il est possible d'extraire des signaux si faibles, que l'oreille humaine ne les entendraient même pas au milieu du bruit de fond.

Le bruit de fond du support n'intervient pas, puisque ce bruit de fond est analogique.

souffle

 

 

 

 

 

 


Commentaires

Vous devez vous identifier pour poster des commentaires.