English

Diffusion électroacoustique sur Systèmes « multi Haut-parleurs »

par Philippe-Aubert Gauthier

GAUS (Groupe d’Acoustique de l’Université de Sherbrooke), 2500 boul. de l’Université, Sherbrooke, Québec, Canada J1K 2R1

Des parties de cet article sont aussi présentées dans « Introduction aux fondements, aux technologies et aux applications potentielles de la synthèse de champs acoustiques pour la spatialisation audio sur réseaux de haut-parleurs » [PDF], par Philippe-Aubert Gauthier et al. : Principalement dédié aux artistes ou aux compositeurs intéressés par la recherche et la création avec des réseaux de haut-parleurs qui peuvent inclure jusqu’à quelques centaines de sources, cet article introduit la technologie de reproduction du son qu’est la synthèse de champs acoustiques (WFS pour « Wave Field Synthesis »).

Les pages qui suivent présentent une courte introduction au sujet de la diffusion du son sur systèmes « multi haut-parleurs ». Cette discussion se concentre principalement sur la classification des technologies de reproduction du caractère spatial de l’audition naturelle tout en situant la diffusion sur systèmes « multi haut-parleurs » dans ce contexte. Avec une telle topographie technologique de la reproduction, il est plus aisé de se situer autant actuellement qu’en relation avec le futur. C’est avec un souci de clarification générale que cette présentation fut donc rédigée. Quoique cette revue se base essentiellement sur la dimension technique du problème, elle ne pénètre pas le détail des technologies et demeure spécialement édifiée pour répondre à des nécessités ou des interrogations qui pourraient survenir en processus de création ou de théorisation artistique. Ainsi, dans cette optique, la description spatiale actuelle puis future et, finalement, les rôles potentiels des artistes sont d’autres sujets abordés.

Pourquoi Spatialiser?

Par le biais de son ouvrage « Le Son des Musiques », Delalande parvient à démontrer la transition d’une importance de la musique comme système de notes vers une importance de la musique essentiellement, ou de plus en plus souvent, basée sur l’appréciation esthétique du son comme matière première . Dans ce contexte, on adhère donc à une définition spécifique de l’esthétique du son, c’est-à-dire les qualités auditives des sons et de leurs assemblages. Des qualités qui pourraient être formalisées par le biais d’adjectifs tels doux, rude, chaleureux, granuleux, lisse et une pléthore, voire une infinité, d’autres envisageables. En cette même étude, un important parallèle est établi entre cette migration des intérêts et l’évolution des technologies de reproduction du son . Avec l’amélioration de la fidélité de la reproduction du son sur support fixe, on note l’inclusion de nouvelles dimensions et considérations esthétiques à la musique enregistrée. Ainsi, à titre d’unique exemple évoqué, la réduction progressive du niveau de bruit de fond des enregistrements a progressivement incorporé la qualité acoustique de la réverbération des lieux d’enregistrement. Auparavant, lors de la production de la musique enregistrée, on n’entendait ni cette réverbération ni toutes ses subtilités, elle n’était donc pas le sujet de considération et d’usage esthétique. Avec la haute-fidélité temporelle et spectrale de l’enregistrement professionnel, ce n’est, à l’heure actuelle, évidemment plus le cas.

C’est à partir de l’extrapolation de cette observation qu’il est peut-être valable de situer la « musique spatiale » actuelle dans un contexte technologique de reproduction du son. Puisqu’il est maintenant possible de reproduire, plus ou moins fidèlement selon le cas, avec des technologies commerciales (1) ou au stade de la recherche (2), le caractère spatial de l’audition naturelle, il est probable que l’artiste ressente, consciemment ou non, individuellement ou collectivement, le besoin de s’approprier ce nouveau paramètre dés lors manipulable avec les technologies de reproduction spatiale du son, soit des technologies maintenant relativement accessibles. La musique fut évidemment toujours une expérience spatiale, mais ce caractère fut perdu depuis l’arrivée de l’enregistrement initialement monophonique. Inhérent aux musiques jouées par des instrumentistes avec des instruments acoustiques et maintenant progressivement récupéré par des moyens technologiques, ce caractère spatial reproductible devient sujet de considérations esthétiques lorsqu’on reproduit volontairement (3), ou utilise, ce caractère par le biais des moyens technologiques actuels.

Si l’on adhère maintenant à l’idée que l’usage d’une branche d’arbre comme outil peut être identifié comme une technologie, il est possible de situer autrement la musique spatiale ou son équivalent en art audio. Mon avis personnel, qui ne réclame pas l’exclusivité de toutes les explications possibles, origine ainsi d’un point de vue plus proche des recherches en réalité virtuelle et en reproduction haute-fidélité (auditive, visuelle ou même tactile).

Ainsi, tout comme pour la reproduction haute-fidélité du son, il me plaît de supposer que la fidèle reproduction de son caractère spatial peut s’inscrire dans la lignée d’un profond et récurrent fantasme de reproduction, ou de représentation, chez l’humain. Pensons par exemple à l’élaboration des règles de reproduction de la perspective graphique qui, tout au long d’une époque maintenant éloignée, se faisait avec les technologies du moment, soit de simples règles et crayons. Un autre exemple encore plus évident de cette volonté de la représentation est celui du dessin et de la peinture, anciens ou récents, quels qu’ils soient. Dans une optique peut-être plus actuelle, même l’intelligence artificielle qui tente de reproduire sommairement des éléments d’intelligence naturelle pourrait aussi s’inscrire dans cette lignée de la représentation, de la reproduction. Il en est de même pour l’évolution artificielle et les algorithmes génétiques qui, en musique et en musicologie, sont utilisés pour reproduire la créativité ou étudier l’évolution de la musique . Ainsi, par la représentation, des oeuvres se créent et certains phénomènes sont communiqués, expliqués et compris. Quoique cette dimension puisse être manipulée plus souvent par les artistes audio ou conceptuels, elle est peut-être aussi significative pour les compositeurs.

Avant de poursuivre, on se doit de souligner rapidement les significations pratiquement équivalentes de deux expressions sur lesquelles repose ce texte et assurément maints autres débats et discussions. En fait, puisqu’il est pratiquement impensable de dissocier la diffusion du son par un système « multi haut-parleurs » de l’intérêt pour la spatialisation, nous utiliserons de préférence, pour le reste de ce texte, l’expression spatialisation audio.

LA SITUATION DES SYSTÈMES MULTI HAUT-PARLEURS DANS LE PARADIGME TECHNOLOGIQUE DE LA SPATIALISATION AUDIO

Si la section précédente a touché sommairement les intentions attribuables à l’existence de la diffusion créative sur systèmes « multi haut-parleurs », cette section se tourne quant à elle sur les méthodes technologiques propres à ces intentions cachées ou explicites. Évidemment, on se limite à la discussion des intentions générales et des méthodes ou des techniques puisque l’approche conceptuelle et artistique de telles possibilités technologiques est laissée à la discrétion de l’artiste en voie à l’exercice d’une philosophie particulière ou d’un style personnel.

Parmi les recherches technologiques effectuées sur le sujet, il est possible d’introduire une première dichotomie quant aux principales approches possibles. La première classe de méthodes est la simulation de la perception et la seconde, selon une école de pensée opposée qui répond à l’intérêt de reproduire un champ acoustique sur une zone plus ou moins étendue, est la simulation de champs acoustiques. Cette première distinction des deux approches générales est représentée à la figure 1 et peut aisément être illustrée par quelques exemples pratiques.

Fig. 1 – Classification des approches fonctionnelles et des écoles de pensées en reproduction artificielle du caractère spatial de l’audition

Ainsi, l’ensemble de ce qui est couramment identifié comme des technologies binaurales appartient à la simulation de la perception. De telles technologies supposent, avec raison, que la seule reproduction de la pression acoustique aux tympans de l’auditeur peut être efficace lors de la reproduction d’une impression spatiale auditive. La validité de cette hypothèse repose sur un fait maintenant bien connu et vérifié. On sait en effet qu’un filtrage fréquentiel opère sur les sons qui se rendent aux oreilles selon leur direction d’arrivée (par rapport à l’oreille externe qui inclut le buste, la tête et le pavillon de l’oreille). Ce filtrage, essentiellement attribuable à l’oreille externe, procure des indications binaurales qui permettent la localisation auditive des sources acoustiques puisque les signaux auditifs binauraux sont légèrement colorés selon la direction d’arrivée du son et selon la distance de la source de ce son. Cette légère coloration permet de localiser inconsciemment les sources acoustiques . L’approche technologique binaurale (qui peut inclure : enregistrements binauraux avec mannequins, synthèse binaurale ou même filtrage binaural des prises de sons directes par les réponses impulsionnelles des oreilles externes) de la reproduction spatiale du son appartient donc à la simulation de la perception puisque cette solution technologique inclut une partie de la chaîne de la perception auditive du spatial, qui est, dans ce cas, l’oreille externe. Dans la même classe se trouvent les techniques d’affaiblissement ou de réduction de la diaphonie. La diaphonie correspond au « parlé-croisé » entre un haut-parleur de gauche et l’oreille de droite par exemple. En affaiblissant cette diaphonie, il devient possible d’utiliser des haut-parleurs comme un « casque d’écoute à distance ». Les techniques de prises de sons et de stéréophonies conventionnelles se basent quant à elles sur l’observation, ou la connaissance plus ou moins empirique, de phénomènes de la perception auditive pour établir des règles de mixage manuel (images fantômes par le biais de la stéréophonie d’intensité ou de délai). Encore une fois, une part de la chaîne de la perception spatiale du son est prise en compte par le biais d’expériences et d’observations des perceptions résultant de certaines actions typiquement « audio ». Ce qui motive également l’appartenance des techniques de stéréophonies conventionnelles à la classe de la simulation de la perception.

Peu de systèmes se basent sur une approche dite de simulation de champs acoustiques puisque les technologiques et les concepts physiques impliqués sont habituellement plus complexes et requièrent un certain bagage en acoustique et en traitement de signal. En pratique, le nombre de sources de reproduction et le traitement de signal impliqués en simulation de champs sonores sont, tous deux, plus importants que ceux évoqués par une approche de simulation de la perception. L’hypothèse propre à la simulation de champs acoustiques est la suivante : en reproduisant un champ acoustique dans l’espace (ou dans une partie de l’espace plus ou moins grande) avec une fidèle distribution spatiale de la pression, le système auditif complet (ce qui inclut le filtrage naturel par l’oreille externe) sera excité par un stimulus physique qui correspondra au stimulus virtuel, soit celui que l’on cherche à reproduire. Clairement, la tâche présente une nature plus physique et ne peut plus être atteinte par la seule compréhension théorique ou intuitive de la perception spatiale du sonore. Étant donné le nombre de sources et le traitement de signal nécessaires, on peut comprendre que la popularité de la simulation des champs acoustiques soit moindre. La « Wave Field Synthesis » (WFS), comme son appellation le suggère, est une méthode de simulation de champs acoustiques puisque le système tente de reproduire (objectivement ou, de façon équivoque, physiquement) un champ acoustique donné dans une zone entourée par des haut-parleurs. Les techniques de reproduction Ambisonique de base appartiennent aussi à cette catégorie puisque la zone d’écoute est entourée par des haut-parleurs. La création d’un motif de directivité synthétique autour d’une source, qui peut inclure plusieurs haut-parleurs, est aussi un exemple de technologie qui appartient à la simulation de champs acoustiques. Il importe de noter que ces deux problèmes présentent une complémentarité fondamentale. Le premier type (reproduction d’un champ acoustique à l’intérieur d’un réseau de sources, comme pour la WFS) est un problème intérieur et le deuxième type (reproduction d’une directivité synthétique autour d’une source complexe) est un problème que l’on pourrait qualifier d’extérieur. Cette nouvelle division, purement descriptive en apparence, a d’importantes répercussions sur les enjeux physiques et technologiques propres à ces deux objectifs complémentaires.

Dans cette hiérarchie, la place de la diffusion sur plusieurs haut-parleurs ne tient pas qu’à une seule case spécifique. L’appellation « multi haut-parleurs » est, quoique à propos et judicieusement rassembleuse en maintes situations, trop générique pour cela. Elle peut tout aussi bien désigner la diffusion sur « Surround 5.1 » par simulation de la perception que l’usage de sources à directivités synthétiques industrieusement disposées sur une scène pour un concert de haut-parleurs. En forçant la note, la présentation simultanée de matériel audionumérique, variant selon les canaux, sur une série de casques d’écoute, pourrait recevoir cette même appellation de diffusion sur système « multi haut-parleurs ». Ainsi, quoiqu’il soit difficile d’attribuer précisément des parties de l’organisation de la figure 1 à la présentation sur plusieurs haut-parleurs, l’expression « multi haut-parleurs » fait écho à certaines pratiques musicales électroacoustiques et y trouve pleinement son utilité.

À l’exception de certaines combinaisons et hybridations possibles, la classification des approches telle que présentée à la figure 1 regroupe l’ensemble des technologies possibles, voire imaginables, en spatialisation audio. On note par contre qu’une telle taxinomie n’est pas nécessairement reconnue; ainsi, selon les points de vue, d’autres qualificatifs peuvent être utilisés pour édifier des classifications qui pourraient s’attarder aux résultats obtenus (système en deux dimensions, trois dimensions, distribution homogène ou hétérogène des directions reproductibles, etc.).

ACTUALITÉS ET NOUVELLES TENDANCES EN DESCRIPTION SPATIALE

L’avènement et la standardisation de nouveaux formats de données multimédias structurés comme le MPEG-4 seront aussi une des pièces clés des plus opérantes dans le développement et l’épanouissement de la reproduction spatiale du son. Ce type de format, qui peut évidemment contenir des pistes audio sans compression de données, permet d’y inclure des instructions de traitement de signal et des descriptions de scènes virtuelles. Pour cette raison, les formats MPEG-4 ont retenu l’attention de ceux et celles qui sont concernés par l’interaction avec une virtualité , aussi variée qu’elle soit. Avec une telle approche on parle d’encodage spatial et non plus d’encodage par canal. Contrairement au temps où il employait des méthodes de stéréophonie traditionnelles (soit l’encodage par canal), lesquelles impliquaient des opérations de mixage sur un nombre variable de canaux pour atteindre manuellement la scène désirée, le compositeur qui travaillera dès lors sur l’encodage spatial sera beaucoup plus près de la scène virtuelle qu’il tente de décrire.Le contact entre l’œuvre et son créateur devrait ainsi être plus immédiat avec l’encodage spatial. En bout de ligne, c’est le système de reproduction qui sera en charge de décoder la scène virtuelle pour la présenter de son mieux en fonction des exigences de la scène virtuelle.

Il est maintenant intéressant de revenir quelque peu sur la figure 1 qui avait initialement posé un certain classement sur les méthodologies possibles pour la reproduction du caractère spatial de l’audition. Ainsi, au sujet de l’avenir de telles technologies, on peut se questionner au sujet de la compatibilité, de la complémentarité ou même du combat entre la simulation de champs acoustiques et la simulation de la perception. Pour l’instant les opinions sont partagées. Certains ne prêchent que par la simulation de la perception alors que d’autres ne croient qu’en la simulation de champs acoustiques. En gros, lorsqu’un système de diffusion s’adresse à un seul auditeur, la simulation de la perception est des plus séduisantes puisqu’elle demeure simple à réaliser avec un minimum d’équipement et de connaissances spécialisées. Évidemment, pour un système à grand déploiement pour une audience complète, il serait probablement plus efficace de se tourner vers la simulation de champs acoustiques. Sachant que l’argument en faveur de la simulation de la perception est essentiellement la simplicité de sa mise en œuvre et qu’en présence d’une audience complète un tel type de simulation devrait nécessairement inclure des systèmes d’adaptation aux mouvements de chacun des auditeurs (en faisant référence aux technologies binaurales ou à la réduction de la diaphonie dans ce cas), il est clair qu’un seuil de complexité équivalent à celui de la simulation de champs acoustiques est vite atteint. C’est un argument en faveur de la reproduction de champs acoustiques pour des situations de concerts par exemple.

IMPLICATIONS ET RÔLES POTENTIELS DE L’ARTISTE

Les sections précédentes ont déjà suggéré indirectement ce que pourraient être les implications et les rôles potentiels de l’artiste dans toute cette quête de la reproduction spatiale du son. En gros, et selon un avis personnel, il semble y avoir plusieurs possibilités et tendances. Elles ne vont pas nécessairement toutes dans le même sens, mais elles se complètent assurément.

L’appropriation des nouvelles techniques de reproduction alors qu’elles demeurent encore au stade de la recherche semble être une des principales possibilités pour éviter que l’artiste se retrouve avec les résultats des développements technologiques une fois qu’ils sont achevés. Cela correspondrait par exemple à la formulation, par les artistes, d’un commentaire théorique ou artistique sur les technologies en élaboration de telle sorte qu’il soit pensable que des collaborations et des influences se construisent entre les compositeurs et les chercheurs.Souhaitables sont ces collaborations entre artistes et chercheurs de telle sorte que les productions technologiques répondent aux besoins réels des utilisateurs principalement concernés par de tels développements techniques. En opposition à cette possibilité, il doit y avoir des artistes qui s’approprient les technologies de façon indépendante et autonome en les piratant ou en les critiquant. Cette deuxième avenue est tout aussi importante afin que la pratique artistique reste autonome et ne soit pas uniquement à la remorque des technologies commerciales. En général, cette seconde avenue présuppose une certaine compréhension des technologies par l’artiste.

Maintenant, à quoi donc doit s’attendre l’artiste, comment doit-il se préparer aux changements puisqu’il n’est pas nécessairement impliqué dans l’ensemble des nouveautés technologiques? La première chose à faire est assurément de ne pas trop s’inquiéter au sujet de la longévité des formats actuels tel le « Surround 5.1 ». Ainsi, si le compositeur s’assure de conserver la trace de la disposition des sources de reproduction qu’il utilise pour une œuvre actuelle, la compatibilité des futures technologies avec les présentes assurera la vitalité des œuvres en question.

Cette compatibilité tient du fait que la notion d’encodage spatial devrait progressivement remplacer l’encodage par canal.Tel que noté plus haut, l’encodage spatial est basé sur la description d’une scène virtuelle plutôt que sur le mixage pour une série de canaux de transmission ou d’enregistrement. Les scènes virtuelles incluent ainsi des informations au sujet de la position des sources virtuelles, de leur type, et du fichier audionumérique qui alimente chacune des sources virtuelles. Plusieurs de techniques, voire presque toutes à l’exception des stéréophonies conventionnelles, sont directement touchées par l’encodage spatial et peuvent donc inclure une description de scène virtuelle. Pour s’assurer une compatibilité avec des systèmes comme le 5.1, il suffit donc de construire virtuellement la configuration de haut-parleurs correspondant. C’est ce qui est parfois identifié comme le « virtual panning ». Et dans le pire des cas, il reste fort aisé de reconstruire un système « multi haut-parleurs » pour s’adapter à différents formats, un peu comme le font les organisateurs d’événements et les compositeurs actuels lorsque ce sont eux qui doivent s’ajuster aux contraintes d’un festival par exemple.

CONCLUSION

En guise de courte conclusion, notons simplement que le futur de la reproduction spatiale semble prometteur et propose plusieurs nouvelles possibilités qui auront assurément des répercussions sur les façons de travailler l’espace comme paramètre musical. La vitalité des recherches actuelles sur le sujet de la reproduction du caractère spatial de l’audition ouvre aussi la porte aux collaborations et aux échanges entre les milieux techniques et artistiques.

Des exemples de technologies commerciales seraient toute la vague « Surround » avec des configurations de type 5.1 ou autres, piratées ou non. Des applications des techniques binaurales sont aussi disponibles sur le marché.
Les techniques au stade de recherche sont par exemple : la réduction de la diaphonie dans le cadre des techniques binaurales, la synthèse de champs acoustiques comme la Wave Field Synthesis, la création de source à directivité synthétique et les techniques Ambisonique d’ordre élevé.
La notion de volonté artistique est ici importante puisqu’à l’origine, c’est une contrainte physique qui rend inévitable le caractère spatial de la musique jouée puisque les musiciens sont distribués dans l’espace et parce que les instruments acoustiques présentent une directivité de rayonnement acoustique.

RÉFÉRENCES

Les documents suivants présentent quelques lectures intéressantes sur le sujet en plus de soutenir quelques parties du présent article.

F. Delalande, Le Son des Musiques — Entre Technologie et Esthétique, Buchet/Castel, 2001.
E.R. Miranda, «At the Crossroads of Evolutionary Computation and Music : Self-Programming Synthesizers, Swarm Orchestra and the Origins of Melody», Evolutionary Computation, vol. 12, no 2, p. 137-158, 2004.
J. Blauert, Spatial Hearing, The psychophysics of human sound localization, The MIT Press, 1999.
P.R. Cook, Real Sound Synthesis for Interactive Applications, A K Peters, 2002.
J. Plegsties, O. Baum, B. Grill, Conveying spatial sound using MPEG-4, Proceedings of the AES 24th international conference, 2003, p. 58-65.
E.D. Scheirer, Structured audio and effects processing in the MPEG-4 multimedia standard, Multimedia Systems, 1999, vol. 7, p. 11-22.
M. Jessel, Acoustique Théorique : Propagation et Holophonie, Masson et cie, Paris, 1973.
F. Rumsey, Spatial Audio, Focal Press, 2001.
M.F. Davis, History of spatial coding, Journal of the AES, 2003, vol. 51, no 6, p. 554-569.

eContact!

eC!

Social top