jeu-video-son-1-analyse-01

Problématique du son dans le jeu vidéo

Jeux et musicalité

⏱ 29 minutes

Adaptation d'un dossier proposé dans le cadre du cours de M. Martin Gracineau.

Dans un film de cinéma, le son tient tout naturellement une place prépondérante. Sur une base culturelle et sociale sans cesse complétée depuis l’apparition du sonore dans le septième art, la musique et les bruitages accompagnent l’image comme un guide. Ils renforcent l’écriture scénaristique et explicitent des choix conceptuels.

Avec les améliorations technologiques rencontrées par le jeu vidéo 🎮 au fil de son histoire, petit à petit, les passerelles entre celui-ci et le cinéma se sont faites de plus en plus prégnantes. Aux sons Midi sur 4 pistes ont succédé de véritables compositions réalisées par des professionnels des deux milieux.

Le jeu vidéo a, parallèlement, pu imaginer des appropriations de l’outil son. Force de sa composante exclusive, l’interactivité, le jeu a su ainsi dévoiler un potentiel inexploré jusqu’alors grâce aux rythm games.

Au cours de ce dossier, nous allons donc nous attacher à développer la problématique du son dans l’histoire du jeu vidéo, ses caractéristiques et l’utilisation que le joueur peut en faire. Après un historique et un focus sur les jeux musicaux, notre analyse sera étayée par le point de vue d’un professionnel du milieu, Yoan Fanise, directeur du son chez Ubisoft Montpellier pour des jeux tels que Beyond Good & Evil, Rayman contre les Lapins 🐇 Crétins ou encore King Kong.

Bref historique du son dans le jeu vidéo et importances concrètes

Évolutions technologiques

Pong, apparu en 1972, est considéré comme le premier véritable jeu vidéo de l’histoire (bien que cela se discute, mais ce n’est pas notre propos). Le concept de Pong est une représentation basique et monochrome d’un jeu de tennis vu de dessus. Devant cette représentation diégétique, les joueurs du jeu vidéo peuvent déplacer une barre latérale, représentant très simplement une raquette, de bas en haut. La seule piste sonore de Pong ne contient pas d’accompagnement musical, mais un son unique. Celui-ci est un “LA 440” synthétique au format MIDI, qui rythme l’action à chaque impact de la balle sur l’une des barres. Ce son est donc répété dès qu’il y a un contact visuel entre deux pixels, et c’est tout.

Les autres titres des années 1970, tels que Space Invaders ou encore Pac Man, fonctionnent plus ou moins d’une manière analogue. Leur unique piste sonore est en MIDI. Cette piste est consacrée entièrement aux bruitages, qui sont des déclinaisons de notes ajustées aux besoins visuels. S’ils ne sont que des variations, les sons accompagnant ces jeux ont au moins le mérite d’être plusieurs. Toutefois, il faudra encore attendre avant d’y voir s’ajouter une bande musicale d’accompagnement.

La véritable prise de conscience de l’intérêt du son dans les jeux vidéo vient probablement de Nintendo. Lors de la création de leur premier système de jeu de salon, la “Nintendo Entertainment System” (appelée NES en occident, ou encore Famicom pour “Family Computer” au Japon), les équipes de Recherche & Développement s’accrochent à l’idée que la musique tiendra une place prépondérante dans les jeux que fera tourner la machine. L’accompagnement sonore doit d’abord attirer le public vers la console de jeu, puis donner l’envie au joueur de rester devant son téléviseur, au même titre que les graphismes, l’histoire ou encore la manière de jouer. La NES permet donc à la musique et aux bruitages de se mêler dans les jeux, grâce à deux pistes sonores simultanées sur un seul et même support. Dans l’histoire du jeu vidéo, c’est une première et un cas d’école, puisque ce système sera repris et adapté indifféremment jusqu’à aujourd’hui.

C’est ainsi qu’apparaissent des thèmes musicaux simples et accrocheurs, comme celui de Super Mario Bros. Aujourd’hui, le gimmick de Mario (tout au moins les premières notes aisément mémorisables) est identifiable très facilement et fait partie des thèmes connus, plus ou moins consciemment, par beaucoup d’entre nous. Les “bruitages” (c’est à dire les sons réplicatifs et non réplicatifs non liés à la “musique”) sont également l’une des marques de fabrique du jeu : le son accompagnant la découverte de pièces, ou les sauts du personnage toujours dans cette même série, restent gravés dans les mémoires de beaucoup d’entre nous. Pour les amateurs de jeux vidéo de longue date, cela vaut pour de nombreuses séries.

Super Mario Bros. a donc su, pour la première fois, séparer deux pistes sonores : la première, continue, pour la musique, et la seconde, contextuelle, dédiée à conséquences de certains changements visuels. Cette prouesse de l’époque est due à l’indépendance, pour la première fois, de la carte son par rapport au processeur de calcul principal. Cette méthode d’utilisation de plusieurs pistes sonores simultanées sera reprise dans les années suivantes pour les autres consoles de Nintendo (Game Boy, Super NES, Nintendo 64) puis appliquée par ses concurrents, notamment par les consoles de Sega : Master System, Game Gear et Megadrive.

Fin 1994, le géant de l’électronique Sony s’installe sur le marché du jeu vidéo en lançant sa propre console de jeux vidéo, la PlayStation. Fort de son succès sur les marchés hi-fi et vidéo, et de ses compétences en électronique, la marque fait profiter sa machine des dernières innovations techniques. Ainsi, pour la première fois, une console de jeux utilise le support CD qui permet au son de prendre une toute autre ampleur. Les musiques passent du basique format MIDI à un son WAV modulé par PCM (Modulation d’Impulsion Codée) à 24 voies sur une fréquence de 44,1 kHz. Grâce aux capacités de stockage du format CD, la qualité du son est donc théoriquement identique à celle d’un disque musical, dépendamment de la compression.

Ce changement de format a permis une envolée de la qualité du son dans le jeu vidéo. Les musiques se sont faites de plus en plus complexes, voire orchestrales. De plus, les voix digitalisées sont peu à peu devenues de véritables doublages de qualité, comme pour un film de cinéma. Sa capacité de stockage et son coût réduit ont rapidement fait du format disque un incontournable du jeu vidéo, renvoyant la cartouche au titre de format “rétrograde”. Celle-ci ne sera donc bientôt plus utilisée que par les consoles portables. Toutes les futures machines de salon, branchées sur la télévision, voire sur des enceintes ou même un ensemble Home Cinema, utiliseront le disque comme format standard.

Les évolutions technologiques ont continué à profiter au jeu vidéo. Ainsi, le DVD a plus récemment remplacé le CD (au tout début des années 2000), proposant une quantité et une qualité des sons encore accrues, notamment grâce à la capacité de stockage. Dans le même temps, les consoles de jeu se sont mises à reconnaître le branchement en six canaux (Dolby Pro-logic II, mais aussi et surtout le fameux 5.1), en particulier grâce aux sorties optiques.

Aujourd’hui, il est devenu quasiment impensable de jouer à un jeu vidéo sans effets “surround” car, autant que l’image, l’environnement sonore immerge le joueur dans un univers et participe de sa cohérence. Les exemples sont flagrants : la récente Wii de Nintendo, dernière console de salon à être sortie, pousse l’expérience auditive jusqu’à proposer une petite enceinte incrustée dans la télécommande de jeu. C’est à ce jour, pour une machine de jeu vidéo, la source sonore la plus proche du joueur.

Qui sait ce que nous réservent encore les innovations de ces prochaines années...

Caractéristiques particulières du son dans le jeu vidéo

En-dehors des composantes techniques qui déterminent le champ d’action du son dans le jeu vidéo, ce média doit également jongler avec l’interactivité qui fait beaucoup de son principe. Le jeu vidéo s’est donc constitué, au fil de son évolution, des caractéristiques propres que nous allons rapidement aborder.

Son exclusivité majeure étant que, contrairement à un film devant lequel le spectateur est totalement passif et n’a aucune influence sur quelque déroulement que ce soit, dans le jeu vidéo c’est le joueur qui crée sa propre mise en scène, et ce grâce à l’interactivité. En effet, les personnages progressent dans les niveaux au fil de l’avancée de celui qui les contrôle, c’est à dire le joueur. Le déroulement est alors, par essence, non linéaire. Cela signifie qu’aucune partie de jeu vidéo ne ressemble théoriquement à une autre. L’avatar effectue des actions, change de lieu et étire donc au besoin la durée d’une piste sonore. Celle-ci est ainsi vouée à devenir, à un moment où à un autre du jeu, une boucle. C’est pourquoi les compositeurs de thèmes de jeu vidéo ont dû apprendre à jongler avec cette caractéristique. Il leur a fallu prendre en compte le fait qu’un “loop” est inévitable, et adapter les débuts et fins de morceaux en conséquence.

Pour pallier ce phénomène d’inadéquation entre l’audio et le visuel, une entreprise de Recherche & Développement sonore (la société “Dynatmos”) a lancé en 2004 une nouvelle technologie de sonorisation baptisée “Paysage sonore dynamique” ou “PSD”. Cette technique consiste à analyser en temps réel les comportements des joueurs, non joueurs et du déroulement scénique de l’univers diégétique, pour constituer une bande sonore adaptée au contenu visuel. Toutefois, hormis le succès d’estime lié au gain du premier prix de l’innovation au concours national Numérica 2004, cette technologie n’a pas rencontré de véritable réussite commerciale et n’est utilisée dans aucun jeu vidéo d’envergure.

L’environnement sonore du jeu vidéo doit donc séparer concrètement les notions de son réplicatifs et non réplicatifs. En plus du rapport spatial et temporel, présent dans le cinéma, le rapport diégétique du jeu vidéo est décuplé, de par l’idée même de virtuel. Ainsi, outre les classiques in et hors champ, la relation son / image est plus souvent marquée par une emphase (les coups d’une attaque, par exemple), et un point d’écoute qui nie la perspective acoustique. En effet, le plus souvent, les voix resteront au premier plan sonore, et les bruits de pas du protagoniste ne s’intensifient pas avec son arrivée au premier plan visuel.

Le propre du jeu vidéo, c’est-à-dire son interactivité, apporte ainsi son lot de contraintes techniques qui doivent conjuguer avec sa non linéarité et le fait que chaque session de jeu est, théoriquement, strictement différente de la précédente et de la suivante. Toutefois, ces composantes ont également été à l’origine de la valorisation du concept de “bruitage” ou de sons réplicatifs, qui sont devenus des gimmicks bien qu’ils fussent parfois créés à partir de “rien”, voire obtenus en mélangeant plusieurs sons qui a priori n’ont rien à voir avec le résultat recherché (cf. l’interview de Yoan Fanise, au sujet du cri du T-Rex dans King Kong).

Le bruit lié à la pièce de monnaie, dans la série des Mario Bros., est reconnaissable entre mille. Dans le même ordre d’idée, un amateur de jeu vidéo peut reconnaître une série rien qu’à l’écoute de l’un de ses “bruitages” non vocaux. En cinéma, c’est beaucoup plus rare, à part les thèmes de la bande originale (par exemple celles de James Bond ou Indiana Jones). Les sons réplicatifs ont donc une place prépondérante dans le jeu vidéo.

Des compositeurs qui sortent du lot

Les améliorations technologiques ont conduit à des possibilités de création toujours plus larges et variées. Ainsi, le “son” en tant qu’ensemble a nécessité une maîtrise des outils et des investissements toujours plus conséquents. L’évolution du sonore dans le jeu vidéo a donc permis de mettre en avant des compositeurs et concepteurs en tant que personnalités.

Ainsi, les amateurs du milieu connaissent Koji Kondo (compositeur des séries Mario, Zelda et beaucoup d’autres de Nintendo), Nobuo Uematsu (Final Fantasy notamment) ou encore Yasunori Mitsuda (beaucoup des grands jeux de rôle japonais, et notamment les séries Xenogears et Xenosaga). Cette reconnaissance est tout à fait analogue à celle que peut connaître par exemple John Williams, le compositeur des bandes originales de la saga Star Wars.

Il convient également de noter deux autres points importants.

Le premier est l’américanisation, voire l’occidentalisation d’un tel phénomène d’ “iconisation”. Ce ne sont plus seulement les Japonais qui sont reconnus en tant que compositeurs vedettes, mais également des grands noms du milieu sur les continents américain et européen. C’est le cas, par exemple, de Martin o’Donnell (Halo et Myst) ou Jérémy Soule (pour Oblivion et d’autres grands jeux d’aventure occidentaux). Ces compositeurs ont été, suite à leurs créations pour le jeu vidéo, contactés pour travailler sur des environnements sonores de films du septième art.

Le second point, éminemment intéressant, est l’attrait que représente la conception sonore du jeu vidéo parmi les compositeurs renommés de cinéma. Ainsi, des personnalités comme Danny Elfman (compositeur attitré, notamment, du célèbre réalisateur Tim Burton, et compositeur du thème de la série à grand succès Desperate Housewives) ont franchi le cap en intégrant l’équipe de conception de grosses productions du jeu vidéo. Ainsi, Elfman a imaginé avec talent et réalisme les thèmes principaux de Fable de Peter Molyneux sur Xbox.

L’on peut alors remarquer, une nouvelle fois, les rapports plus ou moins ténus qui lient les univers du jeu vidéo et du cinéma. Des passerelles se sont formées, dans tous les cas, avec l’amélioration technologique des chips sonores, sur le plan hardware du jeu vidéo.

La consécration qualitative et l’acmé de ce phénomène d’iconisation sont atteintes lorsque, comme depuis de nombreuses années au Japon, des orchestres symphoniques et philharmoniques reprennent des thèmes du jeu vidéo. Au cours de concerts entiers, ce sont les thèmes de Nintendo, de la saga Final Fantasy ou des medleys entiers de l’histoire du jeu qui sont repris et réaffirmés en tant que compositions au sens noble du terme.

Un peu plus récemment, c’est le milieu hip-hop / rap ou DJ du monde entier qui a pu imposer son style dans différentes productions. Ainsi, le monde des DJ japonais s’est fait remarquer à travers deux productions très estimées : Jet Set Radio et REZ. Nous reviendrons sur le second, plus longuement, un peu plus tard dans notre analyse. Jet Set Radio est parvenu à imaginer des univers “roller / tag” cohérents et, surtout, qui n’auraient pas pu revendiquer une telle homogénéité sans le concert du milieu hip-hop japonais.

En l’occurrence, l’environnement sonore des Jet Set Radio (et JSR Future) est tout aussi important que le visuel. Il n’y est pas capital (contrairement à ce que nous allons détailler dans la partie suivante) mais sa présence imprime une ambiance et une cohérence globale qui confère au jeu une bonne partie de son intérêt et qui n’aurait pu l’être autant sans le sonore.

L'exemple des "rythm games" en général et de REZ en particulier

Définition et exemples

La traduction la plus adaptée pour l’expression “rythm games” serait probablement celle de “jeux musicaux” ou “jeux de musique”. Dans tous les cas, il s’agit de jeux mettant en avant de manière prégnante l’utilisation du son (musicalité, bruitages) et notamment l’interaction entre l’aspect visuel et l’environnement sonore.

Historiquement, l’on considère Parappa the Rapper de Sony, sorti sur la première PlayStation en 1997, comme le premier “rythm game” de l’histoire du jeu. Dans ce titre d’un genre nouveau, le principe était de répéter en rythme une série de touches de la manette afin de faire chanter ou “rapper” le protagoniste à l’image d’une phrase musicale présentée juste avant. En haut de l’écran, deux barres présentant la combinaison de touches à respecter évoluaient en fonction de la progression. Pratiquement, hormis ces barres d’indications, le visuel n’avait aucun intérêt autre qu’esthétique et, ainsi, le joueur pouvait tout à fait ne pas voir les animations dédiées.

C’est la raison invoquée par Tetsuya Mizuguchi, un célèbre créateur de jeux vidéo (on lui doit des grands jeux comme Sega Rally, Shenmue ou encore Lumines) pour expliquer l’absence totale d’indications à l’écran de son premier jeu musical, Space Channel 5, fait suffisamment rare dans un jeu pour mériter d’être souligné. Ainsi, dans son titre à l’ambiance “retro-arty” sorti sur Dreamcast en 1999, ce sont uniquement les indications sonores que le joueur doit reproduire sur sa manette, en rythme. Par exemple : « Up Down Down Left Shoot Shoot Shoot » (“shoot” étant symbolisé comme un bouton d’action). Globalement, cela dit, le principe d’interaction restait dans le fond le même que dans Parappa the Rapper.

Par la suite, à partir de la fin des années 1990, d’autres genres de jeux musicaux se sont développés, sur une base plus ou moins commune. Le principe étant de presser à un instant T la touche X, symbolisé par la progression d’items vers une barre de timing (cf. visuel ci-dessous). Ce système de jeu a été décliné dans toutes sortes de titres, après l’instigateur Pop’n’Music, le plus célèbre étant probablement Dance Dance Revolution ou Dancing Stage, et leurs déclinaisons, dans lesquels le joueur doit danser pour presser des touches avec ses pieds. Par la suite, le système d’accessoires a été développé à son paroxysme avec l’apparition d’instruments de musique “vidéoludisés” (adaptés pour le jeu vidéo) n’ayant de limite que l’imagination de leurs concepteurs : guitare, tambour, platine de DJ, maracas, microphone, etc.

Il faut noter que ces jeux perdent absolument tout leur intérêt, et ne sont d’ailleurs pas jouables, sans l’accessoire qui leur est dédié. Cette interaction particulière est d’ailleurs si ténue que les composantes graphiques de ces titres sont la plupart du temps réduites pour focaliser l’attention du joueur sur la partie sonore. A ce titre, il est capital d’entendre la bande sonore du jeu pour parvenir à y jouer, obligation tout à fait caractéristique du genre puisque tous les autres jeux vidéos peuvent se jouer muets.

Le dernier point qui retranche tous les “rythm games” derrière cette catégorie est le fait immuable que la bande-sonore de ces titres est linéaire. En effet, contrairement à ce que nous expliquions précédemment, le jeu musical, malgré une réelle interactivité, impose le début et la fin d’un niveau de jeu. Le son est donc calqué sur cette durée pour réussir une parfaite adéquation audiovisuelle.

Mais un jeu a fait plus que lier son et image : REZ.

REZ, l’aboutissement

Pour les joueurs et/ou amateurs de son et d’interactivité qui ont pu comparer REZ au reste de la production de jeux musicaux, celui-ci est clairement considéré comme l’aboutissement du genre vers un niveau d’excellence rare.

A priori, pourtant, le système de jeu rappelle ce qui a été fait auparavant en termes de jeux musicaux. Pourtant, son fonctionnement en diffère très rapidement. Chacune des cinq parties du jeu est elle-même divisée en dix sous-niveaux. Ces dix parties correspondent à une montée progressive des pulsations et de l’accompagnement musical. Car c’est bien d’accompagnement qu’il s’agit. C’est en effet le joueur lui-même qui crée son propre environnement sonore en fonction des actions qu’il effectue à l’écran.

Sous ce K-Project dédié au travail de KANDINSKY, considéré le fondateur de l’art abstrait, se cache un titre pourtant profondément ancré dans le concret. Construit comme une allégorie du programme informatique, donc du jeu vidéo, REZ emporte son utilisateur dans une mise en abîme infernale de précision et d’intérêt. Derrière des faux airs de shoot’em up, le jeu se savoure comme un “trip” en soirée tech-trance, plongé dedans à bras le corps. Son esthétisme impeccable, sous des réminiscences de Tron, aspire l’utilisateur dans une expérience de ludisme et de conception sonore absolument ahurissante.

Alors qu’il héberge les créations de musiciens japonais bien inspirés (Ken ISHII en tête de file), REZ s’essaye à une définition de la matrice et de l’intelligence artificielle. Hors du réalisme le plus recherché par le jeu vidéo, il se paye le luxe d’aspirer le joueur dans son monde pour se délivrer lui-même de l’intelligence artificielle qu’est intrinsèquement son jeu. La métaphore est rare et riche, symbolisée par une maîtrise parfaite de la symbiose entre la question du joueur et la réponse du jeu : dans son esthétisme, dans son mouvement, dans sa musicalité. Il donne ainsi l’impression de participer à une œuvre d’art créationniste. Au cours du jeu, l’environnement sonore s’intensifie en ajoutant des instruments au fil des dix niveaux de chaque univers. La manette bat le “beat” par vibrations et l’avatar est toujours plus rythmé par les lourdes pulsations des basses. L’expérience prend toute sa dimension sur grand écran, bien au centre des six enceintes d’un home cinema.

REZ est sans aucun doute l’un des plus beaux exercices ludo-sensoriels, un trip gigantesque du début jusqu’à la fin sur la création, la destruction et l’évolution, le tout dans des tableaux d’une esthétique rare, mouvant au gré de nos actions et prenant le meilleur de la 3D pour lui donner un sens et une définition, pour se terminer en apothéose musicale rarement vue jusqu’alors. REZ se savoure, se vit de l’intérieur comme l’une des plus belles réussites du jeu vidéo en tant qu’elle dépasse ce concept. Sa valeur en est d’autant plus grande que l’expérience reste courte et unique, et qu’elle peut ainsi s’inscrire tranquillement dans le rang des jeux absolument cultes, et DU jeu musical comme cas d’école.

L’après REZ, des expérimentations

Après REZ, les créateurs ont pu sentir la liberté de ton qu’ils pouvaient se donner en terme d’expérimentations musicales. Ainsi, plusieurs autres jeux musicaux ont cherché eux aussi à sortir des sentiers battus et à s’essayer à des perspectives d’utilisation du son comme vecteur d’interactivité jamais vues jusqu’alors. C’est le cas notamment de trois titres que nous allons aborder ci-après.

PN03 est tout à fait particulier puisqu’à l’origine, il ne devait pas s’agir d’un “rythm game” mais d’un jeu d’action à la troisième personne, tout ce qu’il y avait de plus classique. Devant l’intensité graphique mêlée si fortement aux pulsations, les développeurs ont alors cherché à le transformer en véritable jeu musical aux allures de jeu d’action, dans lequel la protagoniste parvient à se défaire de ses opposants et à progresser tant qu’elle suit le rythme de la bande sonore. C’est son utilisation originale et décalée du son qui a valu à PN03 son beau petit succès d’estime.

Vib Ribbon, lui, a voulu aborder la question sous un angle assez différent. Tout à fait simpliste dans ses composantes graphiques (sur un fond noir se meuvent seuls des contours blancs façon “fil de fer”, il met l’accent le plus possible sur le rapport du joueur à sa musique. Car c’est bien de sa propre musique qu’il s’agit, puisque l’on doit glisser un CD audio dans la console pour que le jeu crée une sorte de “partition graphique interactive” que le joueur devra respecter. Le nombre de sessions de jeu est donc égal au nombre de chansons que le joueur insérera dans la machine. Au final, il s’agit d’un bête jeu de réflexes, quoi que très jeu musical sur le fond comme dans la forme, tant il réagit en communion avec une musicalité. Mojib Ribbon, sa suite plus ou moins directe, explore un concept cyclique plus ou moins éloigné et retranscrit à l’écran une traduction linguistique graphique (en japonais) de l’action qui s’y déroule. Il va sans dire que ce titre restera totalement hermétique à qui ne maîtrise pas la langue japonaise.

Electroplankton, enfin, se positionne sur un créneau beaucoup plus créatif, puisqu’il propose au joueur une douzaine de mini-jeux indépendants les uns des autres. Au sein de chacun d’entre eux, la création est laissée au libre arbitre de celui qui s’y essaiera. L’originalité notable du jeu est celle de chercher à dépasser les frontières du jeu vidéo grâce aux fonctionnalités de la plate-forme qui l’accueille, la Nintendo DS : c’est à dire le stylet couplé à un écran tactile, ainsi qu’un microphone intégré. Chaque phase de jeu propose d’utiliser ces outils à sa façon, pour imaginer et créer des samples, des variations et divers effets sonores. Electroplankton est un titre si évanescent qu’il n’y a aucune possibilité de sauvegarde et qu’à chaque redémarrage de la console, la cartouche redevient vierge et ouverte à toutes les créations que le joueur voudra bien expérimenter grâce à elle.

Interview de Yoan FANISE, directeur audio chez Ubisoft

Retranscription de l’entretien

Kanpai : Pouvez-vous résumer rapidement votre parcours (études, expériences professionnelles) avant d’arriver à Ubisoft ?

Yoan Fanise : Comme diplôme, j’ai obtenu un BTS Audiovisuel à Toulouse. Ensuite, j’ai réalisé des courts métrages, j’ai fait du montage son et du mixage pour France Television, Teletoon et TF1. Je suis chez Ubisoft depuis 2003.

Quel est votre poste 📮 et votre rôle à Ubisoft ?

Je suis aujourd’hui Directeur Audio du studio de Montpellier.

Quels sont les projets sur lesquels vous avez travaillé jusqu’à présent ?

J’ai été Sound Designer sur Beyond Good & Evil, Directeur Audio sur King Kong et sur Rayman Contre les Lapins Crétins sur Wii.

Comment se déroule la conception sonore d’un titre ?

En plusieurs phases : il y a d’abord la recherche artistique, puis le prototypage, la production, le debug (ND Kanpai! : les corrections), et enfin le mixage.

Quelle est la nature du lien entre les concepteurs sonores et les autres créateurs du projet ?

Ce lien est très fort à Montpellier, toutes les réunions créatives se font ensemble avec une personne de chaque métier. Chacun déborde largement de son seul domaine pour enrichir le contenu global du jeu.

Dans le jeu vidéo, que demande-t-on au son d’un point de vue narratif ?

Beaucoup et tant mieux ! Le son apporte les feedbacks de jeu, tels que “je suis touché” ou “je suis mort”, mais surtout les émotions par la musique et les voix. Les contraintes techniques ou de temps amènent aussi parfois le son à raconter plus de choses que par l’animation et le visuel. C’est un challenge permanent de concilier esthétique / émotions et feedbacks / gameplay d’un point de vue narratifs.

Quel est le jeu sur lequel vous avez le plus de difficulté / le plus de facilité pour concevoir l’environnement sonore ? Et pourquoi ?

Sur Rayman Contre les Lapins Crétins, la difficulté a été d’être drôle et déjanté en permanence, sans tomber dans un univers sonore cartoon. Un son peut être drôle pour quelqu’un et pas du tout pour une autre personne, il faut essayer plusieurs solutions avant de se fixer. Ça a été bizarrement beaucoup plus facile pour moi de créer des ambiances stressantes ou des sons de créatures pour King Kong.

En quoi la conception de son pour le média jeu vidéo diffère du média cinéma ?

Pour le jeu vidéo, la composante principale est la non linéarité, c’est à dire le paramètre du temps que l’on ne contrôle pas. Tout dépend de l’action du joueur. C’est à la fois la grosse difficulté, mais aussi le gros atout du jeu vidéo. Il faut techniquement trouver mille astuces pour obtenir le rendu voulu, chaque son est joué individuellement et le mixage se fait en temps réel, il y a donc des centaines de règles de programmation à introduire dans les déclenchements des sons, les baisses de volume, etc.

Comment fabriquez-vous vos sons ? Disposez-vous d’une sonothèque ou créez-vous tout vous-même ?

Les deux, les effets sonores sont le mélange de plusieurs sons issus de séances de bruitage et de banques. Un cri de T-Rex peut nécessiter le mélange de vingt-cinq sons pour trouver sa couleur et sa force.

Quelles sont les contraintes techniques données par les projets et leurs conséquences sur ce qu’il est possible de faire (par exemple : limitation en poids, en durée, etc.) ? Quelles sont les demandes explicites formulées par le chef de projet ou la production du jeu en terme de son ?

Les contraintes techniques sont encore très lourdes en termes de mémoire, donc cela affecte la longueur et la qualité des sons. Mais cela tend à disparaitre avec la Xbox 360 et la PlayStation 3. Le chef de projet (“Producer”) a plutôt des demandes de délais et de budget à tenir, la qualité n’est pas forcément sa priorité. Pour lui, le son doit avant tout remplir sa fonction de feedback au service du gameplay, et c’est normal. A nous de trouver le temps pour apporter aussi autre chose.

Comment se passe la gestion du synchronisme lors de la conception sonore ?

Les sons sont réalisés à partir de captures vidéo. Tel son est isolé pour correspondre à tel événement ou animation. Ensuite, il est intégré dans le moteur du jeu au même point de déclenchement si tout se passe bien.

Pour le projet King Kong en particulier, comment s’est passé le doublage (nouveaux enregistrements, reprise des voix utilisées dans le film) ? Quels ont été les liens entre le son “cinéma” et le son “jeu” en ce qui concerne les autres sons que la voix ?

L’équipe du film a été très impliquée dans le jeu. Pour les voix, les acteurs ont tous joué leur propre rôle dans le jeu. On a eu un grand nombre de séances d’enregistrement en Nouvelle Zélande ou à Los Angeles. C’est Jacques Exertier qui a écrit et dirigé les dialogues. Pour les effets sonores, le décalage de planning m’a obligé à créer des effets originaux à partir des recherches graphiques de Weta (ND Kanpai! : société de production du film King Kong) et les envoyer aux sound designers du film pour approbation. Au final, ils ont pu m’envoyer quelques sons temporaires de Kong et du T-Rex, que nous avons incorporés au mélange.

Réflexions et questionnements corollaires

Yoan Fanise nous donne l’exemple d’un poste de travail intéressant car il a pu travailler sur trois projets particulièrement indépendants les uns des autres en terme de contenu.

Beyond Good & Evil est un jeu d’action/aventure vaste, parfois aux accents épiques, mais qui reste à échelle humaine. King Kong a dû nécessiter un travail en étroite relations avec Weta, la société de production du film aux Etats-Unis. De plus, on imagine la précision du cahier des charges et les règles imposées en matière de conception sonore pour le jeu. Enfin, Rayman contre les Lapins Crétins a été imaginé et développé en interne, en une année seulement. Le jeu a des accents délirants et cartoon qui offrent a priori des possibilités de création plus larges.

Le travail d’un sound designer comme Yoan Fanise est donc varié, mais il doit respecter des contraintes techniques et réalistes. Le son doit abonder dans le sens du visuel, l’agrémenter mais également exister intrinsèquement. En tant que tel, il accompagne l’action qui se déroule à l’écran, il emphase des moments forts ou termine d’imposer une ambiance commencée graphiquement. Mais il peut et doit également donner des indications impossibles à transmettre par un élément visuel. C’est là toute la force et la difficulté de la musique comme du son réplicatif, car il doit avoir suffisamment de contenance pour exister de lui-même, sans absorber le reste des éléments que le joueur devra intégrer au cours d’une partie.

Le travail de conception sonore doit, ainsi, bien marquer une césure en la musique et le “bruitage”. Dans King Kong, par exemple, l’indicateur de santé restante n’est pas symbolisé par le remplissage d’une barre (comme dans l’écrasante majorité des jeux vidéo), mais par la respiration plus ou moins haletante de l’avatar du protagoniste. Cela contribue à renforcer l’immersion au sein de l’aventure et à appuyer l’idée selon laquelle l’environnement sonore est un indicateur tout aussi capital que les graphismes.

Conclusion

Le jeu vidéo est un média encore très adolescent. Apparu il y a une trentaine d’années, il s’est beaucoup cherché au cours de son histoire, et il se cherche encore aujourd’hui. Le positionnement du son face au jeu vidéo ne fait pas exception : après avoir longtemps suivi les évolutions technologiques des machines sans prendre de réel risque, les années 1990 ont vu le jeu vidéo oser aventurer sa musicalité dans des domaines plus expérimentaux. Ainsi, les jeux musicaux, ou rythm games, ont offert aux joueurs des expériences nouvelles mettant en relation visuel et sonore. C’était la première fois dans son histoire qu’un média interactif numérique ne reléguait pas le son au rang de simple “accompagnateur” du graphisme, mais proposait une réelle interaction et un jeu de questions-réponses de plus en plus intéressant. REZ constitue à ce sujet un point d’orgue que l’histoire retiendra comme le libérateur d’idées de jeux musicaux toujours plus audacieux.

Bien sûr, ces expérimentations restent rares et le succès public n’est pas toujours au rendez-vous. Du point de vue du concepteur sonore, le poste n’est pas toujours aussi respecté que chez Ubisoft Montpellier, et nombre d’éditeurs/producteurs ont tendance à vouloir résumer le son dans le jeu vidéo à une quantité d’espace de stockage qu’on aura bien voulu lui laisser. Les jeux musicaux s’imposeraient alors comme le véritable moteur visant à faire accepter le son comme essentiel au jeu, et non comme un simple “air” agrémentant discrètement l’aspect visuel.

Sources & bibliographie

Mis à jour le 16 septembre 2015 -