Revue Francophone d'Informatique et Musique
Revue francophone Informatique et Musique. La revue francophone Informatique et Musique publie des travaux théoriques et expérimentaux originaux, des rapports de recherches, des travaux de synthèse en relation avec les domaines liés à l’informatique musicale : aussi bien en sciences humaines qu’en sciences de l’ingénieur.

Co-créativité humains-machines
Une réflexion sur les indisciplines symboliques

Gérard Assayag

décembre 2020

DOI : https://dx.doi.org/10.56698/rfim.611

Résumés

Français

Résumé

Une pertinence musicale portée à la fois par des agents humains et artificiels qui coopèrent est-elle possible, en particulier dans une démarche qui dépasse les rigidités de genre et de disciplines ? L’auteur part de son expérience de concepteur de systèmes informatiques avancés pour la création musicale à l’Ircam pour tisser une réflexion sur la co-créativité comme phénomène émergent porteur de forme, en questionnant le regard que nous portons sur les conditions génétiques de la création ou sur la situation de cette dernière dans le champ des pratiques et des savoirs.

Index

Index de mots-clés : improvisation, co-créativité, intelligence artificielle, modélisation des savoirs et des pratiques, apprentissage.

Notes de la rédaction

Ce texte reprend la communication de l’auteur au symposium « Les sciences de la musique : de nouveaux défis dans une société en mutation » organisé le 18 janvier 2019 à la Maison des Sciences de l’Homme – Paris Nord. Une version adaptée et bilingue français-anglais est incluse dans le livre-disque Artisticiel – Expériences en improvisations cyber-humaines, par Bernard Lubat, Gérard Assayag et Marc Chemillier, à paraître chez Cristal Records dans la collection « Les Dialogiques d’Uzeste » en 2021.

Texte intégral

1Une pertinence musicale portée à la fois par des agents humains et artificiels qui coopèrent est-elle possible, en particulier dans une démarche qui dépasse les rigidités de genre et de disciplines ? Une telle démarche serait alors « indisciplinaire », permettant une pensée et une pratique aux confins des arts et des sciences, sans que ce soit une fusion indistincte (la musique est la musique, la science est la science), ni une simple distribution utilitaire des tâches entre l’ingénieur et l’artiste (comme cela se pratique dans l’industrie musicale pour la mise au point de nouvelles technologies de production ou de recommandation). Les musiques improvisées issues des recherches et collaborations artistiques menées par l’auteur depuis de nombreuses années à l’Ircam résultent d’une pleine expérience d’indiscipline collective, engageant l’« improvisation libre » comme domaine d’expression d’une musicalité partagée entre des humains et des « machines » (au sens abstrait, des machineries pour ainsi dire), dans un contexte où l’un apprend de l’autre, l’un progresse avec l’autre, l’un défie l’autre. Même si la revendication d’une « indiscipline » propre à la liberté de l’improvisation pourrait sembler contradictoire avec le raisonnement abstrait tel qu’il peut se déployer dans un article théorique, nous demandons ici que le lecteur veuille bien accepter la présente réflexion comme une improvisation plutôt libre (de la pensée), une tentative de se donner quelques outils pour appréhender ce qui a surgi de musique, de bruit quelquefois et d’idées, pendant ces années d’expérimentation.

2Selon Eva Carpigo et ses collègues, qui ont édité en 2016 un numéro spécial de la Revue des sciences sociales consacré à cette notion, l’indiscipline dans la recherche est basée sur plusieurs vertus heuristiques (propres à favoriser la découverte rapide, intuitive, pratique de nouvelles idées), dont : une approche « transdisciplinaire qui fond les connaissances et les méthodes en un savoir capable de saisir la complexité du réel sans la diviser1 » et une réflexivité qui oblige à un retour sur son expérience personnelle dans le contexte du terrain de recherche (ce qui implique pour nous une forme d’apprentissage). C’est cette idée d’indiscipline que nous voulons mettre au défi, en la confrontant aux pratiques artistiques et technologiques contemporaines qui mettent en action un bouleversement des modalités créatives induit par l’entrée en jeu des « machines ». La question de la créativité devient alors centrale pour élucider la question.

3Margaret Boden, une spécialiste de la psychologie cognitive, qui a réfléchi notamment à l’intelligence artificielle, a poursuivi une réflexion originale sur la notion de créativité dans son ouvrage Dimensions of Creativity2. Selon ses propres termes, la créativité est la capacité de trouver des idées ou des artefacts nouveaux, surprenants et précieux. La créativité peut se produire de trois manières principales, qui correspondent à trois types de surprise : elle peut être combinatoire, exploratoire ou transformante.

La créativité combinatoire produit des combinaisons inédites d’éléments connus, comme il est courant en poésie (« Beau comme la rencontre fortuite sur une table de dissection d’une machine à coudre et d’un parapluie3 ») ou dans l’analogie scientifique : un algorithme peut s’inspirer d’une structure biologique.

4La créativité exploratoire visite des espaces conceptuels préconfigurés, des champs théoriques ou esthétiques constituant des styles structurés de pensée, au sein desquels l’excursion intellectuelle produit idées et artefacts nouveaux, mais sans changer l’espace. Le système tonal en musique en est un exemple : ainsi, toutes les sonates sont différentes, mais elles constituent des cheminements de tensions et de détentes dans un même espace harmonique (les accords classiques formés dans les différentes tonalités) constitué de polarités fortes.

5La créativité transformante bouleverse radicalement l’espace mental servant de cadre de référence, en donnant naissance à des pensées qui étaient littéralement inconcevables auparavant. C’est par exemple la « rupture épistémologique » chère à Bachelard dans les sciences, ou bien le « cas Schoenberg » (selon l’expression d’Esteban Buch) qui se libère de toute forme de hiérarchie tonale en musique. Bernard Lubat mentionne d’ailleurs le fait que, par sa curieuse combinaison de bêtise laborieuse et d’inspiration fulgurante, la machine semble, selon son expression, le « libérer », peut-être de certaines habitudes ou certains automatismes.

6En d’autres termes : les atlas à l’intérieur de nos têtes peuvent être parcourus ou même modifiés par la pensée créative, afin que l’impensé surgisse, voire que l’impensable trouve son chemin. Quels liens existe-t-il alors dans les champs artistiques et scientifiques, entre l’indiscipline comme engagement décloisonné dans la recherche et la créativité selon ses diverses modalités de surgissement ?

7La question se pose en particulier dans la situation, de plus en plus fréquente en informatique musicale, où une partie de ce qui relevait exclusivement de la créativité humaine est déléguée à la machine. C’est le cas avec l’IA (intelligence artificielle) musicale, qui permet de construire des agents créatifs autonomes interagissant librement avec des musiciens sur scène, comme c’est le cas du logiciel OMax conçu par l’auteur avec son équipe à l’Ircam. La générativité algorithmique et la composition dynamique de relations temporelles et spatiales complexes se combinent, pour fournir des compagnons de jeu assez facétieux pour soutenir et relancer constamment l’intérêt de musiciens qui en ont pourtant vu bien d’autres, comme Bernard Lubat.

8Robert Rowe, professeur à l’université de New York, utilise une expression plus mesurée que celle d’IA et qui selon nous convient mieux pour désigner l’ensemble des dispositifs qui visent à conférer une forme d’intelligence musicale à la machine : le titre de son ouvrage de référence est Machine Musicianship4, ce que le traducteur automatique DeepL (lui-même un produit de l’IA) tente de traduire par « machinerie musicale », voire par « musique mécanique ». Nous pourrions tenter « musicalité artificielle », dans le sens d’un savoir-faire musical de la machine acquis par la programmation de modèles formels (issus des mathématiques musicales) ou bien de l’apprentissage automatique par exposition aux corpus musicaux ou confrontation à l’expérience live.

À quelle forme de délégation de tâches de la part des humains, de créativité autonome, voire d’indiscipline, peuvent prétendre des organismes artificiels dotés d’une forme de musicalité par la vertu de nos algorithmes ? Ne risquons-nous pas l’aporie (une contradiction insoluble) en évoquant la notion de créativité chez les machines ?

9Nous avons, dans nos recherches récentes, souhaité déplacer la question et les problèmes sérieux qu’elle soulève en proposant la notion de « co-créativité » : créativité distribuée entre humains et machines installés dans des situations intenses d’interaction symbolique. Qu’entendons-nous alors exactement par interaction symbolique ? Les nouveaux systèmes interactifs orientés vers l’improvisation reposent sur l’évaluation du passé, l’écoute du contexte sonore immédiat, la prédiction et la mise à jour de stratégies d’anticipation et de décision à différentes échelles temporelles, depuis le temps réactif jusqu’au temps composé, selon des micro- et macro-scénarios qui structurent le futur. Les qualités d’intentionnalité, de pertinence, d’adéquation, de visée, de découverte et de style, sont alors partagées entre les agents humains et artificiels engagés dans des processus d’apprentissage croisés, car les humains apprennent et progressent tout autant que les machines dans ces interactions inédites : les musiciens qui utilisent les systèmes informatiques issus des recherches de l’auteur confirment le plus souvent qu’ils ne joueraient pas de la même façon sans la machine et la temporalité des sessions de jeu montre l’évolution technique ou thématique des agents humains aussi bien qu’artificiels, ce qui suggère fortement l’idée d’une coévolution. Nous qualifions « d’interaction symbolique », dans le domaine musical, cette situation particulière d’interdépendance adaptative, par opposition aux interactions électroniques/numériques classiques principalement basées sur le traitement sonore, en ce qu’elle engage tous les niveaux de représentation musicale, du signal au symbolique (les structures), en incluant potentiellement les structures cognitives réelles et simulées.

Ces systèmes symboliques, dans lesquels la « musicalité » est répartie entre agents humains et artificiels, accordent selon nous à ces derniers une possibilité de co-créativité qui aurait les caractéristiques suivantes.

Elle relève de l’émergence de propositions sonores concomitantes tissées entre humains et machines, qui ne peuvent simplement se réduire à la somme de leurs composantes individuelles. Les surprises qui en résultent entraînent des modifications d’état des joueurs selon des dynamiques complexes qui peuvent engendrer des passages calmes et statiques, des évolutions continues, ou des ruptures violentes. Un tel phénomène d’émergence est une caractéristique des systèmes dynamiques étudiés par les sciences de la complexité.
Elle relève de mécanismes d’apprentissage génératif à la fois croisé et réflexif, puisque le signal d’entrée au temps t pour chaque agent combine la production des autres agents et la sienne propre, avec la mémoire des productions antérieures. Cette association crée la possibilité de mécanismes de renforcement (d’éléments, de motifs, de phrases) dans les mémoires artificielles et naturelles, en fonction des intentions implicites prêtées par chaque agent aux autres partenaires, qui sont la base de l’apprentissage croisé.
Compte tenu des deux précédents points, il apparaît clairement qu’aucun des agents ne jouerait de la même façon en situation solo. La co-créativité n’est ainsi pas la simple somme de créativités individuelles, mais l’irruption de nouvelles formes irréductibles, qui ne rentrent pas dans le moule des conventions (une autre façon, peut-être, d’évoquer l’indiscipline).

10L’exemple de l’interaction symbolique et de la co-créativité entre agents humains et machiniques, un aspect de l’informatique musicale que Marc Chemillier et l’auteur ont exploré inlassablement avec Bernard Lubat et d’autres artistes majeurs, est très intéressant du point de vue disciplinaire. D’abord, au sein des sciences du calcul, il convoque le traitement de signal, l’apprentissage automatique, les architectures d’interaction, la formalisation de structures temporelles statiques et dynamiques à plusieurs échelles, les systèmes d’agents autonomes et leur adaptation temporelle dans l’interaction. Toutefois, cela ne suffit pas à prendre la mesure du problème : les sciences de la perception et de la cognition sont indispensables pour en appréhender les aspects liés à l’écoute, à la mémoire, à l’agentivité (la capacité d’action dans le contexte), au jugement et à l’intentionnalité. Les sciences de la musique permettent d’évaluer les questions de stylistique, de champ esthétique, de stratégie musicale dans l’engagement individuel et collectif, mais elles pilotent aussi les heuristiques informatiques chargées de la découverte de structures musicales, ainsi que celles qui s’occupent de la composition ; en d’autres termes, l’écriture du son, du temps, de l’espace et de la forme. Le champ s’étend encore à l’organologie lorsqu’il s’agit d’embarquer ces processus au cœur de l’instrument, que celui-ci soit électroniqu, ou bien qu’il s’agisse d’un instrument acoustique augmenté, comme les instruments à acoustique active, que nous aimerions désormais équiper eux aussi d’une musicalité artificielle : c’est un aspect des projets futurs liés à ces outils, qui leur ajoutera une « corporéité » indispensable.

11Enfin, la dimension prééminente de l’improvisation dans ces systèmes et leur nature collective ne permettent pas d’ignorer l’important savoir accumulé par les études anthropologiques et linguistiques, voire éthologiques, relatives à la production spontanée d’échanges médiatisés par la parole ou d’autres systèmes de signes, que cette dernière soit rituelle, politique, économique ou érotique. Le caractère pluri- et interdisciplinaire des travaux à l’œuvre dans l’interaction symbolique et la co-créativité musicale impliquant des systèmes technologiques est ainsi majeur. Cependant, la démarche de création artistique en conditionne les buts et engage aussi à une vision indisciplinaire, une vision qui, selon nous, articule la pratique artistique à la démarche théorique et au développement technologique, qui intègre aussi les cycles de co-apprentissages complexes entre humains et machines, susceptibles sous certaines circonstances liées à l’improvisation de faire éclater les fameuses « frontières » qui délimitent d’ordinaire les activités artistiques et scientifiques. Revenant au triptyque évoqué au début (transdisciplinarité, frontières, réflexivité), nous sommes cependant sceptiques quant au contenu qu’Edgar Morin confère à ce terme de transdisciplinarité, soit une fusion des savoirs et des méthodes pour « saisir la complexité du réel sans la diviser », une forme de connaissance dont l’unité reproduirait en quelque sorte celle du réel. Nous sommes en effet réticents devant l’anti-cartésianisme de cette conception, en un moment de l’histoire où la vogue dangereuse de toutes sortes d’irrationalités nous enjoint à nous méfier des rationalités molles. Nous gardons finalement, bien que dans une démarche résolument artistique (ou de recherche arts-sciences), la volonté d’objectivation, la démarche analytique et la clarté méthodologique : un certain cartésianisme visant à diviser les problèmes complexes en parties solubles par le calcul et la logique. Ceci vient probablement du fait qu’en définitive, nous sommes des programmeurs d’algorithmes, donc dans une forme de pensée dite « performative », dont l’énoncé même accomplit des actions sensibles dans le réel… à condition d’identifier des problèmes calculables et d’être formulé avec une très grande rigueur (c’est ce que fait un programme informatique). Dans cette contradiction apparente se tient toute la tension de l’aventure inédite initiée entre Bernard Lubat, Marc Chemillier et l’auteur en 2004 autour du programme OMax qui continue aujourd’hui, comme un défi lancé dans la création de situations limites (les situations cyber-humaines, où la créativité devient distribuée), testant les frontières disciplinaires et explorant de nouvelles formes de réflexivité croisée entre l’homme et la machine.

12La question de l’évaluation devient alors critique. Cette dernière constitue une difficulté récurrente dans le champ des recherches art/sciences, car elle est beaucoup plus difficile à établir sur le versant génératif des algorithmes que sur leur versant analytique. Il existe tout de même dans la modélisation statistique de séquences musicales des mesures informationnelles qui établissent la parenté statistique d’une production artificielle avec la source théorique qu’elle est censée simuler (en résumé, mesurer objectivement le fait que la production artificielle « ressemble » à ce qu’aurait pu produire un humain). D’autres ont mis en œuvre avec succès des « tests de Turing » (évaluation subjective du fait que la machine peut « tromper » l’humain en situation aveugle) pour démontrer le réalisme illusoire de ces productions. En réalité, tout cela n’a que peu de valeur : il est extrêmement facile de tromper l’attention d’un auditeur avec des algorithmes malins ou de produire des séquences dotées des bonnes propriétés statistiques, sans pour autant qu’elles aient le moindre intérêt en termes artistiques, ni qu’elles éveillent la moindre curiosité de la part des humains. Tout ce que cela montre est que certains aspects systématiques ou probabilistes de la musique se laissent aisément dompter. Cependant, ils ne garantissent en aucune manière l’émergence d’un comportement créatif, surtout s’agissant du troisième type de créativité dans notre typologie (la transformante). En effet, ces comportements créatifs relèvent souvent d’une singularité enchâssée dans un contexte temporel, alors que tous les modèles évoqués traquent au contraire la généralité d’un système abstrait ou la distribution générale de probabilité des phénomènes sous-jacents.

13La raison pour laquelle nous mettons alors en avant dans cette réflexion la situation de co-créativité est, dans cette dernière, ce quelque chose de particulier qui se noue dans le jeu avec les frontières et la réflexivité. Bien souvent, le chercheur se met en jeu comme musicien, entrant dans la double boucle d’apprentissage avec la machine. Cette dernière acquiert elle-même un certain niveau de réflexivité, comme nous l’avons vu, puisqu’elle peut théoriquement analyser ses propres productions dans leur rencontre avec celles des musiciens. Par exemple, le logiciel SoMax, un des descendants d’OMax, constitue une mémoire du flux d’événements musicaux qu’il capte en temps réel, mais il tient aussi trace de qu’il génère lui-même et c’est la résolution de ces deux flux « passés » simultanés de la performance en un futur conjoint possible qui lui permet à chaque pas de décider comment avancer. Bien évidemment, le musicien humain écoute la machine et procède à ses propres prédictions, les deux systèmes ajustant ainsi en permanence leurs prévisions en fonction des confirmations ou des surprises qui se produisent. De telles rencontres entre les intentionnalités réciproques (lorsque les prédictions fonctionnent et se correspondent), si elles se répètent fréquemment, sont comme des signaux implicites de jugement, d’accord, donc de renforcement (j’ai tendance à maintenir ce qui a provoqué une réponse attendue, ou à reproduire plus tard ce qui a provoqué une surprise jouissive). Ces signaux remplacent une évaluation humaine explicite, souvent difficile à mettre en place, en révélant de manière indirecte, par la seule dynamique du jeu musical, l’intérêt suscité par les productions des machines. Une notion de pertinence musicale partagée s’établit alors, laissant entrevoir ce que pourrait être la « musicalité répartie » que nous mentionnions au début de ce texte.

14Nous complétons alors la proposition indisciplinaire initiale, par la notion d’une double réflexivité inhérente à la situation de jeu « cyber-humaine » (c’est-à-dire celle où s’établit une continuité d’analyse et de production entre humains et machines, comme les technologies dites « cyber-physique » établissent une continuité entre monde numérique et monde physique). Le chercheur/musicien et la machine s’engagent dans une situation croisée d’écoute et d’apprentissage accéléré intégrant dans une double rétroaction le jugement de l’autre. Ce dernier est exprimé non pas comme un métalangage (une annotation), mais dans le langage même et le temps même du médium artistique. En effet, plutôt que d’indiquer « j’aime, je n’aime pas », « ceci est une tension », « ceci est triste », « ceci est une modulation harmonique », comme on le fait sur les corpus musicaux qui servent à entraîner les systèmes d’apprentissage automatique dans les recherches en MIR (music information retrieval, fouille de données musicales), de sorte à donner ensuite à la machine la capacité de reconnaître toute seule les caractéristiques d’un morceau, c’est par leurs réactions musicales dans le temps de l’improvisation que les agents artificiels et humains expriment implicitement des jugements et des commentaires sur l’autre. Nous prétendons alors (et c’est encore une forme d’indiscipline) que ces mécanismes implicites, correctement observés et exploités, constituent une source de connaissance qui permettra à terme d’enrichir considérablement les algorithmes et l’IA musicale et qu’ils évitent, de plus, l’écueil des esthétiques normatives (j’annote en véhiculant les clichés d’une culture majoritaire, quelquefois réactionnaire, toujours conventionnelle), écueil habituel des recherches et des applications industrielles en MIR (recommandation dans les systèmes de vente en ligne, etc.).

15Abraham Moles, un visionnaire de l’informatique musicale (comme d’autres domaines en sociologie et en esthétique), l’établissait déjà dans son ouvrage pionnier Art et ordinateur (Casterman, Paris, 1971). Pour Moles, les formes n’existent pas en elles-mêmes, elles ne sont que perçues : ce sont des produits du récepteur appliqués sur le message ; d’où il apparaît que les formes sont aussi le résultat d’un apprentissage continu (et créatif) du récepteur. Par ailleurs, Moles disait qu’un générateur artificiel créatif devrait aussi comporter dans son modèle son propre critique, apte à produire un jugement d’intérêt. Cette idée prophétique a été actualisée récemment dans le champ de l’intelligence artificielle avec les « réseaux adversariaux » (GAN : generative adversarial networks, réseaux antagonistes génératifs), une forme d’apprentissage profond (« deep learning ») dans lequel une machine productrice (le générateur) est confrontée à une machine « juge », qui essaie de déterminer si la production est naturelle ou artificielle. La machine productive se renforce progressivement puisque son critère d’apprentissage est précisément le fait de tromper le juge. Or, des recherches récentes sur les GAN ont indiqué que la crédibilité du générateur (comme sujet potentiellement créatif) pourrait être mieux évaluée par le juge si ce dernier était en mesure de mesurer, en plus de son réalisme, le niveau de conformisme, ou d’originalité dudit générateur. Il s’agirait alors de favoriser la déviation maximale des objets produits par le générateur par rapport aux styles connus pour, en quelque sorte, lui apprendre à être créatif ! C’est peut-être une piste qui permettra d’éviter de tomber dans le piège de la reproduction perpétuelle du banal inhérente à l’IA et aux masses de données et de stimuler la musicalité artificielle. Cependant, s’il y a, certes, présence d’un critique virtuel dans la vision de Moles, la question des critères d’évaluation reste relativement inexplorée chez lui, et c’est ce que nous contournons par la double réflexivité des dispositifs co-créatifs, en suscitant par les excursions riches et quelquefois inattendues de ces derniers un comportement collectif émergent et éminemment indiscipliné.

Notes

1 Eva Carpigo et al., « Introduction », Revue des sciences sociales, n^o 56, 2016, p. 8-11.

2 Margaret Boden, Dimensions of Creativity, Cambridge, MIT Press, 1994.

3 Lautréamont, Les Chants de Maldoror, Chant VI, strophe 1.

4 Robert Rowe, Machine Musicianship, Cambridge, MIT Press, 2001.

Citation

Gérard Assayag, «Co-créativité humains-machines», Revue Francophone d'Informatique et Musique [En ligne], Numéros, n° 7-8 - Culture du code, mis à jour le : 04/01/2021, URL : https://revues.mshparisnord.fr:443/rfim/index.php?id=611.

Auteur

Quelques mots à propos de : Gérard Assayag

Directeur de recherche Ircam, laboratoire Sciences et technologies de la musique et du son (STMS), Ircam, CNRS, Sorbonne Université, ministère de la Culture et de la communication, 1 place Igor-Stravinsky 75004 Paris ; gerard.assayag@ircam.fr, https://orcid.org/0000-0002-4427-7373

« Article précédent

Retour au sommaire »

Co-créativité humains-machines
Une réflexion sur les indisciplines symboliques

Résumés

Résumé

Index

Notes de la rédaction

Texte intégral

Notes

Citation

Auteur

Quelques mots à propos de : Gérard Assayag

Index

ISSN: 2778-4479

Numéros

Présentation

Appels à contributions

Appels clos

Informations

Partenaires

Syndication

Co-créativité humains-machinesUne réflexion sur les indisciplines symboliques

Résumés

Résumé

Index

Notes de la rédaction

Texte intégral

Notes

Citation

Auteur

Quelques mots à propos de : Gérard Assayag

Index

ISSN: 2778-4479

Numéros

Présentation

Appels à contributions

Appels clos

Informations

Partenaires

Syndication

Co-créativité humains-machines
Une réflexion sur les indisciplines symboliques