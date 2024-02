Nous avons recherché dans les textes présentés à Sanremo 2024 les phrases évocatrices ou les métaphores pouvant être traduites en images. Pour les réaliser, nous avons utilisé à la fois Midjourney et Bing.

Si dix personnes écoutent une chanson, la chanson aura dix significations différentes. Il suffit de quelques mots pour créer des panoramas émotionnels ou raconter des histoires. Chacune est différente, car nous comblons les vides sémantiques avec quelque chose de personnel. C’est pourquoi il peut sembler étrange de demander à l’intelligence artificielle (IA) d’imaginer graphiquement une chanson, et pourtant nous l’avons fait. Les cobayes de l’expérience ont été les chansons présentées à Sanremo 2024. Nous avons sélectionné des couplets ou des parties de refrain de cinq chansons présentées au festival, nous sommes partis de là, puis l’IA a fait le reste (avec quelques indications).

Pour réaliser les images, nous avons utilisé à la fois Midjourney et Bing. Nous avons d’abord essayé d’utiliser le texte d’origine comme indication. Ça n’a pas fonctionné. Les logiciels ont produit des images délirantes, donc nous avons aidé l’intelligence artificielle. À partir des couplets et des refrains choisis, nous avons reformulé les parties du texte. Mais, même dans ce cas, l’IA a été hésitante. Par exemple, elle a généré une « tuta gold » avec cinq manches, puis l’a transformée en une robe de soirée avec des paillettes dorées. Changeons de stratégie. Décrivons de manière précise les images évoquées par les textes, ajoutons des proportions, des cadrages et des détails techniques, et voilà que les logiciels commencent à produire quelque chose d’intéressant.

Comment nous avons réalisé les images

Les chansons ont été choisies de manière instrumentale, nous avons recherché à l’intérieur des textes des phrases évocatrices ou des métaphores pouvant être traduites en images. Ça n’a pas fonctionné pour toutes. Par exemple, dans le cas de « Casa mia » de Ghali (qui n’apparaît pas dans la galerie), ni Midjourney ni Bing n’ont réussi à générer une image intéressante capable de raconter la chanson. Nous avons demandé de créer une photo d’une maison suspendue sur un vaisseau spatial, en partant du texte lui-même, et malgré les essais, elle a produit une série de bâtiments qui semblaient dessinés par Frank Lloyd Wright.

Les cinq téléphones portables sur la « tuta gold » nous ont aussi donné du fil à retordre. Surtout pour le chiffre cinq, l’intelligence artificielle a du mal avec les chiffres et les mots, donc nous avons dû réessayer plusieurs fois. D’innombrables smartphones sont apparus avant de pouvoir trouver les cinq téléphones mentionnés dans la chanson.

Les astuces pour utiliser l’intelligence artificielle

La règle d’or est de connaître le jargon photographique et d’apprendre à parler le langage de l’intelligence artificielle (IA). Un jargon fait de répétitions, de phrases simples, de mots clés et de termes techniques. Nous avons essayé plusieurs fois en changeant la structure de la phrase. La meilleure façon est d’enchaîner les mots clés simples les uns après les autres. La ponctuation est fondamentale, oublier une virgule peut produire quelque chose de complètement différent.

Non seulement ça. Les proportions influencent la qualité, la meilleure à utiliser est 6:9, tout comme en photographie, la lumière est tout, douce, cinématographique, naturelle, d’un studio, lumière intense, diffuse ou avec un filtre polarisé. Il est important de fournir le plus d’indications possible pour obtenir un résultat de qualité. Pour produire de bonnes images, il faut aussi être persistant. Une indication peut générer d’excellents résultats une fois, et médiocres la fois suivante. Il y a aussi la variable chance dans le monde de l’IA. Ça ne dépend pas toujours des mots que nous écrivons, c’est pourquoi il est bon de tester plusieurs fois, car chaque résultat est unique. Il est également possible de générer des variations de la même image si elle nous plaît mais a quelques détails déplacés.