La promesse (et les pièges) des PNJ alimentés par l’IA dans les jeux vidéo

The promise (and pitfalls) of NPCs powered by AI in video games

Les modèles de langage et l’IA générative soulèvent des controverses chez les développeurs de jeux vidéo. Bien que certaines communautés y voient un potentiel pour enrichir les dialogues des personnages grâce à des mods, la technologie a encore des limites, notamment en termes de coût et de convivialité.

Un sujet brûlant : Les grands modèles de langage et l’IA générative sont des thèmes que la plupart des développeurs de jeux vidéo préfèrent éviter. Aussi tentant soit-il d’utiliser ces outils pour remplacer le travail humain, le retour négatif est trop intense pour la plupart des entreprises, sans même considérer que la technologie de l’IA n’est pas encore au point pour produire de manière cohérente un contenu de qualité sans assistance humaine.

Cependant, de tels obstacles n’existent pas pour le grand public. Les personnes expérimentent déjà la technologie de l’IA dans les jeux existants. Les communautés de modding ont commencé à utiliser des plateformes comme ChatGPT pour donner une voix aux PNJ et aux compagnons dans des jeux comme Skyrim et Stardew Valley.

Un moddeur de Stardew Valley qui se fait appeler DualityOfSoul a créé un mod utilisant l’API ChatGPT d’OpenAI pour étendre les arbres de conversation des nombreux PNJ du jeu. Habituellement, les joueurs peuvent seulement parler aux PNJ quelques fois par jour, mais le « AI Valley » de Duality sur Nexus Mods permet aux personnages contrôlés par ordinateur de tenir de longues conversations informelles.

La promesse et les pieges des PNJ alimentes par lIA

Un autre moddeur, Tylermaister, a développé un mod pour Skyrim en utilisant la même API pour créer un compagnon capable de converser de manière cohérente sur presque tous les sujets liés au jeu. Le compagnon, Herika, comprend au moins les bases de la carte. Ainsi, si le joueur lui demande où se trouve Riften, elle peut décrire la localisation de la région.

Dans une démo du projet, un joueur demande à Herika où se trouve Dragon’s Reach, et non seulement elle a répondu correctement en mentionnant la région, mais elle a également compris qu’ils n’étaient qu’à quelques pas de la forteresse.

Bien que ces mods représentent une application séduisante de la technologie LLM avec le potentiel d’enrichir et d’étendre le dialogue d’un jeu, ils présentent plusieurs inconvénients. Tout d’abord, le coût. Utiliser l’API ChatGPT coûte de l’argent. The Verge note qu’il ne s’agit que de fractions de centime par ligne de dialogue, ce qui n’est pas beaucoup, mais cela peut s’accumuler, surtout que cela augmente par utilisateur. De plus, les joueurs s’attendent à ce que les mods soient gratuits, ce qui constitue un obstacle majeur.

Un autre aspect est que la voix de ChatGPT ne va pas impressionner grand monde. La livraison monotone devient rapidement lassante, même avec de légers ajustements de vitesse pour simuler l’excitation du PNJ.

Dans la vidéo ci-dessous, vous pouvez entendre le rythme de la parole d’Herika s’accélérer et le ton grimper comme un disque vinyle lorsque le joueur dit quelque chose d’excitant. Cette réaction émotionnelle est impressionnante car le modèle peut reconnaître la situation de manière dynamique, mais cela reste loin de créer une réponse convaincante.

Nous avons constaté qu’OpenAI avec son GPT-4o impressionnant est capable de conversations plus réalistes avec une voix presque humaine. Cependant, sa personnalité est aussi générique que celle de ChatGPT 3.0, mais avec l’enthousiasme monté à son maximum.

Ces modèles sont entraînés pour être polis, politiquement corrects et amicaux envers les utilisateurs. Cette caractéristique n’est pas représentative de la façon dont les humains s’expriment, en particulier dans les jeux vidéo où l’on peut rencontrer un PNJ qui ne vous apprécie pas ou qui est en colère.

Enfin, les dialogues avec des PNJ pilotés par chatbot peuvent rapidement déraper. Tout comme lorsque vous utilisez la version web de ChatGPT, l’API est tout aussi sujette aux hallucinations et peut produire des dialogues hors de propos ou disséminer des informations incorrectes sur l’univers du jeu.

Bien qu’il soit séduisant de penser à un avenir où l’on pourrait discuter avec un PNJ comme avec un ami, il reste encore beaucoup de chemin à faire. Ajoutez à cela le fait que les LLM sont imprévisibles et peuvent briser le récit prévu d’un jeu, et il est peu probable que nous voyions l’implémentation généralisée de chatbots dans les jeux vidéo de sitôt.

Youtube video