Alors que la montée en puissance de ChatGPT suscite des inquiétudes quant au plagiat, la société israélienne Copyleaks peut repérer des textes provenant d’outils d’IA. Il repère non seulement les textes du populaire ChatGPT, mais également les textes d’autres outils d’IA génératifs. L’entreprise montre maintenant sa capacité au milieu universitaire américain à aider à vérifier l’originalité des travaux des étudiants.

Un simple test révèle le caractère générique des textes émanant des hauts responsables des entreprises. Dans ce test, ChatGPT a été emballé pour rédiger un message provenant du PDG de Google avertissant le personnel des licenciements. Ce test a été effectué le jour même où Google a licencié 12 000 employés. La lettre de ChatGPT et la vraie lettre du PDG de Google, Sundar Pichai, ont été placées côte à côte. Des personnes aléatoires ont ensuite été invitées à choisir laquelle des lettres avait été écrite par un humain. Le résultat des tests montre que tous les participants choisissent le texte de l’IA comme celui provenant d’un humain. Cependant, un outil d’intelligence artificielle d’une startup israélienne a rapidement repéré la lettre de ChatGPT. Dans ses remarques, il a déclaré: « Écrit par AI avec une forte probabilité ». La startup israélienne Copyleaks a des bureaux à New York et un centre de R&D à Kiryat Shmona.

Alon Yamin, fondateur et PDG de l’entreprise, affirme qu’il n’est pas surpris que l’outil puisse repérer le texte de l’IA. Selon lui, ce nouvel outil dispose d’un système anti-copie qui l’aide à identifier les textes de l’IA. Par ailleurs, Yamin affirme que cet outil révèle déjà à quel point les gens comptent déjà sur les textes de l’IA.

Dans une interview au bureau de Copyleaks à New York, Yamin a déclaré à Calcalist

« Nous avons accès à beaucoup de contenus d’étudiants et de chercheurs… Depuis quelques semaines, nous avons commencé à activer la détection de l’IA sur le contenu, pour connaître le pourcentage d’étudiants qui utilisent l’intelligence artificielle pour écrire du contenu. Au cours des trois dernières semaines, plus de 10 % du contenu soumis au système, soit des centaines de milliers de documents, incluaient du texte créé par l’IA, et c’est à ce moment-là que ChatGPT vient de sortir. Les données continueront d’augmenter. Nous avons été très surpris par ce chiffre.

Quelques outils d’IA (ChatGPT en est le chef) peuvent produire des textes de haut niveau assez décents. ChatGPT, par exemple, s’est avéré suffisamment décent pour réussir des examens professionnels en médecine, en comptabilité et même certains cours avancés. Dans certains tests, ChatGPT obtient pas moins d’une note B et c’est une énorme préoccupation dans le monde universitaire. Cependant, pour Yamin, Copyleaks offre la solution à ce problème. Il estime également que l’outil s’occupera de cette crise.

Yamin ajoute

« Les étudiants ont besoin de savoir écrire du contenu, c’est une compétence importante qui ne disparaîtra pas du monde, mais il y a un processus de décryptage de comment travailler avec ces outils. Tout est très, très nouveau.

Selon Yamin, Copyleaks a été fondé il y a 8 ans par lui-même et Yehonatan Bitton, vice-président de la R&D. L’entreprise se concentre sur l’analyse de texte pour la technologie de l’IA. L’entreprise analyse simplement les textes de l’IA, connaissant sa source, son originalité, son ton et d’autres paramètres.

Nous étions préparés pour ChatGPT

Selon Yamin, la société a mis au point une technologie pour réduire le risque d’outils d’IA comme ChatGPT. Il affirme qu’ils ont vu l’émergence de ChatGPT il y a des mois avant qu’il n’atteigne le public. Copyleaks a vu le besoin de détecter les textes provenant de l’IA et c’est tout ce que fait sa technologie. Il ajoute que les humains pourraient ne jamais être en mesure de séparer les textes de l’IA des textes écrits par d’autres humains. Ainsi, seuls les outils d’IA peuvent identifier les textes d’IA. Il ajoute

« Il peut être difficile pour les gens de reconnaître la différence, mais en fin de compte, un système d’IA écrit d’une manière différente qui semble différente d’un point de vue statistique… En fin de compte, il s’agit du texte, même s’il est créé par AI, et nous travaillons constamment sur l’analyse du contenu du texte… »

Comment fonctionne l’outil de détection de texte Copyleaks AI ?

En expliquant le fonctionnement du système, Yamin dit qu’un coup à la porte peut sembler normal à de nombreuses personnes. Cependant, ceux qui connaissent le code Morse seront en mesure de dire la signification du coup. Il affirme que le système Copyleaks est un outil d’IA capable de faire la différence entre les textes IA et non IA. Étant donné que le système comprend l’origine des textes IA, il peut indiquer les textes qui ont une origine IA.

Depuis le lancement de ChatGPT, de nombreux programmes prétendent pouvoir détecter le texte écrit par celui-ci. OpenAI, le créateur du chatbot, a également l’intention de sortir son propre outil d’identification pour ses textes. Cependant, Copyleaks croit toujours qu’il a un avantage. Yamin a dit

« Nous ne sommes pas limités à une plate-forme ou à un modèle spécifique. Notre technologie peut reconnaître n’importe quel texte généré par l’IA, pas seulement ChatGPT. De plus, la capacité de reconnaître au niveau du paragraphe ou de la phrase est quelque chose d’unique pour nous, et cela affecte la qualité et la fiabilité des résultats. C’est pourquoi notre développement s’inscrit dans une plateforme complète. Nous pouvons également dire si le texte est original ou non. Nous sommes la seule plate-forme qui couvre tout, de la copie à la violation du droit d’auteur. De plus, nous sommes disponibles en cinq langues (anglais, français, français, portugais et allemand) et travaillons sur d’autres langues.

Malgré le déclin de l’industrie mondiale de la haute technologie, Alon Yamin affirme que l’entreprise a enregistré des performances décentes au cours des dernières années.