Dans un récent article sur X , OpenAI a reconnu avoir reçu les plaintes de certains utilisateurs concernant GPT-4. Les utilisateurs affirment que lorsqu’ils utilisent GPT-4 ou l’API ChatGPT récemment, la réponse est très lente et superficielle pendant les périodes de pointe. Dans certains cas, il refuse de répondre et dans d’autres, il y a une interruption dans la conversation s’il y a une série de questions. Selon The Independent, les problèmes mentionnés se manifestent généralement si l’utilisateur demande à GPT-4 d’entrer un morceau de code. Il peut fournir quelques informations, puis demander à l’utilisateur de compléter les parties restantes. Parfois, GPT-4 dit même aux personnes « Vous pouvez le faire vous-même ».

En réponse, OpenAI a déclaré qu’il avait reçu des commentaires selon lesquels GPT-4 était devenu paresseux. La société a expliqué que cela était dû au fait qu’elle n’avait pas mis à jour le modèle depuis le 11 novembre. Cela fait environ un mois. Cependant, OpenAI a affirmé que ne pas mettre à jour le modèle n’était pas intentionnel et qu’elle travaillait à le résoudre.

Dans un article de X, la société a déclaré :

« Nous avons entendu tous vos commentaires sur le fait que GPT-4 devient plus paresseux ! Nous n’avons pas mis à jour le modèle depuis le 11 novembre, et cela n’est certainement pas intentionnel. Le comportement du modèle peut être imprévisible, et nous cherchons à le corriger »

Bien que la société ait reconnu les faits ci-dessus, jusqu’à présent, OpenAI n’a pas résolu complètement ce problème. Outre le manque de mise à jour, aucune raison spécifique n’a été rendue publique. Nous ne pouvons pas rapporter de raisons spécifiques basées sur des spéculations et des rumeurs. Nous ne rapportons que des informations officielles d’OpenAI. La société n’a pas pris la parole, il n’y a donc aucune raison précise pour ce comportement. La société n’a pas non plus précisé quand elle allait publier une mise à jour pour le modèle.

Brève histoire de GPT-4

GPT-4 d’OpenAI, publié le 14 mars 2023, est un modèle multimodal à grande échelle qui a été salué pour ses avancées dans le traitement et la compréhension du langage. Ce modèle d’intelligence artificielle de pointe a été apprécié pour sa capacité à accepter des entrées d’images et de texte et à produire des sorties de texte. Il a montré des améliorations par rapport à ses prédécesseurs, en particulier dans les tâches nécessitant des capacités de raisonnement complexe, une longueur de contexte plus importante ou un traitement d’images. Cependant, il a été noté que GPT-4 présente des limites, telles qu’une fiabilité incomplète et une fenêtre de contexte limitée. Ces limitations peuvent contribuer à la perception de « paresse » dans certaines tâches.

Une évaluation basée sur les utilisateurs a été réalisée pour comparer GPT-3.5 et GPT-4, qui a révélé que 70% des utilisateurs préféraient les réponses de GPT-4. Cela indique une réception généralement positive des sorties de GPT-4. Cependant, il y a aussi des rapports selon lesquels GPT-4 ne performe pas bien dans certaines tâches, en particulier lorsqu’on lui demande de se reproduire lui-même. Cela pourrait être interprété comme de la « paresse » dans certains contextes spécifiques.

Une étude a été menée pour évaluer la cohérence des notes de feedback générées par GPT-4. Les résultats ont révélé une grande fiabilité inter-évaluateurs, suggérant que GPT-4 est capable de générer des notes cohérentes lors de répétitions avec une différenciation claire du style et du contenu. Bien que cela n’aborde pas directement la revendication de « paresse », cela fournit des informations sur la fiabilité du modèle pour générer un feedback cohérent.

Notre avis

OpenAI a confirmé avoir reçu des plaintes selon lesquelles GPT-4 est devenu paresseux. La société a déclaré que le modèle n’avait pas été mis à jour depuis un mois. Le GPT-4 d’OpenAI a démontré des avancées significatives dans le traitement et la compréhension du langage. Bien qu’il ait reçu des commentaires positifs dans de nombreux domaines, il y a également des rapports de limitations et de performances insuffisantes dans certaines tâches. La revendication de « paresse » peut découler de ces limitations.



