Slack a siphonné les données des utilisateurs pour entraîner des modèles d’IA sans demander la permission

Slack has been siphoning user data to train AI models without asking permission

Contexte : Pour les organisations, le spectre de l’utilisation de données internes pour entraîner des modèles d’IA soulève de sérieuses inquiétudes en matière de sécurité et de conformité. Mais Slack continue apparemment d’absorber des messages, des fichiers et des données pour entraîner ses fonctionnalités d’IA en coulisses. Pire encore, les utilisateurs étaient automatiquement inscrits à cet arrangement sans en être informés ni sans leur consentement.

La révélation, qui a explosé en ligne cette semaine après qu’un utilisateur l’ait dénoncé sur X/Twitter, a suscité beaucoup d’irritation que Slack n’ait pas précisé les choses dès le départ. Corey Quinn, un cadre du groupe Duckbill, a lancé l’agitation avec un message en colère demandant « Je suis désolé Slack, tu fais putain de QUOI avec les DM, les messages, les fichiers, etc. des utilisateurs ? »

Quinn faisait référence à un extrait des principes de confidentialité de Slack qui dit : « Pour développer des modèles d’IA/ML, nos systèmes analysent les données client (par exemple les messages, le contenu et les fichiers) soumises à Slack ainsi que d’autres informations (y compris les informations d’utilisation) telles que définies. dans notre politique de confidentialité et dans votre accord client.

Slack n’a pas tardé à répondre sous le même message, confirmant qu’il utilise effectivement le contenu client pour former certains outils d’IA dans l’application. Mais cela a tracé une limite : les données ne sont pas destinées à leur offre d’IA premium, qu’ils présentent comme complètement isolée des informations des utilisateurs.

Pourtant, la plupart ont été pris au dépourvu par les principales fonctionnalités d’IA de Slack, qui reposent sur une écoute ouverte des conversations et des fichiers privés de chacun. Plusieurs utilisateurs ont fait valoir qu’il aurait dû y avoir un avertissement bien visible, permettant aux utilisateurs de se désinscrire avant le début de toute collecte de données.

Le processus de désinscription lui-même est également fastidieux. Les individus ne peuvent pas se retirer eux-mêmes ; ils ont besoin d’un administrateur pour l’ensemble de l’organisation pour le demander en envoyant par e-mail une ligne d’objet très spécifique, que vous pouvez trouver dans l’article ci-dessus.

Certains gros frappeurs sont intervenus, multipliant les testeurs. Meredith Whittaker, présidente de l’application de messagerie privée Signal, a jeté un peu d’ombre en déclarant : « Nous ne collectons pas vos données en premier lieu, nous n’avons donc rien à exploiter pour l’IA ». Aie.

Cette réaction met en évidence les tensions croissantes autour de l’IA et de la confidentialité, alors que les entreprises se précipitent pour développer des logiciels plus intelligents.

Les incohérences dans les politiques de Slack n’aident pas non plus. Une section indique que l’entreprise ne peut pas accéder au contenu sous-jacent lors du développement de modèles d’IA. Une autre page commercialisant les outils d’IA générative haut de gamme de Slack indique : « Travaillez sans souci. Vos données sont vos données. Nous ne les utilisons pas pour former l’IA de Slack. Tout fonctionne sur l’infrastructure sécurisée de Slack, répondant aux mêmes normes de conformité que Slack lui-même.

Cependant, l’admission des utilisateurs à l’exploration de données dans le cadre des « principes de confidentialité » semble contredire ces déclarations.

Sur Threads, un ingénieur de Slack a tenté de clarifier les choses, affirmant que les règles de confidentialité avaient été « initialement écrites à propos du travail de recherche/recommandation que nous effectuions depuis des années avant Slack AI », admettant qu’elles avaient besoin d’une mise à jour.

Pourtant, le plus gros problème est évidemment l’approche d’adhésion par défaut. Bien que courant dans le domaine technologique, cela va à l’encontre des principes de confidentialité des données, qui consistent à donner aux utilisateurs un choix explicite sur la manière dont leurs informations sont utilisées.


Détente, découvrez l’évolution du nombre de smartphones vendus par marque au fil du temps dans la vidéo ci-dessous :

Youtube video