Le département de la Justice des États-Unis a publié plus de 3,5 millions de pages de documents sur l’affaire Epstein, suscitant la création de solutions numériques comme EpsteIN. Cet outil open-source, disponible sur GitHub, permet de relier ces documents aux contacts LinkedIn de l’utilisateur, redéfinissant ainsi la compréhension des relations professionnelles.

À la fin de janvier 2026, le Département de la Justice des États-Unis a rendu publics plus de 3,5 millions de pages de documents concernant l’enquête sur Jeffrey Epstein et sa vaste réseau d’abus sexuels. Face à cette masse de données – comprenant des documents judiciaires, des emails, des images et divers contenus multimédias – des projets numériques ont émergé, dont EpsteIN. Ce nom est un jeu de mots combinant Epstein et LinkedIn, et désigne un script open-source disponible sur GitHub, permettant d’analyser les documents juridiquement avec la propre liste de contacts professionnels.
Concrètement, il offre la possibilité de vérifier combien de fois les noms sur LinkedIn apparaissent dans les fichiers de l’enquête. Cette initiative, née en marge de la communauté tech, souligne l’évolution de la transparence des données et comment elle influence notre vision du pouvoir, des relations et de la réputation.

EPSTEIN | Le script open-source, publié sur GitHub
Fonctionnement d’EpsteIN
EpsteIN permet aux utilisateurs d’importer les données de leurs contacts LinkedIn pour les croiser avec le texte des documents judiciaires en ligne. Le résultat est un fichier HTML lisible qui présente, pour chaque contact trouvé dans les documents :
- Nom, entreprise et rôle professionnel
- Nombre d’occurrences de la personne dans les fichiers
- Extraits de texte provenant des fichiers originaux
- Liens directs vers les PDF du Département de la Justice.
L’analyse se fait sur l’ordinateur de l’utilisateur. EpsteIN utilise des outils de programmation courants comme Python pour confronter les noms des contacts LinkedIn au texte des documents judiciaires, sans transmettre de données à des plateformes externes ou à des serveurs tiers. Cela indique que la liste des connexions professionnelles et les résultats des recherches restent sur le dispositif personnel, minimisant ainsi les risques en matière de vie privée.
Les développeurs soulignent que les résultats ne doivent pas être interprétés comme des preuves de comportements illégaux: la simple mention d’un nom dans un document ne prouve pas un engagement dans des activités criminelles. De plus, les noms très communs peuvent générer des faux positifs.
Outils d’exploration de l’immense archive sur Epstein
EpsteIN n’est pas un projet isolé. Plusieurs initiatives visent à faciliter l’accès et la consultation des documents publiés. Par exemple, WikiEpstein est un archive en ligne indépendante qui organise et catalogue les différents lots de documents publiés par les autorités américaines concernant l’affaire Epstein. Ce site ne conserve pas directement les fichiers originaux, mais offre des liens vérifiés vers les sources officielles, une chronologie de publication et des résumés indiquant la date de divulgation, l’entité et le volume des données.
De plus, des archives OCR publiques ont vu le jour, permettant de rechercher des centaines de milliers de documents par nom, mot-clé ou sujet, et la page Jmail. Cette interface ressemblant à la boîte de réception de Gmail contient uniquement les emails extraits des fichiers d’Epstein.
Cette initiative est portée par Luke Igel et Riley Walz, qui ont utilisé Google Gemini AI, un système d’intelligence artificielle capable d’effectuer le OCR (Reconnaissance Optique de Caractères). Cette technologie convertit les PDF numérisés – souvent de faible qualité et difficiles à lire – en texte. Le résultat est un archive consultable comme n’importe quelle boîte mail.
Transparence et vie privée
Des initiatives comme EpsteIN visent à transformer un vaste ensemble de données en informations facilement consultables pour les citoyens, journalistes et chercheurs. La communauté scientifique et juridique insiste toutefois sur l’importance d’interpréter les résultats avec prudence: une mention dans les documents n’indique pas automatiquement une responsabilité légale ou morale.
Ces outils ouvrent une nouvelle ère de l’analyse documentaire, où la technologie ouverte et les grands archives publiques se confrontent à des questions sensibles d’éthique, de vie privée et de justice.