By · Last updated 2026-06-05

Retour au blogSécurité de l'IA

Prévention vs. Détection : Pourquoi l'anonymisation...

Lorsqu'un employé saisit un nom de client dans ChatGPT, les données quittent le contrôle organisationnel en temps réel.

June 5, 20267 min de lecture
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Protection PII en temps réel : Stopper les fuites de données IA avant qu'elles surviennent.

Mis à jour pour 2026.

En mars 2023, un ingénieur Samsung a collé du code source dans ChatGPT. Le code a quitté le contrôle de Samsung immédiatement. Aucun outil ne l'a intercepté à temps. Les contrôles de sécurité après coup ne peuvent pas arrêter les fuites de données IA. Cet événement l'a prouvé.

Les outils de détection vous indiquent ce qui s'est passé après le fait. Les vérifications de journaux, l'EDR et les journaux d'audit fonctionnent tous ainsi. Pour les fuites IA, après le fait, c'est trop tard. Les données ont déjà atteint le modèle IA.

L'ampleur du problème

Une étude Cyberhaven de 2025 a analysé l'usage de l'IA en entreprise. Les résultats étaient frappants.

  • 11 % de tous les prompts ChatGPT contiennent des données privées ou sensibles.
  • L'employé moyen utilise des outils IA 14 fois par jour.
  • Les grands utilisateurs interagissent 30 à 50 fois par jour.
  • À 11 %, cela représente 3 à 5 envois sensibles par employé par jour.

Dans une entreprise avec 500 grands utilisateurs, cela représente plus de 2 000 envois sensibles par jour. Chacun peut constituer une violation de l'article 83 du RGPD. Le risque n'est pas seulement juridique. La réputation et la confiance sont aussi en jeu.

Types courants de contenus sensibles dans les prompts IA :

  • Noms et coordonnées des clients.
  • Numéros de compte et relevés de paiement.
  • Notes médicales du personnel de santé.
  • Détails de dossiers juridiques.
  • Notes d'évaluation des employés par les RH.
  • Projections financières ou commerciales internes.

L'étude ne distingue pas le partage intentionnel du partage accidentel. Les deux créent le même risque juridique. Un employé qui oublie de supprimer un nom de client cause la même infraction que celui qui ignore la règle volontairement. L'intention ne change pas le résultat.

Pourquoi la détection est insuffisante

La surveillance réseau ne peut pas lire le trafic HTTPS sans blocage TLS. Le blocage TLS ajoute des coûts et soulève des préoccupations de confidentialité. Les navigateurs modernes le rejettent souvent.

Les agents EDR surveillent le presse-papiers et les frappes. Mais ils ont un délai. Lorsqu'un agent signale un motif, le prompt est peut-être déjà envoyé.

Les journaux d'audit des fournisseurs enregistrent ce qui a été partagé après le partage. Ils aident à la réponse aux incidents. Ils ne stoppent pas les fuites.

La formation du personnel est une politique, pas un contrôle. L'étude Cyberhaven montre que 11 % des prompts contiennent encore des données sensibles dans les entreprises avec des politiques claires. La formation ne stoppe pas les partages accidentels.

Bloquer les outils IA supprime les gains de productivité. Les employés utilisent alors des appareils ou comptes personnels. Cela place l'activité hors de tout contrôle.

Aucune de ces méthodes ne stoppe les contenus sensibles en temps réel.

Prévention au point d'entrée

La seule défense fiable est le masquage avant l'envoi. Un nom client remplacé par [PERSON_1] avant de quitter le navigateur n'est jamais vu par le modèle IA.

Voici comment fonctionne le masquage en ligne :

  1. Un employé saisit un e-mail client dans Claude ou ChatGPT.
  2. L'extension de navigateur détecte les données personnelles en temps réel.
  3. Les entités sont marquées avec des étiquettes de type : PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
  4. L'employé vérifie les éléments marqués.
  5. Un clic remplace toutes les entités par des jetons.
  6. Le prompt masqué est envoyé.

L'IA reçoit un prompt comme : « Client [PERSON_1] à [EMAIL_1] a le compte [ACCOUNT_1]. »

L'IA traite la demande sans voir de vrais noms ou numéros. L'employé connaît le client depuis le contexte.

Cette approche présente des avantages clairs :

  • Les données personnelles restent hors des systèmes IA externes.
  • Les données clients ne sont pas ajoutées aux ensembles d'entraînement IA.
  • Les employés gardent accès aux outils IA. La productivité reste haute.

Elle ne stoppe pas le partage délibéré si un employé contourne l'outil. Les fichiers joints nécessitent un flux de travail distinct. Aucun contrôle n'est parfait. Mais le masquage en ligne supprime le groupe accidentel. Ce groupe représente la plupart des incidents. Le résultat est une forte réduction du risque sans changement de flux de travail quotidien.

Étude de cas : cabinet juridique

Les associés d'un cabinet utilisaient Claude pour rédiger des résumés de contrats. Leur méthode : copier des sections de contrat, les coller dans Claude, demander un résumé.

Avant le déploiement de l'extension Chrome — 6 premiers mois :

  • 3 incidents de données clients trouvés lors de l'audit de conformité.
  • Chaque incident : un nom client et un numéro de dossier apparaissaient dans le prompt.
  • Tous les 3 étaient accidentels.

Après le déploiement de l'extension Chrome — 6 mois suivants :

  • Zéro incident de données clients.
  • Les associés recevaient des alertes en temps réel lors du collage de sections avec des noms de clients.
  • Un clic remplaçait « Johnson Controls Dossier 2024-0347 » par « [PERSON_1] Dossier [REFERENCE_1]. »
  • La méthode est restée la même.

L'associé gérant a déclaré : « Nos associés connaissaient la politique avant l'extension. L'extension a rendu la conformité le chemin le plus simple. »

Découvrez comment d'autres entreprises ont géré cela dans nos études de cas. Consultez les contrôles dans la vue d'ensemble sécurité.

Documentation RGPD pour les équipes conformité

Les entreprises utilisant le masquage IA basé sur navigateur doivent le documenter comme contrôle technique.

Registre des activités de traitement (ROPA) : Indiquez que les prompts IA passent par un masquage côté client avant d'atteindre les fournisseurs. Listez les types d'entités, la version du moteur et les journaux de déploiement comme preuve.

Contrats de traitement des données : Lorsqu'aucune donnée personnelle n'atteint le fournisseur IA, les obligations DPA se simplifient. Les données que vous gérez ne quittent jamais votre système.

Journaux d'audit : Les journaux de l'extension capturent le nombre d'entités par session, le taux de masquage et les types d'entités par volume. Ces données alimentent directement les rapports de conformité.

Consultez les exigences RGPD pour les outils IA dans notre guide de conformité légale et notre glossaire. Les questions fréquentes sont dans notre FAQ.

Conclusion

L'incident Samsung a montré que les fuites IA surviennent plus vite que tout contrôle après coup peut réagir. L'étude Cyberhaven le chiffre : 11 % des prompts, plusieurs fois par employé, chaque jour.

Le masquage en temps réel avant l'envoi traite la cause profonde. Lorsque les données personnelles n'atteignent jamais le modèle IA, il n'y a rien à détecter, consigner ou nettoyer. Les employés gardent leurs outils IA. Les entreprises maintiennent leur conformité.

La détection vous dit quand la prévention a échoué. Pour les fuites de données IA, le coût d'un échec — amendes, atteinte à la réputation, perte de confiance — justifie la prévention en premier lieu.

Explorez les tarifs pour votre entreprise. Lisez notre déclaration fondateur sur pourquoi la prévention est notre principe de conception central.

Sources

  • Cyberhaven : AI Data Exposure Study 2025 — cyberhaven.com.
  • Fuite de données Samsung-ChatGPT, mars 2023 — Bloomberg.
  • RGPD articles 4 et 32 : Données personnelles et mesures techniques — gdpr-info.eu.

Prêt à protéger vos données ?

Commencez à anonymiser les PII avec plus de 285 types d'entités dans 48 langues.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.