Protection PII en temps réel : Stopper les fuites de données IA avant qu'elles surviennent.
Mis à jour pour 2026.
En mars 2023, un ingénieur Samsung a collé du code source dans ChatGPT. Le code a quitté le contrôle de Samsung immédiatement. Aucun outil ne l'a intercepté à temps. Les contrôles de sécurité après coup ne peuvent pas arrêter les fuites de données IA. Cet événement l'a prouvé.
Les outils de détection vous indiquent ce qui s'est passé après le fait. Les vérifications de journaux, l'EDR et les journaux d'audit fonctionnent tous ainsi. Pour les fuites IA, après le fait, c'est trop tard. Les données ont déjà atteint le modèle IA.
L'ampleur du problème
Une étude Cyberhaven de 2025 a analysé l'usage de l'IA en entreprise. Les résultats étaient frappants.
- 11 % de tous les prompts ChatGPT contiennent des données privées ou sensibles.
- L'employé moyen utilise des outils IA 14 fois par jour.
- Les grands utilisateurs interagissent 30 à 50 fois par jour.
- À 11 %, cela représente 3 à 5 envois sensibles par employé par jour.
Dans une entreprise avec 500 grands utilisateurs, cela représente plus de 2 000 envois sensibles par jour. Chacun peut constituer une violation de l'article 83 du RGPD. Le risque n'est pas seulement juridique. La réputation et la confiance sont aussi en jeu.
Types courants de contenus sensibles dans les prompts IA :
- Noms et coordonnées des clients.
- Numéros de compte et relevés de paiement.
- Notes médicales du personnel de santé.
- Détails de dossiers juridiques.
- Notes d'évaluation des employés par les RH.
- Projections financières ou commerciales internes.
L'étude ne distingue pas le partage intentionnel du partage accidentel. Les deux créent le même risque juridique. Un employé qui oublie de supprimer un nom de client cause la même infraction que celui qui ignore la règle volontairement. L'intention ne change pas le résultat.
Pourquoi la détection est insuffisante
La surveillance réseau ne peut pas lire le trafic HTTPS sans blocage TLS. Le blocage TLS ajoute des coûts et soulève des préoccupations de confidentialité. Les navigateurs modernes le rejettent souvent.
Les agents EDR surveillent le presse-papiers et les frappes. Mais ils ont un délai. Lorsqu'un agent signale un motif, le prompt est peut-être déjà envoyé.
Les journaux d'audit des fournisseurs enregistrent ce qui a été partagé après le partage. Ils aident à la réponse aux incidents. Ils ne stoppent pas les fuites.
La formation du personnel est une politique, pas un contrôle. L'étude Cyberhaven montre que 11 % des prompts contiennent encore des données sensibles dans les entreprises avec des politiques claires. La formation ne stoppe pas les partages accidentels.
Bloquer les outils IA supprime les gains de productivité. Les employés utilisent alors des appareils ou comptes personnels. Cela place l'activité hors de tout contrôle.
Aucune de ces méthodes ne stoppe les contenus sensibles en temps réel.
Prévention au point d'entrée
La seule défense fiable est le masquage avant l'envoi. Un nom client remplacé par [PERSON_1] avant de quitter le navigateur n'est jamais vu par le modèle IA.
Voici comment fonctionne le masquage en ligne :
- Un employé saisit un e-mail client dans Claude ou ChatGPT.
- L'extension de navigateur détecte les données personnelles en temps réel.
- Les entités sont marquées avec des étiquettes de type : PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
- L'employé vérifie les éléments marqués.
- Un clic remplace toutes les entités par des jetons.
- Le prompt masqué est envoyé.
L'IA reçoit un prompt comme : « Client [PERSON_1] à [EMAIL_1] a le compte [ACCOUNT_1]. »
L'IA traite la demande sans voir de vrais noms ou numéros. L'employé connaît le client depuis le contexte.
Cette approche présente des avantages clairs :
- Les données personnelles restent hors des systèmes IA externes.
- Les données clients ne sont pas ajoutées aux ensembles d'entraînement IA.
- Les employés gardent accès aux outils IA. La productivité reste haute.
Elle ne stoppe pas le partage délibéré si un employé contourne l'outil. Les fichiers joints nécessitent un flux de travail distinct. Aucun contrôle n'est parfait. Mais le masquage en ligne supprime le groupe accidentel. Ce groupe représente la plupart des incidents. Le résultat est une forte réduction du risque sans changement de flux de travail quotidien.
Étude de cas : cabinet juridique
Les associés d'un cabinet utilisaient Claude pour rédiger des résumés de contrats. Leur méthode : copier des sections de contrat, les coller dans Claude, demander un résumé.
Avant le déploiement de l'extension Chrome — 6 premiers mois :
- 3 incidents de données clients trouvés lors de l'audit de conformité.
- Chaque incident : un nom client et un numéro de dossier apparaissaient dans le prompt.
- Tous les 3 étaient accidentels.
Après le déploiement de l'extension Chrome — 6 mois suivants :
- Zéro incident de données clients.
- Les associés recevaient des alertes en temps réel lors du collage de sections avec des noms de clients.
- Un clic remplaçait « Johnson Controls Dossier 2024-0347 » par « [PERSON_1] Dossier [REFERENCE_1]. »
- La méthode est restée la même.
L'associé gérant a déclaré : « Nos associés connaissaient la politique avant l'extension. L'extension a rendu la conformité le chemin le plus simple. »
Découvrez comment d'autres entreprises ont géré cela dans nos études de cas. Consultez les contrôles dans la vue d'ensemble sécurité.
Documentation RGPD pour les équipes conformité
Les entreprises utilisant le masquage IA basé sur navigateur doivent le documenter comme contrôle technique.
Registre des activités de traitement (ROPA) : Indiquez que les prompts IA passent par un masquage côté client avant d'atteindre les fournisseurs. Listez les types d'entités, la version du moteur et les journaux de déploiement comme preuve.
Contrats de traitement des données : Lorsqu'aucune donnée personnelle n'atteint le fournisseur IA, les obligations DPA se simplifient. Les données que vous gérez ne quittent jamais votre système.
Journaux d'audit : Les journaux de l'extension capturent le nombre d'entités par session, le taux de masquage et les types d'entités par volume. Ces données alimentent directement les rapports de conformité.
Consultez les exigences RGPD pour les outils IA dans notre guide de conformité légale et notre glossaire. Les questions fréquentes sont dans notre FAQ.
Conclusion
L'incident Samsung a montré que les fuites IA surviennent plus vite que tout contrôle après coup peut réagir. L'étude Cyberhaven le chiffre : 11 % des prompts, plusieurs fois par employé, chaque jour.
Le masquage en temps réel avant l'envoi traite la cause profonde. Lorsque les données personnelles n'atteignent jamais le modèle IA, il n'y a rien à détecter, consigner ou nettoyer. Les employés gardent leurs outils IA. Les entreprises maintiennent leur conformité.
La détection vous dit quand la prévention a échoué. Pour les fuites de données IA, le coût d'un échec — amendes, atteinte à la réputation, perte de confiance — justifie la prévention en premier lieu.
Explorez les tarifs pour votre entreprise. Lisez notre déclaration fondateur sur pourquoi la prévention est notre principe de conception central.
Sources
- Cyberhaven : AI Data Exposure Study 2025 — cyberhaven.com.
- Fuite de données Samsung-ChatGPT, mars 2023 — Bloomberg.
- RGPD articles 4 et 32 : Données personnelles et mesures techniques — gdpr-info.eu.