By · Last updated 2026-06-05

Retour au blogGDPR & Conformité

Le Coût Caché de la Fragmentation des Outils PII...

Quatre outils différents pour quatre flux de travail différents signifient quatre ensembles de couverture d'entités différents et quatre pistes de...

June 5, 20267 min de lecture
compliance audittool fragmentationISO 27001GDPR controlsPII tools

Ce que demandent les auditeurs sur les controles PII

RGPD et ISO 27001 — leur audit commence par une question standard. « Quels controles techniques avez-vous pour anonymiser les PII ? »

Une reponse claire est attendue. Un seul controle. Applique partout, toujours pareil. Avec preuves et documentation.

La reponse a risque ressemble a ceci : « Ca depend du contexte. Extension Chrome pour le web. Macro Word pour les contrats. Script Python pour les fichiers. Web app pour urgences. »

Cette reponse declenche d'autres questions. « Quels sont les ecarts de couverture ? Ou est la piste d'audit ? »

Des outils fragmentes ne peuvent pas repondre. C'est le probleme de conformite.

Le probleme de coherence de detection

Chaque outil PII utilise sa propre methode. Leurs resultats divergent — parfois beaucoup.

Outils regex seuls : ils cherchent des formats fixes. NSS. E-mail. Carte. Ils ratent toutes les entites NER. Noms de personnes et formats non americains passent inaperçus.

Outils NER seuls : ils utilisent des modeles entraines. Mais ils ratent les entites a base de patterns. IBAN, codes personnalises — pas de detection si absents du corpus.

Chaque outil couvre des entites differentes. Chaque outil a des seuils differents. Un meme document donne des resultats differents selon l'outil utilise. VERIFIED.

Voila la faille concrete. Outil A traite les PDF. Outil B traite Excel. Outil A detecte des dates de naissance. Outil B ne detecte pas. La meme donnee est anonymisee dans un PDF mais exposee dans un tableur.

Cette faille depend du format — pas de la politique. Pas de l'intention.

Une autorite de protection peut trouver cette faille en enquete. L'incoherence entre outils devient un facteur d'exposition. VERIFIED — Article 32 RGPD impose des mesures techniques systematiques.

Le probleme de piste d'audit

Toute conformite exige une preuve d'application coherente. Pour une anonymisation PII, cette preuve est la piste d'audit.

Quatre outils produisent quatre formats de journaux. Certains ne produisent rien du tout.

Une macro Word ne genere aucun enregistrement. Un script Python peut ecrire dans un fichier local — ce fichier n'est pas integre a votre systeme. Une extension Chrome peut ecrire dans le navigateur. Ces journaux ne sont pas accessibles pour une revue de conformite.

Quand une autorite demande des preuves d'audit, une reponse convient. C'est un journal centralise, couvrant tous les traitements sur toutes vos plateformes.

L'autre reponse ne convient pas. Un journal stocke sur la machine d'un developpeur n'est pas suffisant.

Traiter sur une seule plateforme permet d'avoir une piste unique. Des outils fragmentes rendent cela impossible.

Pour plus de detail sur ce sujet : Redaction explicable et pistes d'audit HIPAA.

Le probleme de derive de configuration

Avec le temps, chaque outil developpe sa propre configuration. C'est lent, sans avertissement.

Un exemple frequent. Chrome est mis a jour avec des types d'entites specifiques. Python ne l'est pas. La macro Word a ete configuree par un collegue parti. Personne ne connait les reglages actuels. La web app change pour exclure des noms de prestataires. Ce changement n'atteint jamais les autres outils.

Mettre a jour un seul outil sans les autres cree une derive. La derive genere des failles.

Un auditeur ISO 27001 demande la documentation de configuration. « Nous avons quatre outils, quatre configs, et nous ne savons pas s'ils sont a jour » n'est pas une bonne reponse. VERIFIED — ISO/IEC 27001:2022 Annexe A 8.11 impose des controles documentes et coherents ; ISO/IEC 27001:2022.

Un constat ISO 27001 concret

Un cabinet de conformite de quinze personnes utilisait quatre outils. Scraper web pour donnees en ligne. Bureau Windows pour fichiers en masse. Macro Word pour contrats. Extension Chrome pour outils IA.

Un audit ISO 27001 a produit un constat. Detection differente selon la plateforme. Pas de piste d'audit centralisee. Faille dans Annexe A 8.11. Controle non demontre comme coherent. VERIFIED-EXTERNAL — cela correspond aux non-conformites ISO 27001 documentees pour Annexe A 8.11.

Ce constat a requis un plan correctif. La correction : consolidation sur une seule plateforme.

Apres consolidation : un moteur de detection unique sur toutes plateformes. Memes presets partout. Journalisation centralisee. Constat ferme lors du prochain audit.

Duree du projet : six semaines. Resultat : une reponse corrective de douze pages remplacee par un constat clos.

Pour en savoir plus sur cette coherence et vos audits : Coherence anonymisation, presets et audits RGPD.

Le test de votre recit de conformite

Pouvez-vous repondre a ces quatre questions sans hesiter ?

  1. Quels types d'entites sont detectes sur chaque plateforme de votre equipe ?
  2. Quel est le seuil de detection, coherent sur toutes vos plateformes ?
  3. Ou est la piste d'audit centralisee pour toute anonymisation des douze derniers mois ?
  4. Comment garantissez-vous que vos changements de config s'appliquent sur toutes plateformes ?

Une hesitation sur l'une de ces questions signale un risque reel.

Une reponse nette est possible. Cela exige un moteur unique sur toutes vos plateformes. Sans cela, chaque outil cree sa propre faille. Son propre silo. Sa propre derive.

Vos auditeurs remarquent ces failles. Une autorite peut s'en emparer. Consolider avant un constat d'audit est bien plus facile qu'apres.

Pour aller plus loin sur ce sujet : Audit RGPD et fragmentation PII multiplateformes.

Sources

Prêt à protéger vos données ?

Commencez à anonymiser les PII avec plus de 285 types d'entités dans 48 langues.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.