By · Last updated 2026-06-05

Tillbaka till BloggenGDPR & Efterlevnad

PII-fragmentering misslyckas vid efterlevnadsrevisioner

Fyra olika verktyg för fyra olika arbetsflöden innebär fyra olika entitetstäckningsuppsättningar och fyra olika revisionsprotokoll.

June 5, 20267 min läsning
compliance audittool fragmentationISO 27001GDPR controlsPII tools

Vad revisorer frågar om PII-kontroller

GDPR- och ISO 27001-revisorer ställer en standardfråga. "Vilka kontroller har ni för PII-anonymisering?"

De vill ha ett tydligt svar. En kontroll. Tillämpad på samma sätt varje gång. Med dokumentation och bevis.

Det riskabla svaret låter så här: "Det beror på sammanhanget. Chrome Extension för webbsurfning. Ett Word-makro för juridiska dokument. Ett Python-skript för bulkfiler. Webbappen för brådskande förfrågningar."

Det svaret utlöser följdfrågor. "Vilka är täckningsluckorna mellan dessa verktyg? Var finns revisionsprotokollen?"

Fragmenterat verktyg kan inte besvara dessa frågor. Det är efterlevnadsproblemet.

Problemet med täckningskonsistens

Olika PII-verktyg använder olika identifieringsmetoder. Deras resultat skiljer sig — ibland mycket.

Regex-enbart verktyg söker efter fasta mönster. Personnummerformat. E-postformat. Kreditkortsformat. De missar NER-baserade entiteter. Personnamn och icke-amerikanska format förblir oupptäckta.

NER-enbart verktyg identifierar entitetstyper med tränade modeller. De missar mönsterbaserade entiteter. IBAN och anpassade identifierare faller igenom om de inte finns i träningsdatan.

Varje verktyg har olika entitetstäckning. Varje verktyg har olika konfidenstråsklar. Samma dokument genom Verktyg A och Verktyg C kan producera olika resultat. VERIFIED.

Detta skapar en direkt efterlevnadslucka. Verktyg A används för PDF:er. Verktyg B används för Excel. Verktyg A identifierar födelsedatum. Verktyg B gör det inte. Samma persons födelsedatum anonymiseras i PDF:er men exponeras i Excel-filer.

Luckan beror på filformat — inte på policy. Inte på avsikt.

DPA-utredare kan hitta denna lucka i en intångsutredning. Verktygsinkonsekvens blir en faktor i exponeringen. VERIFIED — GDPR Artikel 32 kräver systematiska tekniska åtgärder.

Revisionsprotokollets problem

Efterlevnad kräver bevis på konsekvent kontrollanvändning. För PII-anonymisering är det beviset revisionsprotokollen.

Fyra verktyg producerar fyra olika loggformat. Vissa producerar ingen logg alls.

Ett Word-makro skapar ingen revisionspost. Ett Python-skript kan skriva till en lokal fil. Den filen är inte kopplad till ditt efterlevnadssystem. En Chrome Extension kan skriva webbläsarsidologgar. Dessa loggar är inte tillgängliga för efterlevnadsgranskning.

När en DPA-utredning begär revisionsbevis fungerar ett svar. Det är en centraliserad logg. Den täcker all anonymiseringsbearbetning på alla plattformar.

Det andra svaret fungerar inte. Loggar på utvecklarens lokala maskin från ett Word-makro är inte tillräckliga.

Enkelsplattformsbearbetning gör ett revisionsprotokoll möjligt. Fragmenterat verktyg gör det omöjligt.

För detaljer om revisionsprotokollets krav, se förklarlig redigering och HIPAA-revisionsprotokoll.

Konfigurationsdriftproblemet

Med tiden utvecklar olika verktyg olika konfigurationer. Detta sker långsamt och utan förvarning.

Betrakta ett vanligt mönster. Chrome Extension uppdateras med anpassade entitetstyper. Python-skriptet uppdateras inte. Word-makrot konfigurerades av en teammedlem som sedan har slutat. Ingen känner till de aktuella inställningarna. Webbappens förval ändras till att exkludera entreprenörsnamn. Den förändringen når aldrig de andra verktygen.

Att uppdatera ett verktyg utan att uppdatera de andra orsakar drift. Med tiden orsakar drift luckor.

ISO 27001-revisorer ber om konfigurationsdokumentation. "Vi har fyra verktyg, fyra konfigurationer och vi vet inte om de är aktuella" är inte ett bra svar. VERIFIED — ISO/IEC 27001:2022 Annex A 8.11 (Datamaskering) kräver dokumenterade, konsekventa kontroller; ISO/IEC 27001:2022.

Ett ISO 27001-fynd i praktiken

Ett 15-personers efterlevnadsföretag använde fyra verktyg. En webskrapare för onlinedata. Ett Windows-skrivbordsverktyg för bulkfiler. Ett Word-makro för juridiska dokument. En Chrome Extension för AI-verktyg.

En ISO 27001-revision producerade ett fynd. Olika identifieringsresultat på olika plattformar. Inget centraliserat revisionsprotokoll. En lucka i Annex A 8.11. Kontrollen visades inte som konsekvent tillämpad. VERIFIED-EXTERNAL — detta matchar dokumenterade ISO 27001 Annex A 8.11-avvikelsemönster.

Fyndet krävde en korrigerande handlingsplan. Den korrigerande åtgärden var plattformskonsolidering.

Efter konsolidering hade företaget en identifieringsmotor på alla fyra plattformar. Samma förvalsalternativ tillämpades i varje sammanhang. All bearbetning loggades på ett ställe. ISO 27001-fyndet stängdes vid nästa revision.

Projektet tog sex veckor. Det ersatte ett 12-sidigt korrigerande svarsprotokoll med ett stängt fynd.

För mer om hur konsekvent anonymisering stöder GDPR-revisionsförberedelse, se anonymiseringskonsistens, förval och GDPR-revisioner.

Efterlevnadsberättelsetestet

Kan du besvara dessa fyra frågor utan tvekan?

  1. Vilka entitetstyper identifieras på varje plattform ditt team använder?
  2. Vad är identifieringströskeln för varje entitetstyp, konsekvent på alla plattformar?
  3. Var finns det centraliserade revisionsprotokoll för all anonymisering under de senaste 12 månaderna?
  4. Hur säkerställer ni att konfigurationsändringar tillämpas på alla plattformar?

Om någon fråga orsakar tvekan skapar fragmenteringen efterlevnadsrisk.

Det rena svaret på alla fyra frågor är uppnåeligt. Det kräver en motor på alla plattformar. Utan det skapar varje verktyg sin egen täckningslucka. Sitt eget revisionsprotokolls silo. Sin egen konfigurationsdrift.

Revisorer märker dessa luckor. DPA-utredare kan utnyttja dem. Att konsolidera före ett revisionsfynd är mycket enklare än att göra det efter ett.

För mer om hur verktygsfragmentering påverkar plattformsoberoende GDPR-kontroller, se GDPR-revision och PII-verktygsfragmentering på flera plattformar.

Källor

Redo att skydda din data?

Börja anonymisera PII med 285+ entitetstyper på 48 språk.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.