By · Last updated 2026-05-31

Tornar al BlogGDPR i Compliment

Mes enlla dels SSN: Anonimitzar els IDs interns de la vostra organitzacio

Totes les organitzacions tenen identificadors interns - IDs d'empleats, numeros de compte, IDs de comanda - que son personalment identificables en context pero que les eines PIE estandard no detecten perque mai no els van dir que busquessin.

May 31, 20267 min llegit
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

Mes enlla dels SSN: Anonimitzar els IDs interns de la vostra organitzacio

La vostra eina GDPR elimina les adreces de correu electronic. Elimina els numeros de telefon. Elimina els noms. Executeu les exportacions de suport a traves d'ella. Despres compartiu la sortida amb el vostre equip d'analítica.

Els vostres numeros de compte de client segueixen en cada ticket. Els vostres IDs de comanda segueixen alli. Els vostres IDs d'usuari interns tambe segueixen alli.

Aquests IDs semblen innocus per si sols. Sense una taula de cerca, no identifiquen una persona. Pero el vostre equip d'analítica te aquella taula. El vostre CRM la te. La vostra base de dades de suport la te. Qualsevol persona amb acces pot trobar la persona en segons.

Aixo es un error de GDPR. L'eina no va fallar. Mai no se li va dir que busques els vostres IDs.

Que detecten les eines PIE estandard

Les eines PIE estandard cobreixen els formats universals. Detecten el que utilitza tota organitzacio.

Les eines estandard detecten:

  • Numeros de la seguretat social (SSN dels EUA, NINO del Regne Unit, formats d'ID nacionals de la UE)
  • Adreces de correu electronic
  • Numeros de telefon
  • Numeros de targeta de credit
  • Noms
  • Numeros de passaport i de permis de conduir

Les eines estandard no detecten:

  • IDs d'empleats en el vostre format EMP-XXXXX
  • Numeros de compte de clients en el vostre format ACC-XXXXXXXX-XX
  • IDs de comanda en el vostre format ORD-XXXXXXX
  • IDs d'usuari interns en format UUID o personalitzat
  • Codis de referencia específics de socis

Les eines estandard troben patrons universals. Els vostres IDs interns no son universals. Necessiten configuracio personalitzada per ser detectats.

El risc de reidentificacio

Una empresa exporta tickets de suport per a revisio de qualitat. L'eliminacio PIE estandard elimina noms, correus electronics i numeros de telefon. Els numeros de compte en format ACC-XXXXXXXX-XX no es toquen.

L'exportacio va a l'equip d'analítica. Un analista uneix la taula de tickets amb la base de dades de clients pel numero de compte. La persona es troba de seguida. No cal cap truc especial. Es una unio SQL rutinaria.

L'article 4(5) del GDPR defineix la pseudonimitzacio com el processament on les dades "ja no es poden atribuir a un subjecte de dades concret sense l'us d'informacio addicional". Els numeros de compte fallen aquesta prova. La informacio addicional - la vostra base de dades de clients - es troba allí mateix a la vostra organitzacio.

L'exportacio "anonimitzada" no era anonima.

Crear patrons d'entitats personalitzades

La configuracio d'entitats personalitzades es rapida. Els equips de compliment ho poden fer sense ajuda d'enginyeria.

Pas 1: Llisteu els vostres formats d'ID.

Escriviu-ne cada un. Per exemple: compte ACC-XXXXXXXX-XX, ID de comanda ORD-XXXXXXX, ID d'empleat EMP-XXXXX.

Pas 2: Descriviu el format en llenguatge planer.

"Els numeros de compte comencen per ACC, despres un guio, despres 8 dígits, despres un guio, despres 2 lletres majuscules."

La generacio de patrons assistida per IA retorna: ACC-\d{8}-[A-Z]{2}

Pas 3: Proveu en dades d'exemple.

Carregueu entre 20 i 30 documents. Confirmeu que es troben totes les instancies. Confirmeu que no apareixen hits falsos.

Pas 4: Trieu un metode.

Per a IDs usats com a claus d'unio, on l'analisi necessita vincular registres:

  • Pseudonimitzeu. Substituiu ACC-00123456-AB per ACC-99876543-XY cada vegada. La mateixa entrada sempre dona la mateixa sortida. Les unions segueixen funcionant. El valor original no es pot trobar sense la clau.

Per a IDs que no es necessiten en l'analisi:

  • Redacteu. Substituiu per [REDACTED]. Simple. Permanent.

Pas 5: Deseu com a preset compartit.

Deseu l'entitat personalitzada - o un conjunt d'elles - en un preset compartit. La configuracio s'aplica a tots els usos: carregues per lots, crides API, interfície del navegador. Els nous membres de l'equip obtenen la configuracio completa de seguida.

Cas d'estudi: 180.000 tickets de suport

Una empresa va trobar 180.000 tickets de suport al seu magatzem analític. S'havien eliminat els noms i els correus electronics. Els numeros de compte no. Cada ticket seguia tenint un valor ACC-XXXXXXXX-XX actiu.

Cronologia de la resolucio:

  1. El responsable de compliment defineix el patro ACC - 15 minuts
  2. El prova en 30 tickets d'exemple - 20 minuts
  3. Confirma la precisio - 10 minuts
  4. Processa 180.000 tickets en un lot nocturn
  5. Substitueix les taules del magatzem per les versions netes

Temps total per al responsable de compliment: 45 minuts. Sense suport d'entitats personalitzades, la solucio hauria necessitat un ticket d'enginyeria, revisio de codi i un desplegament. Aixo triga setmanes, no hores.

Per a una analisi mes propera de com els IDs personalitzats creen risc en les eines d'IA de suport, consulteu la guia de GDPR i IA de suport.

On es propaguen els IDs personalitzats

Els IDs interns apareixen en mes llocs del que esperen la majoria d'equips.

Documents interns:

  • Notes de reunions amb referencies a comptes o IDs de comanda
  • Fils de correu electronic sobre casos de clients
  • Presentacions amb dades d'estudis de cas

Compartits amb tercers:

  • Informes a reguladors amb numeros de referencia de casos
  • Fitxers d'auditoria amb referencies de clients
  • Fitxers de proveïdors que porten IDs de clients

Recerca i analítica:

  • Conjunts de dades de recorregut del client
  • Exportacions de revisio de qualitat de suport
  • Dades d'entrenament per a models ML interns

Cada context necessita la mateixa configuracio d'entitats personalitzades per produir una sortida veritablement anonima.

Pseudonimitzacio vs. Anonimitzacio

El GDPR estableix una linia clara.

La pseudonimitzacio substitueix els IDs per substituts. La persona original es pot trobar de nou si algu te la taula de cerca. Aquestes dades segueixen sent dades personals. Redueix el risc. No elimina les vostres obligacions GDPR.

L'anonimitzacio elimina la capacitat de reidentificar. Les dades anonimes no son dades personals. El GDPR no s'hi aplica.

Els numeros de compte i els IDs de comanda son pseudonims quan existeixen taules de cerca. Substituir-los per substituts fixos redueix el risc, pero el GDPR segueix aplicant-se. Substituir-los per tokens aleatoris - i eliminar la clau - elimina l'obligacio GDPR, pero trenca l'analisi basada en unions.

Per compartir amb tercers que no tenen les vostres taules de cerca: la pseudonimitzacio pot ser suficient. Per a l'analítica interna, cal anonimitzacio completa o controls d'acces estrictes. La guia de compliment legal cobreix com documentar cada enfocament per al vostre ROPA.

Conclusio

La llacuna no es una fallada de l'eina. Es una llacuna de configuracio. Cap eina pot coneixer el vostre format de numero de compte a menys que li ho digueu.

La configuracio d'entitats personalitzades tanca la llacuna en hores. Els equips de compliment defineixen els formats, els proven en dades d'exemple i els apliquen a tots els modes d'us. No cal ajuda d'enginyeria.

Els 180.000 numeros de compte no redactats no eren alli perque l'eina hagues fallat. Eren alli perque mai no se li va dir que els busques.

Fonts

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.