By · Last updated 2026-05-31

Torna al BlogGDPR e Conformità

Oltre i codici fiscali: anonimizzare gli ID interni dell'organizzazione

Ogni organizzazione ha identificatori interni — ID dipendente, numeri di conto, ID ordine — che sono personalmente identificabili nel contesto ma non vengono intercettati dagli strumenti PII standard.

May 31, 20267 min di lettura
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

Oltre i codici fiscali: anonimizzare gli ID interni della tua organizzazione

Il tuo strumento GDPR rimuove gli indirizzi email. Rimuove i numeri di telefono. Rimuove i nomi. Passi le esportazioni del supporto clienti attraverso di esso. Poi condividi l'output con il tuo team di analisi.

I numeri di conto dei tuoi clienti sono ancora in ogni ticket. I tuoi order ID ci sono ancora. Anche i tuoi ID utente interni.

Questi ID sembrano innocui da soli. Senza una tabella di lookup, non identificano una persona. Ma il tuo team di analisi ha quella tabella. Il tuo CRM ce l'ha. Il tuo database di supporto pure. Chiunque abbia accesso può trovare la persona in pochi secondi.

Questo è un fallimento GDPR. Lo strumento non ha smesso di funzionare. Non è mai stato configurato per cercare i tuoi ID.

Cosa rilevano gli strumenti PII standard

Gli strumenti PII standard coprono i formati universali. Intercettano ciò che ogni organizzazione usa.

Gli strumenti standard rilevano:

  • Codici fiscali (SSN statunitensi, NINO britannici, formati nazionali UE)
  • Indirizzi email
  • Numeri di telefono
  • Numeri di carte di credito
  • Nomi
  • Numeri di passaporto e patente di guida

Gli strumenti standard non rilevano:

  • ID dipendente nel tuo formato EMP-XXXXX
  • Numeri di conto cliente nel tuo formato ACC-XXXXXXXX-XX
  • Order ID nel tuo formato ORD-XXXXXXX
  • ID utente interni in UUID o formati personalizzati
  • Codici di riferimento specifici dei partner

Gli strumenti standard trovano pattern universali. I tuoi ID interni non sono universali. Necessitano di configurazione personalizzata per essere trovati.

Il rischio di reidentificazione

Un'azienda esporta i ticket di supporto per la revisione della qualità. La rimozione standard dei dati PII elimina nomi, email e numeri di telefono. I numeri di conto nel formato ACC-XXXXXXXX-XX non vengono toccati.

L'export va al team di analisi. Un analista unisce la tabella dei ticket con il database clienti tramite numero di conto. La persona viene trovata immediatamente. Non serve nessun trucco speciale. È un semplice join SQL di routine.

L'Articolo 4(5) del GDPR definisce la pseudonimizzazione come il trattamento dove i dati "non possono più essere attribuiti a un interessato specifico senza l'utilizzo di informazioni aggiuntive." I numeri di conto non superano questo test. Le informazioni aggiuntive — il tuo database clienti — sono proprio lì nella tua organizzazione.

L'export "anonimizzato" non era anonimo.

Creare pattern di entità personalizzate

La configurazione di entità personalizzate è rapida. I team di conformità possono farlo senza assistenza tecnica.

Passaggio 1: Elenca i tuoi formati ID.

Annotali uno per uno. Ad esempio: conto ACC-XXXXXXXX-XX, order ID ORD-XXXXXXX, ID dipendente EMP-XXXXX.

Passaggio 2: Descrivi il formato in linguaggio semplice.

"I numeri di conto iniziano con ACC, poi un trattino, poi 8 cifre, poi un trattino, poi 2 lettere maiuscole."

La generazione assistita da AI dei pattern restituisce: `ACC-\d{8}-[A-Z]{2}`

Passaggio 3: Testa su dati campione.

Carica da 20 a 30 documenti. Verifica che tutte le istanze vengano trovate. Verifica che non appaiano falsi positivi.

Passaggio 4: Scegli un metodo.

Per gli ID usati come chiavi di join, dove l'analisi deve collegare i record:

  • Pseudonimizza. Sostituisci ACC-00123456-AB con ACC-99876543-XY ogni volta. Lo stesso input produce sempre lo stesso output. I join funzionano ancora. Il valore originale non può essere trovato senza la chiave.

Per gli ID non necessari nell'analisi:

  • Oscura. Sostituisci con [REDACTED]. Semplice. Permanente.

Passaggio 5: Salva come preset condiviso.

Salva l'entità personalizzata — o un insieme di esse — in un preset condiviso. La configurazione si applica a tutti gli utilizzi: caricamenti batch, chiamate API, interfaccia browser. I nuovi membri del team ottengono immediatamente la configurazione completa.

Caso di studio: 180.000 ticket di supporto

Un'azienda ha trovato 180.000 ticket di supporto nel proprio data warehouse per l'analisi. Nomi ed email erano stati rimossi. I numeri di conto no. Ogni ticket conteneva ancora un valore ACC-XXXXXXXX-XX attivo.

Tempi di risoluzione:

  1. Il responsabile della conformità definisce il pattern ACC — 15 minuti
  2. Lo testa su 30 ticket campione — 20 minuti
  3. Verifica l'accuratezza — 10 minuti
  4. Elabora 180.000 ticket in un batch notturno
  5. Sostituisce le tabelle del warehouse con le versioni pulite

Tempo totale per il responsabile della conformità: 45 minuti. Senza il supporto per le entità personalizzate, la correzione avrebbe richiesto un ticket al team di ingegneria, una code review e un deploy. Settimane, non ore.

Per un'analisi più dettagliata di come gli ID personalizzati creano rischi negli strumenti AI di supporto, consulta la guida su GDPR e AI di supporto.

Dove si diffondono gli ID personalizzati

Gli ID interni compaiono in più luoghi di quanti la maggior parte dei team si aspetti.

Documenti interni:

  • Verbali di riunioni con riferimenti a ID di conto o ordine
  • Thread email su casi clienti
  • Presentazioni con dati di case study

Condivisi con terze parti:

  • Relazioni alle autorità di controllo con numeri di riferimento dei casi
  • File di audit con riferimenti clienti
  • File dei fornitori che contengono ID clienti

Ricerca e analisi:

  • Dataset del customer journey
  • Esportazioni per la revisione della qualità del supporto
  • Dati di addestramento per modelli ML interni

Ogni contesto richiede la stessa configurazione di entità personalizzate per produrre un output veramente anonimo.

Pseudonimizzazione vs. anonimizzazione

Il GDPR traccia una linea netta.

La pseudonimizzazione sostituisce gli ID con sostituti. La persona originale può essere ritrovata se qualcuno ha la tabella di lookup. Questi dati sono ancora dati personali. Riduce il rischio. Non rimuove i tuoi obblighi GDPR.

L'anonimizzazione elimina la possibilità di reidentificazione. I dati anonimi non sono dati personali. Il GDPR non si applica ad essi.

I numeri di conto e gli order ID sono pseudonimi quando esistono tabelle di lookup. Sostituirli con sostituti fissi abbassa il rischio, ma il GDPR continua ad applicarsi. Sostituirli con token casuali — e cancellare la chiave — rimuove l'obbligo GDPR, ma compromette l'analisi basata sui join.

Per la condivisione con terze parti che non dispongono delle tue tabelle di lookup: la pseudonimizzazione può essere sufficiente. Per l'analisi interna, è necessaria l'anonimizzazione completa o rigidi controlli di accesso. La guida alla conformità legale spiega come documentare ciascun approccio per il tuo RoPA.

Conclusione

Il divario non è un malfunzionamento dello strumento. È un divario di configurazione. Nessuno strumento può conoscere il tuo formato di numero di conto a meno che tu non glielo dica.

La configurazione delle entità personalizzate colma il divario in poche ore. I team di conformità definiscono i formati, li testano su dati campione e li applicano a tutte le modalità d'uso. Non è necessaria assistenza tecnica.

I 180.000 numeri di conto non oscurati non erano lì perché lo strumento ha fallito. Erano lì perché allo strumento non era mai stato detto di cercarli.

Fonti

Pronto a proteggere i tuoi dati?

Inizia ad anonimizzare i PII con oltre 285 tipi di entità in 48 lingue.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.