By · Last updated 2026-03-15

Torna al BlogTecnologia Legale

Anonimizzazione permanente: il rischio di spoliation

Il 34,8% degli input inviati a ChatGPT contiene dati sensibili (Cyberhaven). La soluzione — anonimizzazione permanente — crea un rischio legale autonomo: la spoliation. Art. GDPR 4(5) e Rule 37(e) impongono la reversibilità.

March 15, 202610 min di lettura
reversible encryptionspoliation risklegal discovery complianceGDPR pseudonymizationAES-256-GCM

Aggiornato per il 2026

Una soluzione, due nuovi rischi

Molti studi bloccano oggi le fughe verso l'IA rimuovendo nomi e ID prima che il testo raggiunga il fornitore. L'hashing a senso unico, la redazione definitiva o la rimozione completa sembrano sicuri: l'IA riceve testo pulito, i dettagli sensibili restano all'interno.

La logica regge dal punto di vista della sicurezza. Lo studio Cyberhaven del quarto trimestre 2025 ha rilevato che il 34,8% dei contenuti inviati a ChatGPT contiene dati sensibili. Il rapporto Ponemon 2024 stima il costo medio di una violazione legata all'IA a 2,1 milioni di dollari. Il rischio è reale e il costo elevato.

Ma la rimozione completa scambia un rischio con un altro: la spoliation of evidence (distruzione di prove).

Per gli studi soggetti ad azioni legali o audit, distruggere la possibilità di ripristinare i record originali può configurarsi come spoliation ai sensi delle norme federali e statali.

La scala della condivisione con l'IA

Ricerche di eSecurity Planet e Cyberhaven rivelano che il 77% del personale condivide dati sensibili con strumenti IA ogni settimana, in ambito legale, sanitario, finanziario e tecnologico.

I contenuti condivisi comprendono spesso:

  • Lettere di clienti e note sul caso
  • Bozze di contratti e termini di accordo
  • Piani interni e documenti aziendali
  • Modelli finanziari e proiezioni
  • Memorandum legali e note sul caso
  • Cartelle cliniche e note cliniche
  • File HR e messaggi tra dipendenti

Quando la rimozione completa è il controllo IA adottato, ogni documento che vi transita può perdere il proprio valore legale. Se quei documenti emergono in un procedimento giudiziario — eventualità molto probabile nell'arco di più anni per gli studi in settori regolamentati — lo studio ha potenzialmente eliminato delle prove.

Consulta la nostra panoramica sulla conformità legale per sapere come anonym.legal soddisfa gli obblighi di discovery. Puoi anche leggere la guida al sistema di token per capire come funziona nella pratica la pipeline di mascheramento.

GDPR: la reversibilità è obbligatoria

L'articolo 4(5) del GDPR definisce la pseudonimizzazione come il trattamento di dati personali in modo tale che non possano più essere attribuiti a un interessato specifico senza l'uso di informazioni aggiuntive, a condizione che tali informazioni aggiuntive siano conservate separatamente.

Il punto chiave: la chiave supplementare che consente il ricollegamento deve essere conservata. I record ricollegabili tramite chiavi memorizzate sono pseudonimizzati ai sensi del GDPR.

I record che non possono essere ricollegati in alcun modo non sono pseudonimizzati: sono anonimizzati. La distinzione è rilevante:

  • I record mascherati con token mantengono alcuni obblighi GDPR ma possono essere ripristinati per uso legale.
  • I record completamente cancellati possono cadere fuori dall'ambito del GDPR, ma non possono essere ripristinati.

Le Linee Guida 05/2022 del Comitato europeo per la protezione dei dati confermano che la reversibilità è parte fondamentale della definizione. Gli studi che utilizzano la rimozione a senso unico non stanno effettuando pseudonimizzazione ai sensi del GDPR: stanno eliminando la possibilità di recuperare i record.

Per approfondimenti consulta il nostro hub di conformità e la panoramica sulla protezione.

Regole federali: il test della spoliation

Ai sensi delle Federal Rules of Civil Procedure, le parti devono conservare i record che potrebbero essere rilevanti per un'azione legale prevedibile — l'obbligo decorre quando la causa è ragionevolmente prevedibile, non quando viene presentata.

La Rule 37(e) consente ai tribunali di comminare sanzioni quando una parte non riesce a conservare i record archiviati. Le sanzioni possono includere:

  • Istruzioni al giurì di trarre un'inferenza sfavorevole
  • Esclusione di prove
  • Sanzioni definitive del caso nei casi più gravi

Ecco come si concretizza il rischio. Uno studio utilizza flussi di lavoro IA che rimuovono completamente i contenuti sensibili nel corso ordinario dell'attività. Quei record risultano poi rilevanti in un'azione legale. Lo studio li ha modificati in modo tale che il testo originale non possa essere ripristinato. Se ciò è avvenuto dopo che è sorto l'obbligo di conservazione, emerge un'esposizione per spoliation.

Non si tratta di un caso limite. Gli studi in settori regolamentati con ricorrente esposizione a controversie affrontano prevedibili azioni legali su un'ampia gamma di tipi documentali. Applicare la rimozione completa a tutti i flussi di lavoro — senza esenzioni per i record a rischio — crea un'esposizione significativa per spoliation.

Reversibile vs. irreversibile: la differenza chiave

La differenza tra mascheramento reversibile e a senso unico sta nella progettazione.

A senso unico: nessuna via di ritorno

L'hashing SHA-256 di un nome produce un hash fisso: il nome non può essere derivato da esso. La redazione definitiva rimuove il testo, rendendo il contenuto originale irrecuperabile.

Reversibile: il recupero è possibile

La sostituzione con token con conservazione della chiave e la crittografia AES-256-GCM trasformano entrambe i record in modo reversibile. Un nome sostituito da un token può essere ripristinato tramite una tabella di lookup; il contenuto cifrato con AES-256-GCM può essere decifrato con la chiave corretta. Il testo originale resta accessibile.

Per la protezione dell'IA, entrambi i metodi funzionano allo stesso modo: il modello elabora i token e non vede mai i dati reali.

Per gli obblighi legali, funziona solo il mascheramento reversibile con token. I metodi a senso unico eliminano la possibilità di recupero e creano il rischio di spoliation sopra descritto.

Leggi come il nostro sistema di token gestisce questo processo end-to-end. Per un contesto più approfondito, consulta il glossario e le FAQ.

Il design dualmente conforme

Un design che soddisfa sia la sicurezza IA sia gli obblighi di disclosure legale utilizza il mascheramento reversibile con token AES-256-GCM:

  1. I record vengono elaborati prima di raggiungere qualsiasi strumento IA.
  2. Gli elementi sensibili — nomi, ID, PHI, contenuti privilegiati — vengono sostituiti con token strutturati.
  3. La mappa dei token viene conservata in un archivio separato con controlli di accesso commisurati al tipo di dato.
  4. L'elaborazione IA avviene sulla copia tokenizzata: il modello non vede mai i record reali.
  5. I risultati vengono ripristinati tramite la mappa dei token per l'uso aziendale ordinario.
  6. La mappa dei token viene sottoposta a legal hold quando sorgono obblighi di discovery.

Con questo design, nessun contenuto originale va mai perso. Il fornitore IA non lo vede mai in forma leggibile. La mappa dei token garantisce il recupero quando la legge lo richiede. Il rischio di spoliation è eliminato — nessun record viene distrutto, ma solo mascherato in modo reversibile.

L'articolo 4(5) del GDPR è soddisfatto: la chiave supplementare (mappa dei token) è conservata separatamente con adeguate garanzie tecniche e organizzative. L'obbligo di conservazione ai sensi delle Federal Rules è soddisfatto: i record originali possono essere ripristinati quando si applica un legal hold.

Scopri il nostro approccio al rilevamento delle entità, la panoramica sulla protezione e i piani e tariffe per tutti i dettagli.

La scelta binaria

Gli studi si trovano di fronte a una biforcazione netta:

  • Rimuovere i dati in modo permanente — risolve il problema della fuga verso l'IA, ma crea rischio legale.
  • Utilizzare il mascheramento reversibile con token — soddisfa contemporaneamente sia le esigenze di protezione sia quelle di conformità.

Il costo medio di una violazione legata all'IA di 2,1 milioni di dollari guida la decisione sulla sicurezza. Ma le sanzioni per spoliation non sono economiche: nei casi con elevati valori in gioco, i costi possono raggiungere lo stesso ordine di grandezza. Entrambi i rischi meritano un posto nella decisione.

Una policy IA solida copre entrambe le esigenze: blocca i record sensibili dal lasciare lo studio in forma leggibile e li mantiene accessibili quando un tribunale o un'autorità regolatoria li richiede. Il mascheramento reversibile con token è l'unico metodo che fa entrambe le cose contemporaneamente.

Per ulteriori approfondimenti, consulta la nostra dichiarazione del fondatore e i casi di studio.

Fonti

  • Cyberhaven Q4 2025: Data Exposure in AI Tools — link
  • IBM / Ponemon Institute: Cost of a Data Breach Report 2024 — link
  • EDPB Guidelines 05/2022 on Pseudonymization — link
  • Federal Rules of Civil Procedure Rule 37(e) — link
  • E-Discovery LLC: Relevance Redactions and Legal Standards — link

Pronto a proteggere i tuoi dati?

Inizia ad anonimizzare i PII con oltre 285 tipi di entità in 48 lingue.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.