Aggiornato per il 2026

La maggior parte dei team verifica la presenza di dati personali nel proprio database. Meno team fanno lo stesso per il sistema di log.

L'Articolo 5(1)(e) del GDPR limita la durata della conservazione dei dati personali. Per i database, i team definiscono policy ed eseguono job di cancellazione. Per i file di log, la regola sembra più semplice: conservare tutto per 90 giorni per il debug.

Il problema? Quei record contengono dati personali. Le voci delle richieste contengono email degli utenti. Le acquisizioni degli errori contengono i valori di input grezzi. Le voci di accesso contengono indirizzi IP. Ciascuno di questi conta come dato personale ai sensi del GDPR. Il tuo team ha bisogno di una base giuridica e di un piano di conservazione per ciascuno.

Cosa Finisce nei Tuoi File di Log

Il logging standard delle applicazioni web cattura un'ampia gamma di PII.

Record di accesso (nginx/Apache):

Indirizzi IP — dati personali secondo le linee guida EDPB
Stringhe user-agent — possono consentire il fingerprinting del dispositivo
Token di sessione — se scritti nell'output

Record delle applicazioni (JSON strutturato):

ID utente e indirizzi email
Errori di input — spesso includono il valore grezzo non valido, che può essere informazione reale dell'utente
Eventi di business — ID ordine collegati agli account clienti
Query di ricerca — possono contenere nomi o indirizzi

Record del gateway API:

Header di autenticazione — parzialmente acquisiti in alcune configurazioni
Parametri di query — possono contenere ID utente, nomi o email
Corpo delle richieste e delle risposte — presenti nelle configurazioni di debug

Voci di audit del database:

Query SQL con clausole WHERE come email = 'utente@esempio.it'
Valori personali letterali nei parametri delle query

Non si tratta di scelte intenzionali. È un effetto collaterale di un logging costruito per il debug, non per il GDPR.

Le Linee Guida EDPB sugli Indirizzi IP

Il Comitato Europeo per la Protezione dei Dati afferma che gli indirizzi IP sono dati personali. I provider di rete possono collegarli agli abbonati. All'interno di un'organizzazione, possono identificare utenti specifici.

L'impatto è diretto. I record di accesso con indirizzi IP sono record personali. Conservare l'output nginx per 12 mesi significa conservare dati personali per 12 mesi. Questo richiede una base giuridica ai sensi dell'Articolo 6 e un periodo di conservazione coerente con il tuo scopo dichiarato.

La maggior parte dei team salta questo passaggio. «Conserviamo le voci per 90 giorni perché lo dice la sicurezza» è una regola empirica. Non è una revisione ai sensi dell'Articolo 5(1)(e) del GDPR. Consulta la nostra panoramica sulla Conformità Legale per come questo si inserisce in un programma più ampio.

Come Raggiungere la Conformità

Per la maggior parte dei team, la soluzione pratica non è ridurre le finestre di conservazione. Le ragioni operative e di sicurezza per finestre più lunghe sono reali. La strada migliore è mascherare i record prima dello storage a lungo termine.

Un modello a livelli funziona bene.

0-7 giorni: Record grezzi completi per il debug attivo. Sette giorni è sufficientemente breve per la maggior parte dei team.

7-90 giorni: Record mascherati per l'analisi dei trend e la revisione della sicurezza. Gli indirizzi IP vengono sostituiti. Le email degli utenti diventano token stabili. I numeri di account vengono mascherati. I campi chiave — timestamp, codici di errore, latenza, endpoint — vengono mantenuti invariati.

90+ giorni (se necessario): Solo output aggregato. Conteggi degli eventi, tassi di errore, intervalli di latenza. Nessun record a livello utente rimane.

I dati personali si fermano a sette giorni. L'output aggregato può proseguire senza esporre nessuno. Consulta Sicurezza e Conformità per maggiori dettagli.

Preservare la Struttura per il Monitoraggio

Un buon mascheramento mantiene intatta la struttura JSON e sostituisce solo il contenuto. Questo mantiene l'output utile per il debug e gli alert.

Mantenuti invariati:

Chiavi JSON e struttura di annidamento
Timestamp e ordine temporale
Tipi di errore e codici di stato HTTP
Metodi HTTP, percorsi e valori di latenza
Tipi di eventi di business

Sostituiti:

Indirizzi email → token stabile per originale (es. user1@example.com)
Indirizzi IP → intervalli RFC 5737 (192.0.2.x)
Numeri di account → ACCT_XXXXX
Numeri di telefono → +XX XXX XXX XXXX
Nomi nel testo degli errori → [PERSONA]

I token stabili mantengono le tracce utili. Una traccia per user1@example.com su 40 voci funziona esattamente come l'originale. Le metriche aggregate — tassi di errore, latenza, throughput — non richiedono alcun dato personale. Consulta il Glossario per i termini pseudonimizzazione e anonimizzazione.

Tre Modi per Integrare Questa Soluzione

Tre pattern coprono la maggior parte dei team di sviluppo.

Opzione 1 — Mascheramento nella pipeline: Fluentd o Logstash intercetta ogni riga prima di inoltrarla. Una fase di mascheramento viene eseguita in linea. Elastic o Datadog ricevono solo record ripuliti. Non sono necessarie modifiche al codice dell'applicazione.

Opzione 2 — Batch notturno: I record grezzi arrivano nello storage locale. Un job notturno maschera l'output del giorno precedente ed elimina la versione grezza. I record mascherati vengono inviati allo storage a lungo termine. L'output grezzo viene conservato solo per sette giorni.

Opzione 3 — Mascheramento pre-condivisione: I record grezzi rimangono interni con controlli di accesso rigidi. Prima di condividerli con pen tester o contractor esterni, si esegue un passaggio di mascheramento. Le parti esterne ricevono sempre versioni ripulite.

Per la documentazione GDPR, il mascheramento è una «misura tecnica» ai sensi dell'Articolo 32. Registra lo strumento, la sua configurazione e la tua policy di conservazione nel Registro delle Attività di Trattamento (RAT) ai sensi dell'Articolo 30. Consulta le nostre FAQ per le domande frequenti sul RAT.

Vuoi un esempio concreto? Consulta i casi studio per dettagli di implementazione reali. Puoi anche esaminare i nostri prezzi per vedere quale piano include pipeline di mascheramento integrate.

Fonti

Articolo 5 del GDPR: Principi per il Trattamento dei Dati — VERIFICATO-ESTERNO
Parere EDPB 5/2019 sulla Direttiva ePrivacy e il GDPR — VERIFICATO-ESTERNO
Sonra.io: Mascheramento PII in Dati JSON e XML — VERIFICATO-ESTERNO

Pronto a proteggere i tuoi dati?

Inizia ad anonimizzare i PII con oltre 285 tipi di entità in 48 lingue.

Inizia Prova Gratuita Visualizza Funzionalità

GDPR nei Log delle Applicazioni: Conformità PII in JSON

Cosa Finisce nei Tuoi File di Log

Le Linee Guida EDPB sugli Indirizzi IP

Come Raggiungere la Conformità

Preservare la Struttura per il Monitoraggio

Tre Modi per Integrare Questa Soluzione

Fonti

Articoli Correlati

Presidio: 3 Settimane di Setup vs PII Gestito

Da 6 Settimane a 3 Giorni: PII Gestito vs Self-Hosted

Il Rilevamento PII "Gratuito" Costa €13.000/Anno

Pronto a proteggere i tuoi dati?

GDPR nei Log delle Applicazioni: Conformità PII in JSON

Il Rischio GDPR Silenzioso nel Tuo Stack di Log

Cosa Finisce nei Tuoi File di Log

Le Linee Guida EDPB sugli Indirizzi IP

Come Raggiungere la Conformità

Preservare la Struttura per il Monitoraggio

Tre Modi per Integrare Questa Soluzione

Fonti

Articoli Correlati

Presidio: 3 Settimane di Setup vs PII Gestito

Da 6 Settimane a 3 Giorni: PII Gestito vs Self-Hosted

Il Rilevamento PII "Gratuito" Costa €13.000/Anno

Pronto a proteggere i tuoi dati?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow