By · Last updated 2026-06-05

Atpakaļ uz BloguTehniskā

GDPR žurnālu anonimizācija: saglabājiet atkļūdošanu

Lietojumprogrammu žurnāli klusi uzkrāj lietotāju e-pastus, IP adreses un konta numurus. Lūk, kā kopīgot žurnālus ar trešajām personam, darbuzņēmējiem un novērojamības platformām, nepalielinot GDPR risku.

June 5, 20267 min lasīšanai
JSON logsGDPR complianceDevOps privacylog anonymizationdata minimization

PII slēpjas lietojumprogrammu žurnālos

Lietotņu žurnāli ir viena no visvairāk neievērotajām GDPR virsmām inženierijā. Ne tāpēc, ka inženieri ignorē likumu. Bet tāpēc, ka lietotāju dati nejauši iekļūst žurnāla failos.

Viens JSON pieprasijuma žurnāla ieraksts var glabāt četrus PII laukus:

{
  "timestamp": "2025-11-14T09:22:13Z",
  "level": "ERROR",
  "endpoint": "/api/users/profile",
  "user_email": "sarah.johnson@company.com",
  "client_ip": "82.123.45.67",
  "user_agent": "Mozilla/5.0",
  "error": "ValidationError: phone format",
  "input_value": "+49 176 1234 5678"
}

Šis vienais ieraksts glabā e-pastu, IP adresi un tālruņa numuru. Reiziniet to ar miljoniem ikdienas API zvanu. Rezultāts ir liela PII darbība. Tai nepieciešams juridisks pamats, ierobežojumi un kontrole.

Trešo personu žurnālu kopīgošana palielina GDPR risku

Komandas kopīgo žurnāla failus ar ārējām pusēm visu laiku:

  • Drošības testēšanas firmas saņem ierakstus, lai kartētu lietotnes uzvedību
  • Ārējie konsultanti izmanto žurnāla paraugus, lai atrastu lēnos punktus
  • Žurnālu platformas (Elastic, Datadog, Splunk) saņem pilnas izvades plūsmas
  • SRE darbuzņēmēji piekļūst ierakstiem incidentu laikā
  • Izstrādes komandas citās juridiskajās vienībās saņem failus atkļūdošanai

Katra kopīgošana rada GDPR 28. panta jautājumus. Vai saņēmējs ir apstrādātājs? Vai ir Datu apstrādes līgums? Vai viņiem ir juridisks pamats redzēt lietotāju datus šajos failos?

Žurnālu platformas ir izplatīta nepilnība. Izvades sūtīšana ar reāliem lietotāju e-pastiem un IP adresēm uz Elastic Cloud vai Datadog izveido apstrādes saiti. Šai saitei nepieciešams DPA, standarta klauzulas un pārsūtīšanas rīks, ja platforma atrodas ārpus ES. Katra no tām prasa laiku un juridisko pārskatīšanu.

Vienkāršāks ceļš: notīriet lietotāju datus pirms faili atstāj jūsu sistēmu. Lasiet mūsu atbilstības pārskatu par pilniem 28. panta noteikumiem.

Kāpēc JSON struktūra apgrūtina noteikšanu

JSON žurnāla faili variē struktūrā. Vispārēja teksta skenēšana nav pietiekama.

Ligzdošanas dziļums: Lietotāju dati parādās jebkurā dziļumā. Lauks request.headers.x-forwarded-for glabā IP adreses. Lauks response.body.errors[0].field_value var glabāt lietotāja ievadi. Plakana teksta skenēšana palaiž garām laukus, kas aprakti ligzdotos ceļos.

Nekonsekventi shēmas: Katrs API galapunkts rada savu izvades formu. Autentifikācijas faili atšķiras no maksājumu failiem. Profilu atjauninājumu faili atšķiras no abiem. Fiksētas ceļa pieeja palaiž garām lietotāju datus, kas parādās dīvainās ceļos kļūdu kontekstos.

Tehniskie dati jaukti ar PII: Steka pēdas, kļūdu kodi un laika zīmogi jāpaliek neskartiem. Galvenā notīrīšana nodzēš nepieciešamos laukus un padara failu bezjēdzīgu.

Pareizie risinājumi ir satura balstīta noteikšana. Atrodiet lietotāju datus pēc tā, kas tie ir — e-pasta modelis, IP formāts, nosauktā entītija — nevis pēc tā, kur tie atrodas struktūrā. Tas apstrādā mainīgās shēmas bez iestatīšanas katram galapunktam.

Konsekventa aizstāšana saglabā žurnālus noderīgus

Galvenā prasība ir atsauces integritāte. Ja sarah.johnson@company.com parādās 47 ierakstās pieprasijumu ķēdē, visiem 47 jāatbild ar vienu un to pašu vērtību.

Kartēšanas noteikumi:

  • sarah.johnson@company.comuser1@example.com (vienāda vērtība visā failā)
  • 82.123.45.67192.0.2.1 (RFC 5737 dokumentācijas IP — skaidri nav reāls)
  • +49 176 1234 5678+49 XXX XXX XXXX (maskēts)

Ar šo kartēšanu izstrādātājs var izsekot user1@example.com caur 47 ierakstiem, atjaunot pieprasijumu ķēdi un izlabot kļūdu — neredzot nekādus reālus lietotāju datus.

Šie metadatu lauki paliek nemainīgi:

  • Laika zīmogi (nav lietotāju dati)
  • Kļūdu kodi un veidi (nav lietotāju dati)
  • Steka pēdas (var saturēt tehniskos ID, nav lietotāju dati)
  • HTTP metodes, ceļi, statusa kodi (nav lietotāju dati)
  • Metriku vērtības un latentuma skaitļi (nav lietotāju dati)

Rezultāts ir fails, kas darbojas atkļūdošanas darbam. Tas nesatur reālus lietotāju datus. Skatiet mūsu glosāriju par atšķirību starp anonimizāciju un pseidonimizāciju saskaņā ar GDPR.

Lietošanas gadijums: drošības testēšanas žurnālu kopīgošana

SaaS uzņēmums veica ceturkšņa drošības pārskatīšanu ar ārēju drošības testēšanas komandu. Apjoms prasīja 90 dienu ražošanas API izvadi, lai kartētu autentifikācijas plūsmas un analizētu kļūdu modeļus.

Neapstrādāts apjoms: 180 MB JSON failu. PII skaits: 4 200 unikāli lietotāju e-pasti, 1 800 unikālas IP adreses, 340 daļēji konta numuri kļūdu kontekstos.

Bez lietotāju datu notīrīšanas vispirms, šo failu kopīgošana prasītu:

  • DPA ar drošības testēšanas firmu
  • GDPR 46. panta pārsūtīšanas rīku (firma atradās ārpus ES)
  • Datu subjekta paziņojuma pārskatīšanu

Katra no tām pievieno juridisko darbu un laiku.

Ar PII notīrīšanu:

  • Apstrādes laiks: 25 minūtes 180 MB
  • Izvade: 180 MB strukturāli identisku failu, visi e-pasti un IP adreses aizstāti ar drošām vērtībām
  • Rezultāts: drošības testēšanas komanda saņēma pilnu kontekstu; nulle reālu lietotāju datu tiem sasniedza
  • GDPR rezultāts: nav nepieciešams DPA — notīrīta izvade nav lietotāju dati saskaņā ar GDPR

Skatiet mūsu FAQ par izplatītajiem jautājumiem par to, kas tiek uzskatīts par anonīmu saskaņā ar GDPR.

PII notīrīšanas integrācija CI/CD

Komandām, kas regulāri kopīgo izvadi, šis solis var darboties esošajos cauruļvados.

Žurnālu rotācija:

  1. Rotācijas skripts darbojas naktī
  2. Notīrīšanas solis darbojas pirms arhivēšanas vai nosūtīšanas uz jebkuru žurnālu platformu
  3. Notīrītie faili dodas uz ārējām sistēmām
  4. Oriģinālie faili paliek iekšēji ar pilnu saglabāšanu

Kopīgošanas skripts:

  1. Inženierim nepieciešams kopīgot paraugu ar darbuzņēmēju
  2. Palaiž skriptu: input=raw-logs/ output=clean-logs/
  3. Kopīgo clean-logs/ mapi
  4. Nav nepieciešama manuāla PII pārskatīšana

Blakus pieeja:

  1. Blakusvagon notīra izvades plūsmu pirms pārsūtīšanas
  2. Reāllaika notīrīšana saglabā lietderību žurnālu analīzei
  3. Platforma saņem nulle reālu lietotāju datu

Saglabāšanas politikas integrācija

GDPR 5. panta 1. punkta e) apakšpunkts prasa glabāšanas ierobežojumu. PII notīrīšana iederas jebkurā saglabāšanas politikā.

  • Neapstrādāta izvade glabāta 7 dienas (ikdienas atkļūdošanas darbam)
  • Notīrītas versijas glabātas 90 dienas (tendences analīzei un incidentu pārskatīšanai)
  • Notīrīšanas solis darbojas 7. dienā

Tas apmierina glabāšanas ierobežojumu. Tas novērš neapstrādātas izvades ilgstoša glabāšanas risku.

Avoti

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.