PII slēpjas lietojumprogrammu žurnālos

Lietotņu žurnāli ir viena no visvairāk neievērotajām GDPR virsmām inženierijā. Ne tāpēc, ka inženieri ignorē likumu. Bet tāpēc, ka lietotāju dati nejauši iekļūst žurnāla failos.

Viens JSON pieprasijuma žurnāla ieraksts var glabāt četrus PII laukus:

{
  "timestamp": "2025-11-14T09:22:13Z",
  "level": "ERROR",
  "endpoint": "/api/users/profile",
  "user_email": "sarah.johnson@company.com",
  "client_ip": "82.123.45.67",
  "user_agent": "Mozilla/5.0",
  "error": "ValidationError: phone format",
  "input_value": "+49 176 1234 5678"
}

Šis vienais ieraksts glabā e-pastu, IP adresi un tālruņa numuru. Reiziniet to ar miljoniem ikdienas API zvanu. Rezultāts ir liela PII darbība. Tai nepieciešams juridisks pamats, ierobežojumi un kontrole.

Komandas kopīgo žurnāla failus ar ārējām pusēm visu laiku:

Drošības testēšanas firmas saņem ierakstus, lai kartētu lietotnes uzvedību
Ārējie konsultanti izmanto žurnāla paraugus, lai atrastu lēnos punktus
Žurnālu platformas (Elastic, Datadog, Splunk) saņem pilnas izvades plūsmas
SRE darbuzņēmēji piekļūst ierakstiem incidentu laikā
Izstrādes komandas citās juridiskajās vienībās saņem failus atkļūdošanai

Katra kopīgošana rada GDPR 28. panta jautājumus. Vai saņēmējs ir apstrādātājs? Vai ir Datu apstrādes līgums? Vai viņiem ir juridisks pamats redzēt lietotāju datus šajos failos?

Žurnālu platformas ir izplatīta nepilnība. Izvades sūtīšana ar reāliem lietotāju e-pastiem un IP adresēm uz Elastic Cloud vai Datadog izveido apstrādes saiti. Šai saitei nepieciešams DPA, standarta klauzulas un pārsūtīšanas rīks, ja platforma atrodas ārpus ES. Katra no tām prasa laiku un juridisko pārskatīšanu.

Vienkāršāks ceļš: notīriet lietotāju datus pirms faili atstāj jūsu sistēmu. Lasiet mūsu atbilstības pārskatu par pilniem 28. panta noteikumiem.

Kāpēc JSON struktūra apgrūtina noteikšanu

JSON žurnāla faili variē struktūrā. Vispārēja teksta skenēšana nav pietiekama.

Ligzdošanas dziļums: Lietotāju dati parādās jebkurā dziļumā. Lauks request.headers.x-forwarded-for glabā IP adreses. Lauks response.body.errors[0].field_value var glabāt lietotāja ievadi. Plakana teksta skenēšana palaiž garām laukus, kas aprakti ligzdotos ceļos.

Nekonsekventi shēmas: Katrs API galapunkts rada savu izvades formu. Autentifikācijas faili atšķiras no maksājumu failiem. Profilu atjauninājumu faili atšķiras no abiem. Fiksētas ceļa pieeja palaiž garām lietotāju datus, kas parādās dīvainās ceļos kļūdu kontekstos.

Tehniskie dati jaukti ar PII: Steka pēdas, kļūdu kodi un laika zīmogi jāpaliek neskartiem. Galvenā notīrīšana nodzēš nepieciešamos laukus un padara failu bezjēdzīgu.

Pareizie risinājumi ir satura balstīta noteikšana. Atrodiet lietotāju datus pēc tā, kas tie ir — e-pasta modelis, IP formāts, nosauktā entītija — nevis pēc tā, kur tie atrodas struktūrā. Tas apstrādā mainīgās shēmas bez iestatīšanas katram galapunktam.

Konsekventa aizstāšana saglabā žurnālus noderīgus

Galvenā prasība ir atsauces integritāte. Ja sarah.johnson@company.com parādās 47 ierakstās pieprasijumu ķēdē, visiem 47 jāatbild ar vienu un to pašu vērtību.

Kartēšanas noteikumi:

sarah.johnson@company.com → user1@example.com (vienāda vērtība visā failā)
82.123.45.67 → 192.0.2.1 (RFC 5737 dokumentācijas IP — skaidri nav reāls)
+49 176 1234 5678 → +49 XXX XXX XXXX (maskēts)

Ar šo kartēšanu izstrādātājs var izsekot user1@example.com caur 47 ierakstiem, atjaunot pieprasijumu ķēdi un izlabot kļūdu — neredzot nekādus reālus lietotāju datus.

Šie metadatu lauki paliek nemainīgi:

Laika zīmogi (nav lietotāju dati)
Kļūdu kodi un veidi (nav lietotāju dati)
Steka pēdas (var saturēt tehniskos ID, nav lietotāju dati)
HTTP metodes, ceļi, statusa kodi (nav lietotāju dati)
Metriku vērtības un latentuma skaitļi (nav lietotāju dati)

Rezultāts ir fails, kas darbojas atkļūdošanas darbam. Tas nesatur reālus lietotāju datus. Skatiet mūsu glosāriju par atšķirību starp anonimizāciju un pseidonimizāciju saskaņā ar GDPR.

Lietošanas gadijums: drošības testēšanas žurnālu kopīgošana

SaaS uzņēmums veica ceturkšņa drošības pārskatīšanu ar ārēju drošības testēšanas komandu. Apjoms prasīja 90 dienu ražošanas API izvadi, lai kartētu autentifikācijas plūsmas un analizētu kļūdu modeļus.

Neapstrādāts apjoms: 180 MB JSON failu. PII skaits: 4 200 unikāli lietotāju e-pasti, 1 800 unikālas IP adreses, 340 daļēji konta numuri kļūdu kontekstos.

Bez lietotāju datu notīrīšanas vispirms, šo failu kopīgošana prasītu:

DPA ar drošības testēšanas firmu
GDPR 46. panta pārsūtīšanas rīku (firma atradās ārpus ES)
Datu subjekta paziņojuma pārskatīšanu

Katra no tām pievieno juridisko darbu un laiku.

Ar PII notīrīšanu:

Apstrādes laiks: 25 minūtes 180 MB
Izvade: 180 MB strukturāli identisku failu, visi e-pasti un IP adreses aizstāti ar drošām vērtībām
Rezultāts: drošības testēšanas komanda saņēma pilnu kontekstu; nulle reālu lietotāju datu tiem sasniedza
GDPR rezultāts: nav nepieciešams DPA — notīrīta izvade nav lietotāju dati saskaņā ar GDPR

Skatiet mūsu FAQ par izplatītajiem jautājumiem par to, kas tiek uzskatīts par anonīmu saskaņā ar GDPR.

PII notīrīšanas integrācija CI/CD

Komandām, kas regulāri kopīgo izvadi, šis solis var darboties esošajos cauruļvados.

Žurnālu rotācija:

Rotācijas skripts darbojas naktī
Notīrīšanas solis darbojas pirms arhivēšanas vai nosūtīšanas uz jebkuru žurnālu platformu
Notīrītie faili dodas uz ārējām sistēmām
Oriģinālie faili paliek iekšēji ar pilnu saglabāšanu

Kopīgošanas skripts:

Inženierim nepieciešams kopīgot paraugu ar darbuzņēmēju
Palaiž skriptu: input=raw-logs/ output=clean-logs/
Kopīgo clean-logs/ mapi
Nav nepieciešama manuāla PII pārskatīšana

Blakus pieeja:

Blakusvagon notīra izvades plūsmu pirms pārsūtīšanas
Reāllaika notīrīšana saglabā lietderību žurnālu analīzei
Platforma saņem nulle reālu lietotāju datu

Saglabāšanas politikas integrācija

GDPR 5. panta 1. punkta e) apakšpunkts prasa glabāšanas ierobežojumu. PII notīrīšana iederas jebkurā saglabāšanas politikā.

Neapstrādāta izvade glabāta 7 dienas (ikdienas atkļūdošanas darbam)
Notīrītas versijas glabātas 90 dienas (tendences analīzei un incidentu pārskatīšanai)
Notīrīšanas solis darbojas 7. dienā

Tas apmierina glabāšanas ierobežojumu. Tas novērš neapstrādātas izvades ilgstoša glabāšanas risku.

Avoti

Saistītie Raksti

Tehniskā

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

Sākt Bezmaksas Izmēģinājumu Skatīt Funkcijas

GDPR žurnālu anonimizācija: saglabājiet atkļūdošanu

PII slēpjas lietojumprogrammu žurnālos

Kāpēc JSON struktūra apgrūtina noteikšanu

Konsekventa aizstāšana saglabā žurnālus noderīgus

Lietošanas gadijums: drošības testēšanas žurnālu kopīgošana

PII notīrīšanas integrācija CI/CD

Saglabāšanas politikas integrācija

Avoti

Saistītie Raksti

Presidio: 3 nedēļu iestatīšana vs pārvaldīts PII

No 6 nedēļām līdz 3 dienām: pārvaldīta PII iestatīšana

Bezmaksas PII noteikšana izmaksā 13 000 EUR/gadā

Vai esat gatavi aizsargāt savus datus?

GDPR žurnālu anonimizācija: saglabājiet atkļūdošanu

PII slēpjas lietojumprogrammu žurnālos

Trešo personu žurnālu kopīgošana palielina GDPR risku

Kāpēc JSON struktūra apgrūtina noteikšanu

Konsekventa aizstāšana saglabā žurnālus noderīgus

Lietošanas gadijums: drošības testēšanas žurnālu kopīgošana

PII notīrīšanas integrācija CI/CD

Saglabāšanas politikas integrācija

Avoti

Saistītie Raksti

Presidio: 3 nedēļu iestatīšana vs pārvaldīts PII

No 6 nedēļām līdz 3 dienām: pārvaldīta PII iestatīšana

Bezmaksas PII noteikšana izmaksā 13 000 EUR/gadā

Vai esat gatavi aizsargāt savus datus?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow