By · Last updated 2026-06-05

Itzuli BlogeraTeknikoa

GDPR Erregistroen Anonimizazioa: Akutseztatzen Jarraitu

Aplikazio-erregistroek isilik pilatzen dituzte erabiltzaile-posta elektronikoak, IPak eta kontu-zenbakiak. Hona nola partekatu erregistroak hirugarrenekin, kontratisteekin eta behaketa-plataformekin.

June 5, 20267 min irakurri
JSON logsGDPR complianceDevOps privacylog anonymizationdata minimization

PII Aplikazio-Erregistroetan Ezkutatzen Da

App erregistroak ingeniaritzako GDPR gainazal gehien ahaztuetariko bat dira. Ez ingeniariek legea alde batera uzten dutelako. Erabiltzaile-xehetasunak erregistro-fitxategietara istripu bidez sartzen direlako.

JSON eskaera-erregistro bakar batek lau PII eremu eduki ditzake:

{
  "timestamp": "2025-11-14T09:22:13Z",
  "level": "ERROR",
  "endpoint": "/api/users/profile",
  "user_email": "sarah.johnson@company.com",
  "client_ip": "82.123.45.67",
  "user_agent": "Mozilla/5.0",
  "error": "ValidationError: phone format",
  "input_value": "+49 176 1234 5678"
}

Sarrera bakar horrek posta elektronikoa, IP bat eta telefono-zenbaki bat ditu. Eguneko API dei-milioietan biderkatzen badiozu, PII jarduera nagusi baten aurrean gaude. Oinarri juridiko bat, mugak eta kontrolak behar ditu.

Hirugarrenekin Erregistroen Partekatzeak GDPR Arriskua Areagotzen Du

Taldeek erregistro-fitxategiak kanpoko alderdiekin partekatzen dituzte etengabe:

  • Pen test enpresek erregistroak jasotzen dituzte app-portaera mapatzeko
  • Kanpoko kontsultorek erregistro-laginak erabiltzen dituzte gune motelak aurkitzeko
  • Erregistro-plataformek (Elastic, Datadog, Splunk) irteera-fluxu osoak jasotzen dituzte
  • SRE kontratistek erregistroetara sartzen dira gertakariak gertatzen direnean
  • Entitate juridiko ezberdinetan dev taldeek fitxategiak jasotzen dituzte akutseztatzerako

Partekaketa bakoitzak GDPR 28. artikuluaren galderak planteatzen ditu. Hartzailea prozesatzailea al da? Datu-Prozesatze Hitzarmena (DPA) dago? Fitxategi horietan erabiltzaile-xehetasunak ikusteko oinarri juridikoa daukate?

Erregistro-plataformak hutsune arrunta dira. Erabiltzaile-posta elektroniko eta IP errealak dituzten irteerak Elastic Cloud edo Datadogera bidaltzeak prozesatze-esteka bat sortzen du. Esteka horrek DPA, klausula estandarrak eta transferentzia-tresna bat behar ditu plataforma EBtik kanpo badago. Horietako bakoitzak denbora eta berrikuspen juridikoa behar du.

Bide sinpleagoa: kendu erabiltzaile-xehetasunak fitxategiak zure sistematik irten aurretik. Irakurri gure betetze-ikuspegi orokorra 28. artikuluko arau osoentzako.

Zergatik JSON Egitura Detekzioa Zaila Egiten Duen

JSON erregistro-fitxategien egitura aldakorra da. Testu-eskaneo generikoa ez da nahikoa.

Habiaratze-sakonera: Erabiltzaile-xehetasunak edozein sakoneran agertzen dira. request.headers.x-forwarded-for eremuak IP helbideak gordetzen ditu. response.body.errors[0].field_value eremuak erabiltzaile-sarrera eduki dezake. Testu-eskaneo lauen bidez habiaratutako bideetan gordetako eremuak galtzen dira.

Eskema inkoherenteak: API amaiera-puntu bakoitzak bere irteera-forma sortzen du. Auth fitxategiak ordainketa-fitxategien ezberdinak dira. Profil-eguneratze fitxategiak bietatik ezberdinak dira. Bide-finko batek errore-testuinguruetan bide arraroen bidez agertzen diren erabiltzaile-xehetasunak galtzen ditu.

Balio teknikoak PII-rekin nahastuak: Pila-trazak, errore-kodeak eta denbora-zigiluak osorik mantendu behar dira. Oso-osoan kentzeak beharrezkoak diren eremuak ezabatzen ditu eta fitxategia alferrik bihurtzen du.

Ikuspegi egokia edukietan oinarritutako detekzioa da. Bilatu erabiltzaile-xehetasunak zer diren arren -- posta-eredua, IP formatua, entitate izendatua -- egituraren non dauden kontuan hartu gabe. Horrek eskema aldakorrak kudeatzen ditu amaiera-puntu bakoitzeko konfigurazio berezirik gabe.

Ordezkatze Koherenteak Erregistroak Erabilgarri Mantentzen Ditu

Eskatzen den baldintza erreferentzia-osotasuna da. sarah.johnson@company.com eskaera-kate bateko 47 sarreratan agertzen bada, 47 guztiek balio berdinera mapeatu behar dute.

Mapeatze-arauak:

  • sarah.johnson@company.com - user1@example.com (balio bera fitxategi osoan)
  • 82.123.45.67 - 192.0.2.1 (RFC 5737 dokumentazio IPa -- argi erreala ez dela)
  • +49 176 1234 5678 - +49 XXX XXX XXXX (maskaratua)

Mapeatze horrekin, garatzaile batek user1@example.com 47 sarreratan jarraitu dezake, eskaera-katea berreraiki eta akatsa konpondu -- erabiltzaile-xehetasun errealik ikusi gabe.

Metadatu eremu hauek aldatu gabe geratzen dira:

  • Denbora-zigiluak (ez erabiltzaile-datuak)
  • Errore-kodeak eta motak (ez erabiltzaile-datuak)
  • Pila-trazak (teknologia IDak eduki ditzakete, ez erabiltzaile-datuak)
  • HTTP metodoak, bideak, egoera-kodeak (ez erabiltzaile-datuak)
  • Metrika-balioak eta latentzia-zifrak (ez erabiltzaile-datuak)

Emaitza akutseztatze-lanetarako funtzionatzen duen fitxategia da. Ez du erabiltzaile-xehetasun errealik. Ikusi gure glosarioa GDPRren arabera anonimizazioaren eta pseudonimizazioaren arteko alderentzako.

Erabilera Kasua: Pen Test Erregistroen Partekatzea

SaaS enpresa batek hiruhilabeteko segurtasun berrikuspena egin zuen kanpoko pen test taldearekin. Esparrua auth fluxuak mapatzeko eta errore-ereduak aztertzeko 90 egun inguruko produkzio API irteeraren beharra zuen.

Bolumen gordina: 180 MB JSON fitxategi. PII kopurua: 4.200 erabiltzaile-posta elektronikoetako bakarrak, 1.800 IP bakarrak, 340 kontu-zenbaki partzialak errore-testuinguruetan.

Erabiltzaile-xehetasunak aurretik kendu gabe fitxategi horiek partekatzeak beharra izango zuen:

  • DPA pen test enpresarekin
  • GDPR 46. artikuluko transferentzia-tresna (enpresa EBtik kanpo zegoen)
  • Datu-subjektuen oharpen berrikuspena

Horietako bakoitzak lan juridiko eta denbora gehitzen du.

PII kenketa aplikatuta:

  • Prozesatze-denbora: 25 minutu 180 MBrako
  • Irteera: 180 MB egituraren aldetik berdinak diren fitxategiak, posta elektroniko eta IP guztiak balio seguruez ordezkatuta
  • Emaitza: pen test taldeak testuinguru osoa jaso zuen; zero erabiltzaile-xehetasun errealak heldu zitzaizkion
  • GDPR emaitza: ez da DPArik behar -- kendu irteera ez da erabiltzaile-datua GDPRren arabera

Ikusi gure FAQa GDPRren arabera anonimotzat jotzen denaren galdera arruntentzako.

PII Kenketa CI/CD-n Integratzea

Erregularki irteerak partekatzen dituzten taldeentzat, urrats hau egungo hodieran ibili daiteke.

Erregistroen txandakatzea:

  1. Txandakatze-scriptea gauero exekutatzen da
  2. Kenketa-urratsa artxibatu aurretik edo erregistro-plataformara bidali aurretik exekutatzen da
  3. Kendetako fitxategiak kanpoko sistemara doaz
  4. Jatorrizko fitxategiak barruan geratzen dira atxikipen osoarekin

Aurre-partekatzeko scripta:

  1. Ingeniariak lagina kontratista batekin partekatu behar du
  2. Scripta exekutatzen du: input=raw-logs/ output=clean-logs/
  3. clean-logs/ karpeta partekatzen du
  4. Ez da PII berrikuspenik behar eskuz

Sidecar ikuspegia:

  1. Sidecarrak irteera-fluxua bideratu aurretik kentzen du
  2. Denbora errealeko kenketak erregistro-analisirako utilitatea mantentzen du
  3. Plataformak zero erabiltzaile-xehetasun errealak jasotzen ditu

Atxikipen Politikako Integrazioa

GDPR 5(1)(e) artikuluak biltegi-muga eskatzen du. PII kenketa edozein atxikipen-politikatan sartzen da.

  • Irteera gordina 7 egunetan gordeta (eguneroko akutseztatze-lanerako)
  • Kendetako bertsioak 90 egunetan gordeta (joera-analisi eta gertakari-berrikuspen-erako)
  • Kenketa-urratsa 7. egunean exekutatzen da

Horrek biltegi-muga betetzen du. Irteera gordina luzaroan gordetzeko arriskua kentzen du.

Iturriak

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.