By · Last updated 2026-05-31

Itzuli BlogeraGDPR & Betetze

SSNetik Haratago: Barne ID Anonimizazioa

Erakunde bakoitzak barne-identifikatzaileak ditu -- langile-IDak, kontu-zenbakiak, eskaera-IDak -- testuinguruan pertsona identifikagarriak direnak baina tresna estandarrek galdu egiten dituztenak.

May 31, 20267 min irakurri
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

SSNetik Haratago: Zure Erakundearen Barne IDen Anonimizazioa

Zure GDPR tresneak posta elektronikoko helbideak kentzen ditu. Telefono-zenbakiak kentzen ditu. Izenak kentzen ditu. Laguntza-esportazioak bertatik igaro dituzu. Ondoren irteera zure analisi-taldearekin partekatzen duzu.

Zure bezero-kontu-zenbakiak oraindik txartel guztietan daude. Eskaera-IDak oraindik daude. Zure barneko erabiltzaile-IDak ere bertan daude.

ID hauek bakarrik kalterik ez dirudi. Bilaketa-taularik gabe, ez dute pertsona bat izendatzen. Baina zure analisi-taldeak taula hori du. Zure CRMk du. Zure laguntza-datu-baseak du. Sarrera duen edonork pertsonari segundotan aurki diezaioke.

Hau GDPR porrot bat da. Tresnak ez du porrot egin. Inoiz ez zitzaion esan zure IDak bilatzeko.

Tresna Estandarrek Zer Detektatzen Duten

Tresna estandarrek formatu unibertsalak estaltzen dituzte. Erakunde guztiek erabiltzen dutena harrapatzen dute.

Tresna estandarrek detektatzen dituzte:

  • Gizarte-segurantza-zenbakiak (AEBetako SSNak, EBetako NINO, EUko nazional ID formatuak)
  • Posta elektronikoko helbideak
  • Telefono-zenbakiak
  • Kreditu-txarteleko zenbakiak
  • Izenak
  • Pasaporte eta gidabaimena-zenbakiak

Tresna estandarrek ez dituzte detektatzen:

  • Langile-IDak zure EMP-XXXXX formatuan
  • Bezero-kontu-zenbakiak zure ACC-XXXXXXXX-XX formatuan
  • Eskaera-IDak zure ORD-XXXXXXX formatuan
  • UUID edo formatu pertsonalizatuko barneko erabiltzaile-IDak
  • Lankide-espezifikoko erreferentzia-kodeak

Tresna estandarrek eredu unibertsalak aurkitzen dituzte. Zure barne-IDak ez dira unibertsalak. Aurkitu ahal izateko konfigurazio pertsonalizatua behar dute.

Berridentifikazio-Arriskua

Empresa batek kalitate-berrikuntzarako laguntza-txartelak esportatzen ditu. Tresna estandarrak izenak, emailak eta telefono-zenbakiak kentzen ditu. ACC-XXXXXXXX-XX formatuko kontu-zenbakiak ez dira ukitzen.

Esportazioa analisi-taldearengana doa. Analisi-batek txartel-taula bezero-datu-basearekin kontu-zenbakian elkartzen du. Pertsonari berehala aurkitzen zaio. Ez da truku berezirik behar. Ohiko SQL BATERAKETA bat da.

GDPR 4(5) artikuluak pseudonimizazioa definitzen du datuak prozesatzeko non "dagoeneko ezin den esleitu datu-subjektu zehatz bati informazio osagarririk erabili gabe." Kontu-zenbakiek proba hori gainditzerik ez dute. Informazio osagarria -- zure bezero-datu-basea -- zure erakundean bertan dago.

"Anonimizatutako" esportazioa ez zen anonimoa.

Entitate Eredu Pertsonalizatuak Eraikitzea

Entitate pertsonalizatuen konfigurazioa azkarra da. Betetze-taldeek ingeniaritza-laguntzarik gabe egin dezakete.

1. urratsa: Zerrendatu zure ID formatuak.

Idatzi bakoitza. Adibidez: kontu ACC-XXXXXXXX-XX, eskaera-ID ORD-XXXXXXX, langile-ID EMP-XXXXX.

2. urratsa: Deskribatu formatua hizkuntza arruntean.

"Kontu-zenbakiak ACC-rekin hasten dira, ondoren marratxo bat, ondoren 8 digitu, ondoren marratxo bat, ondoren 2 letra larri."

AI-laguntzako eredu-sorkuntza itzultzen du: ACC-\d{8}-[A-Z]{2}

3. urratsa: Probatu lagin-datuekin.

Igo 20-30 dokumentu. Berretsi kasu guztiak aurkitzen direla. Berretsi sasi-positiborik ez dagoela.

4. urratsa: Aukeratu metodo bat.

Elkartze-gako gisa erabiltzen diren IDengatik, non analisiak erregistroak lotu behar dituen:

  • Pseudonimizatu. Ordezkatu ACC-00123456-AB ACC-99876543-XY-rekin aldi guztietan. Sarrera berak beti irteera berdina ematen du. Elkartzeak oraindik funtzionatzen dute. Jatorrizko balioa gako gabe ezin da aurkitu.

Analisian behar ez diren IDengatik:

  • Ezabatu. Ordezkatu [REDACTED]-rekin. Erraza. Iraunkorra.

5. urratsa: Aurreslan-plan partekatuaren gisa gorde.

Gorde entitate pertsonalizatua -- edo hauen multzo bat -- aurreslan-plan partekatuaren gisa. Konfigurazioa erabilera guztietan aplikatzen da: batch igoerak, API deialdiak, nabigatzaile-interfazea. Taldekide berriek konfigurazio osoa berehala lortzen dute.

Kasua Azterketa: 180.000 Laguntza-Txartel

Enpresa batek 180.000 laguntza-txartel aurkitu zituen haien analisi-biltegian. Izenak eta emailak kendu ziren. Kontu-zenbakiak ez. Txartel bakoitzak oraindik bizi den ACC-XXXXXXXX-XX balio bat zuen.

Ebazpen-denbora-lerroa:

  1. Betetze-arduradunak ACC eredua definitu -- 15 minutu
  2. Probatu 30 lagin-txarteletan -- 20 minutu
  3. Zehaztasuna berretsi -- 10 minutu
  4. Prozesatu 180.000 txartelak gau bateko batch-ean
  5. Ordezkatu biltegi-taulak bertsio garbiekin

Betetze-arduraldunaren guztirako denbora: 45 minutu. Entitate pertsonalizatuen laguntzarik gabe, konponketak ingeniaritza-txartela, kodea berrikustea eta inplementazioa beharko lituzke. Horrek asteak behar ditu, ez orduak.

Pertsonalizatutako IDek AI laguntza-tresnetan nola arriskua sortzen duten gertutik ikusteko, ikusi GDPR eta laguntza AI gida.

Barne IDak Non Hedatzen Diren

Barne IDak gehieneko taldeek espero duten baino leku gehiagotan agertzen dira.

Barne dokumentuak:

  • Bilerako oharrak kontu edo eskaera ID erreferentziekin
  • Bezero-kasuen inguruko email-hariak
  • Kasu-azterketako datuekin aurkezpenak

Hirugarrenekin partekatuta:

  • Kasu-erreferentzia-zenbakiekin erregelatzaile-txostenak
  • Bezero-erreferentziak dituzten auditoretza-fitxategiak
  • Bezero-IDak dakarten hornitzaile-fitxategiak

Ikerketa eta analisia:

  • Bezero-bidaia-dataset-ak
  • Laguntza-kalitate-berrikuspena esportazioak
  • Barneko ML modeloetarako entrenamendu-datuak

Testuinguru bakoitzak konfigurazio berdinaren entitate pertsonalizatua behar du benetako irteeraren anonimoa sortzeko.

Pseudonimizazioa vs. Anonimizazioa

GDPRk lerroa argi markatzen du.

Pseudonimizazioak IDak ordezkariekin ordezkatzen ditu. Jatorrizko pertsona bilaketa-taula duenak berriro aurkitu dezake. Datu hauek oraindik datu pertsonalak dira. Arriskua murrizten du. Ez du zure GDPR betebeharrak kentzen.

Anonimizazioak berridentifikatzeko gaitasuna kentzen du. Datu anonimoak ez dira datu pertsonalak. GDPRa ez zaie aplikatzen.

Kontu-zenbakiak eta eskaera-IDak pseudonimoak dira bilaketa-taulak daudenean. Hauek ordezko finkoetan ordezkatzeak arriskua murrizten du, baina GDPRa oraindik aplikatzen da. Ausazko tokenekin ordezkatzeak -- eta gakoa ezabatuz -- GDPR betebeharra kentzen du, baina elkartze-oinarritutako analisia apurtzen du.

Bilaketa-taulak gabeko hirugarrenekin partekatzeko: pseudonimizazioa nahikoa izan daiteke. Barne analisirako, anonimizazio osoa edo kontrol-sarbide zorrotza behar dira. Lege-betetze-gidak estaltzen du nola dokumentatu ikuspegia bakoitza zure ROParako.

Ondorioa

Hutsunea ez da tresna-porrot bat. Konfigurazio-hutsunea da. Tresnak ezin du zure kontu-zenbaki-formatua jakin esan gabe.

Entitate pertsonalizatuen konfigurazioa orduetan ixten du hutsunea. Betetze-taldeek formatuak definitzen dituzte, lagin-datuekin probatzen dituzte eta erabilera-modu guztietan aplikatzen dituzte. Ez da ingeniaritza-laguntzarik behar.

180.000 kontu-zenbaki zehaztatu gabeak ez zeuden tresnak porrot egin zuelako. Bertan zeuden tresna inoiz ez zelako esan haiek bilatzeko.

Iturriak

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.