anonym.legal

By · Last updated 2026-05-31

Nazaj na blogGDPR in skladnost

Preko SSN-jev: Anonimizacija internih ID-jev organizacije

Vsaka organizacija ima notranje identifikatorje - ID-je zaposlenih, stevilke racunov, ID-je narocil - ki so osebno prepoznavni v kontekstu, toda standardna orodja jih spregledajo.

May 31, 20267 min branja
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

Preko SSN-jev: Anonimizacija internih ID-jev vase organizacije

Vase orodje GDPR odstrani e-postne naslove. Odstrani telefonske stevilke. Odstrani imena. Skozi njega zazenete izvoze podpore. Nato delite izhod s svojo analitsko ekipo.

Stevilke racunov vasih strank so se v vsaki vstopnici. ID-ji vasih narocil so se tam. Notranji ID-ji vasih uporabnikov so prav tako se tam.

Ti ID-ji sami po sebi izgledajo nenevarne. Brez iskalne tabele ne imenujejo osebe. Toda vasa analitska ekipa ima to tabelo. Vase CRM jo ima. Vasa podatkovna baza podpore jo ima. Kdorkoli z dostopom lahko v sekundah najde osebo.

To je napaka GDPR. Orodje se ni pokvarilo. Nikoli mu ni bilo naroceno, da isce vase ID-je.

Kaj standardna orodja za osebne podatke zaznajo

Standardna orodja za osebne podatke pokrijejo univerzalne formate. Ujamejo, kar vsaka organizacija uporablja.

Standardna orodja zaznajo:

  • Stevilke socialnega zavarovanja (SSN-ji ZDA, NINO-ji UK, formati nacionalnih ID-jev EU)
  • E-postne naslove
  • Telefonske stevilke
  • Stevilke kreditnih kartic
  • Imena
  • Stevilke potnih listov in vozniskih dovoljenj

Standardna orodja ne zaznajo:

  • ID-jev zaposlenih v vasem formatu EMP-XXXXX
  • Stevilk racunov strank v vasem formatu ACC-XXXXXXXX-XX
  • ID-jev narocil v vasem formatu ORD-XXXXXXX
  • Notranjih ID-jev uporabnikov v UUID ali prilagojenih formatih
  • Partnersko specificnih referenCnih kod

Standardna orodja najdejo univerzalne vzorce. Vasi notranji ID-ji niso univerzalni. Potrebujejo prilagojeno nastavitev, da se jih najde.

Tveganje ponovne identifikacije

Podjetje izvozi vstopnice za podporo za pregled kakovosti. Standardno odstranjevanje osebnih podatkov odstrani imena, e-poste in telefonske stevilke. Stevilke racunov v formatu ACC-XXXXXXXX-XX niso dotaknjena.

Izvoz gre analitski ekipi. Analitik zdruzi tabelo vstopnic z bazo podatkov strank glede na stevilko racuna. Oseba je takoj najdena. Noben poseben trik ni potreben. Je rutinska poizvedba SQL.

Clen 4(5) GDPR definira psevdonimizacijo kot obdelavo, kjer podatki "ne morejo biti vec pripisani dolocenemu posamezniku brez uporabe dodatnih informacij." Stevilke racunov ne prestanejo tega preizkusa. Dodatne informacije - vasa baza podatkov strank - so ravno tam v vasi organizaciji.

"Anonimizirani" izvoz ni bil anonimen.

Gradnja vzorcev entitet po meri

Navastitev entitet po meri je hitra. Ekipe za skladnost jo lahko naredijo brez pomoci inzenirjev.

Korak 1: Navedite svoje formate ID-jev.

Zapisite vsakega. Na primer: racun ACC-XXXXXXXX-XX, ID narocila ORD-XXXXXXX, ID zaposlenega EMP-XXXXX.

Korak 2: Opisite format v preprostem jeziku.

"Stevilke racunov se zacnejo z ACC, nato pomisljaj, nato 8 stevilk, nato pomisljaj, nato 2 veliki crhki."

Generiranje vzorcev s pomocjo UI vrne: ACC-\d{8}-[A-Z]{2}

Korak 3: Preizkusite na vzorcnih podatkih.

Nalozite 20 do 30 dokumentov. Potrdite, da so najdeni vsi primeri. Potrdite, da ni laznih zadetkov.

Korak 4: Izberite metodo.

Za ID-je, ki se uporabljajo kot kljuci za zdruzevanje, kjer analiza mora povezati evidence:

  • Psevdonimizirajte. Zamenjajte ACC-00123456-AB z ACC-99876543-XY vsakic. Isti vhod vedno da isti izhod. Zdruzevanja se vedno delujejo. Prvotna vrednost ne more biti najdena brez kljuca.

Za ID-je, ki niso potrebni v analizi:

  • Redigirajte. Zamenjajte z [REDACTED]. Enostavno. Trajno.

Korak 5: Shranite kot skupno prednastavitev.

Shranite entiteto po meri - ali skupek njih - v skupno prednastavitev. Nastavitev se uporabi za vso uporabo: paketne nalozitve, klice API-ja, brskalniski vmesnik. Novi clani ekipe takoj dobijo celotno konfiguracijo.

Studija primera: 180.000 vstopnic za podporo

Podjetje je naslo 180.000 vstopnic za podporo v svoji analitski podatkovni skladsnici. Imena in e-poste so bile odstranjene. Stevilke racunov niso bile. Vsaka vstopnica je se vedno imela zivo vrednost ACC-XXXXXXXX-XX.

Casovnica resitve:

  1. Uradnik za skladnost definira vzorec ACC - 15 minut
  2. Preizkusi ga na 30 vzorcnih vstopnicah - 20 minut
  3. Potrdi natancnost - 10 minut
  4. Obdela 180.000 vstopnic v nocnem paketnem nacinu
  5. Zamenja tabele v podatkovni skladsnici s cistimi razlicicami

Skupni cas za uradnika za skladnost: 45 minut. Brez podpore entitet po meri bi resitev zahtevala inzinirsko vstopnico, pregled kode in uvedbo. To vzame tedne, ne ure.

Za bolj podroben pogled na to, kako notranji ID-ji ustvarjajo tveganje v orodjih UI za podporo, glejte vodic za GDPR in AI podporo.

Kje se sirijo notranji ID-ji

Notranji ID-ji se pojavljajo na vec mestih, kot vecina ekip pricakuje.

Notranji dokumenti:

  • Zapiski sestankov s sklici na stevilke racunov ali narocil
  • E-postna sporocila o primerih strank
  • Predstavitve s podatki studij primerov

V skupni rabi s tretjimi strankami:

  • Porocila regulatorjem s stevilkami referenc primerov
  • Revizijske datoteke s sklici na stranke
  • Datoteke prodajalcev, ki nosijo ID-je strank

Raziskave in analitika:

  • Nabori podatkov o potovanju stranke
  • Izvozi pregleda kakovosti podpore
  • Ucni podatki za notranje modele ML

Vsak kontekst potrebuje enako nastavitev entitet po meri za proizvodnjo resniono anonimnega izhoda.

Psevdonimizacija vs. Anonimizacija

GDPR vleece jasno crto.

Psevdonimizacija zamenja ID-je z nadomestki. Prvotno osebo je mogoce najti znova, ce nekdo ima iskalno tabelo. Ti podatki so se vedno osebni podatki. Zmanjsuje tveganje. Ne odstrani vasih obveznosti GDPR.

Anonimizacija odstrani moznost ponovne identifikacije. Anonimni podatki niso osebni podatki. GDPR zanje ne velja.

Stevilke racunov in ID-ji narocil so psevdonimni, ko obstajajo iskalne tabele. Zamenjava z utezjenimi nadomestki zmanjsuje tveganje, toda GDPR se vedno velja. Zamenjava z nakljucnimi znackami - in brisanje kljuca - odstrani dolznost GDPR, toda pokvari analizo na podlagi zdruzevanja.

Za deljenje s tretjimi strankami, ki nimajo vasiH iskalnih tabel: psevdonimizacija je morda dovolj. Za notranjo analitiko so potrebna polna anonimizacija ali strogi nadzori dostopa. Vodic za pravno skladnost pokriva, kako dokumentirati vsak pristop za vase ROPA.

Zakljucek

Vrzel ni napaka orodja. Je vrzel v nastavitvi. Nobeno orodje ne more poznati formata vasih stevilk racunov, ce mu ne poveste.

Nastavitev entitet po meri zapre vrzel v urah. Ekipe za skladnost definirajo formate, jih preizkusijo na vzorcnih podatkih in jih uporabijo v vseh naciniH uporabe. Pomoc inzenirjev ni potrebna.

180.000 neredigiranih stevilk racunov ni bilo tam, ker je orodje odpovedalo. Bili so tam, ker orodju nikoli ni bilo naroceno, da jih isce.

Viri

Ste pripravljeni zaščititi svoje podatke?

Začnite z anonimizacijo PII z več kot 285 tipi entitet v 48 jezikih.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.