By · Last updated 2026-05-31

Povratak na BlogGDPR & Usklađenost

Vise od SSN: Anonimizacija internih ID-ova organizacije

Svaka organizacija ima interne identifikatore - ID-ovi zaposlenika, brojevi racuna, ID-ovi narudzbe - koji su osobno prepoznatljivi u kontekstu, ali ih standardni PII alati propustaju.

May 31, 20267 min čitanja
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

Vise od SSN-ova: Anonimizacija internih ID-ova vase organizacije

Vas GDPR alat uklanja adrese e-poste. Uklanja brojeve telefona. Uklanja imena. Pokrecete izvoz podrske kroz njega. Zatim dijelite rezultat sa svojim analiticki timom.

Brojevi vasih korisnickih racuna i dalje su u svakom zahtjevu. Vasi ID-ovi narudzbe su i dalje tu. Vasi interni korisnicki ID-ovi su takodje i dalje tu.

Ovi ID-ovi izgledaju bezopasno sami po sebi. Bez tablice za pretrazivanje, ne imenuju osobu. Ali vas analiticki tim ima tu tablicu. Vas CRM je ima. Vasa baza podataka podrske je ima. Svi koji imaju pristup mogu pronaci osobu za sekunde.

Ovo je GDPR propust. Alat nije zakazao. Nikada mu nije receno da trazi vase ID-ove.

Sto standardni PII alati otkrivaju

Standardni PII alati pokrivaju universalne formate. Hvataju ono sto svaka organizacija koristi.

Standardni alati otkrivaju:

  • Socijalne sigurnosne brojeve (americke SSN-ove, britanske NINO-ve, EU nacionalne ID formate)
  • Adrese e-poste
  • Brojeve telefona
  • Brojeve kreditnih kartica
  • Imena
  • Putovnice i vozacke dozvole

Standardni alati ne otkrivaju:

  • ID-ove zaposlenika u vasem EMP-XXXXX formatu
  • Brojeve korisnickih racuna u vasem ACC-XXXXXXXX-XX formatu
  • ID-ove narudzbe u vasem ORD-XXXXXXX formatu
  • Interne korisnicke ID-ove u UUID ili prilagodljivi formatima
  • Referentne kodove specificne za partnera

Standardni alati pronalaze universalne uzorke. Vasi interni ID-ovi nisu universalni. Trebaju prilagodljivo postavljanje da bi bili pronadjeni.

Rizik reidentifikacije

Tvrtka izvozi zahtjeve podrske za pregled kvalitete. Standardno uklanjanje PII skida imena, e-poste i telefonske brojeve. Brojevi racuna u formatu ACC-XXXXXXXX-XX nisu dirnuti.

Izvoz ide analiticki timu. Analiticar spaja tablicu zahtjeva s bazom podataka kupaca prema broju racuna. Osoba je odmah pronadjena. Nije potreban poseban trik. To je rutinski SQL spoj.

GDPR clanak 4(5) definira pseudonimizaciju kao obradu gdje se podaci "vise ne mogu pripisati specificnom ispitaniku bez koristenja dodatnih informacija." Brojevi racuna ne prolaze taj test. Dodatne informacije - vasa baza podataka kupaca - su pravo tu u vasoj organizaciji.

"Anonimizirani" izvoz nije bio anoniman.

Izgradnja uzoraka prilagodljenih entiteta

Postavljanje prilagodljivog entiteta je brzo. Timovi za uskladjenost mogu to napraviti bez inzenjera.

Korak 1: Navedite svoje ID formate.

Zapisite svaki od njih. Na primjer: racun ACC-XXXXXXXX-XX, ID narudzbe ORD-XXXXXXX, ID zaposlenika EMP-XXXXX.

Korak 2: Opisite format na razgovornom jeziku.

"Brojevi racuna pocinju s ACC, zatim crtica, zatim 8 znamenki, zatim crtica, zatim 2 velika slova."

Generiranje uzorka uz pomoc AI vraca: ACC-\d{8}-[A-Z]{2}

Korak 3: Testirajte na uzornim podacima.

Prenesite 20 do 30 dokumenata. Potvrdite da su pronadjene sve instance. Potvrdite da se ne pojavljuju lazni pogoci.

Korak 4: Odaberite metodu.

Za ID-ove koji se koriste kao kljucevi spajanja, gdje analiza treba povezati zapise:

  • Pseudonimizujte. Zamijenite ACC-00123456-AB s ACC-99876543-XY svaki put. Isti ulaz uvijek daje isti rezultat. Spajanja i dalje rade. Originalna vrijednost ne moze se pronaci bez kljuca.

Za ID-ove koji nisu potrebni u analizi:

  • Redaktirajte. Zamijenite s [REDACTED]. Jednostavno. Trajno.

Korak 5: Spravite kao dijeljeni predlozak.

Spravite prilagodljiv entitet - ili skup njih - u dijeljeni predlozak. Postavljanje se primjenjuje na sve koristenje: grupno prenosenje, API pozivi, koristenje preglednika. Novi clanovi tima odmah dobivaju punu konfiguraciju.

Studija slucaja: 180.000 zahtjeva za podrsku

Tvrtka je pronasla 180.000 zahtjeva za podrsku u svom analiticki repozitoriju. Imena i e-poste su uklonjeni. Brojevi racuna nisu. Svaki zahtjev i dalje je drzao zivu ACC-XXXXXXXX-XX vrijednost.

Vremenski plan rjesenja:

  1. Sluzbenik za uskladjenost definira ACC uzorak - 15 minuta
  2. Testiranje na 30 uzornih zahtjeva - 20 minuta
  3. Potvrdjivanje tocnosti - 10 minuta
  4. Obrada 180.000 zahtjeva u nocnoj grupi
  5. Zamjena tablica repozitorija cistim verzijama

Ukupno vrijeme za sluzbenika za uskladjenost: 45 minuta. Bez podrske prilagodljivog entiteta, rjesenje bi zahtijevalo inzenjering zahtjev, pregled koda i implementaciju. To traje tjednima, a ne satima.

Za detaljniji pogled na to kako prilagodljivi ID-ovi stvaraju rizik u AI alatima za podrsku, pogledajte GDPR i vodic za AI podrsku.

Gdje se sire prilagodljivi ID-ovi

Interni ID-ovi pojavljuju se na vise mjesta nego sto vecina timova ocekuje.

Interni dokumenti:

  • Biljezke sa sastanaka s referencama na ID-ove racuna ili narudzbe
  • Nitima e-poste o korisnickim slucajevima
  • Prezentacije s podacima studija slucajeva

Dijeljeno s trecim stranama:

  • Izvjesca regulatorima s referentnim brojevima slucajeva
  • Revizijske datoteke s referencama kupaca
  • Datoteke dobavljaca koje nose korisnicke ID-ove

Istrazivanje i analitika:

  • Skupovi podataka o putu kupca
  • Izvozi pregleda kvalitete podrske
  • Podaci za trening internih ML modela

Svaki kontekst treba isto postavljanje prilagodljivog entiteta za stvaranje istinski anonimnog rezultata.

Pseudonimizacija vs. anonimizacija

GDPR povlaci jasnu liniju.

Pseudonimizacija zamjenjuje ID-ove zamjenama. Originalna osoba moze se pronaci opet ako netko ima tablicu za pretrazivanje. Ti podaci su i dalje osobni podaci. Smanjuje rizik. Ne ukida vase GDPR obveze.

Anonimizacija uklanja mogucnost reidentifikacije. Anonimni podaci nisu osobni podaci. GDPR se na njih ne primjenjuje.

Brojevi racuna i ID-ovi narudzbe su pseudonimizirani kada postoje tablice za pretrazivanje. Zamjena ih fiksnim zamjenama smanjuje rizik, ali GDPR se i dalje primjenjuje. Zamjena ih slucajnim tokenima - i brisanje kljuca - uklanja GDPR obvezu, ali lomi analizu zasnovanu na spajanju.

Za dijeljenje s trecim stranama kojima nedostaju vase tablice za pretrazivanje: pseudonimizacija moze biti dovoljna. Za internu analitiku, potrebna je potpuna anonimizacija ili stroge kontrole pristupa. Vodic za pravnu uskladjenost pokriva nacin dokumentiranja svakog pristupa za vas ROPA.

Zakljucak

Jaz nije propust alata. To je jaz u postavljanju. Nijedan alat ne moze znati vas format broja racuna ako mu ne kazete.

Postavljanje prilagodljivog entiteta zatvara jaz za satima. Timovi za uskladjenost definiraju formate, testiraju ih na uzornim podacima i primjenjuju ih u svim nacinom koristenja. Nije potrebna inzenjering pomoc.

180.000 neredaktiranih brojeva racuna nisu bili tu jer je alat zakazao. Bili su tu jer alatu nikada nije receno da ih trazi.

Izvori

Spremni za zaštitu vaših podataka?

Započnite anonimizaciju PII-a s 285+ vrsta entiteta na 48 jezika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.