By · Last updated 2026-05-31

Tagasi BlogisseGDPR ja Vastavus

Kaugemal SSN-idest: organisatsiooni sisemiste ID-de anonüümiseerimine

Igal organisatsioonil on sisemised identifikaatorid - töötajate ID-d, kontonumbrid, tellimuste ID-d - mis on kontekstis isikuandmed, kuid standardsed tööriistad jätavad vahele.

May 31, 20267 min lugemist
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

Kaugemal SSN-idest: organisatsiooni sisemiste ID-de anonüümiseerimine

Sinu GDPR-tööriist eemaldab e-posti aadressid. See eemaldab telefoninumbrid. See eemaldab nimed. Sa käivitad läbi selle tugiekspordi. Seejärel jagad väljundit oma analüütikameeskonnaga.

Sinu klientide kontonumbrid on ikka igas piletis. Sinu tellimuste ID-d on ikka seal. Sinu sisemised kasutajate ID-d on seal samuti.

Need ID-d näivad omaette kahjutud. Ilma otsingutabelita ei nimeta need isikut. Kuid sinu analüütikameeskonnal on see tabel. Sinu CRM-il on see. Sinu tugidbaasil on see. Igaüks, kellel on juurdepääs, leiab isiku sekunditega.

See on GDPR-rikkumine. Tööriist ei ebaõnnestunud. Talle lihtsalt ei öeldud, et otsida sinu ID-sid.

Mida standardsed isikuandmete tööriistad tuvastavad

Standardsed isikuandmete tööriistad hõlmavad universaalseid formaate. Nad tuvastavad seda, mida iga organisatsioon kasutab.

Standardsed tööriistad tuvastavad:

  • Sotsiaalkindlustuse numbrid (USA SSN-id, UK NINO-d, EL-i riiklikud ID-vormingud)
  • E-posti aadressid
  • Telefoninumbrid
  • Krediitkaardi numbrid
  • Nimed
  • Passi ja juhiloa numbrid

Standardsed tööriistad ei tuvasta:

  • Töötajate ID-sid sinu EMP-XXXXX vormingus
  • Klientide kontonumbreid sinu ACC-XXXXXXXX-XX vormingus
  • Tellimuste ID-sid sinu ORD-XXXXXXX vormingus
  • Sisemisi kasutajate ID-sid UUID või kohandatud vormingutes
  • Partnerite spetsiifilisi viitekoodid

Standardsed tööriistad leiavad universaalseid mustreid. Sinu sisemised ID-d ei ole universaalsed. Nende leidmiseks on vaja kohandatud seadistust.

Taasidentifitseerimise risk

Firma ekspordib tugipileted kvaliteedi ülevaatuseks. Standardne isikuandmete eemaldamine kustutab nimed, e-kirjad ja telefoninumbrid. Kontonumbreid ACC-XXXXXXXX-XX vormingus ei puudutata.

Eksport läheb analüütikameeskonnale. Analüütik ühendab pileti tabeli kliendiandmebaasiga kontonumbri alusel. Isik leitakse kohe. Erilist trikki pole vaja. See on tavaline SQL-liitmine.

GDPR artikkel 4(5) määratleb pseudonüümiseerimise töötlemisena, kus andmeid "ei saa enam konkreetse andmesubjektiga seostada ilma täiendava teabe kasutamiseta". Kontonumbrid ei läbi seda testi. Täiendav teave - sinu kliendiandmebaas - on otse sinu organisatsioonis olemas.

"Anonüümiseeritud" eksport ei olnud anonüümne.

Kohandatud olemimustrite loomine

Kohandatud olemite seadistamine on kiire. Vastavusmeeskonnad saavad seda teha ilma inseneride abita.

Samm 1: Loetle oma ID-vormingud.

Kirjuta iga üks üles. Näiteks: konto ACC-XXXXXXXX-XX, tellimuse ID ORD-XXXXXXX, töötaja ID EMP-XXXXX.

Samm 2: Kirjelda vormingut lihtsas keeles.

"Kontonumbrid algavad ACC-iga, seejärel sidekriips, seejärel 8 numbrit, seejärel sidekriips, seejärel 2 suurtähte."

AI-põhine mustri genereerimine tagastab: ACC-\d{8}-[A-Z]{2}

Samm 3: Testi näidisandmetel.

Laadi üles 20-30 dokumenti. Kinnita, et kõik eksemplarid on leitud. Kinnita, et valepositiivseid pole.

Samm 4: Vali meetod.

ID-de jaoks, mida kasutatakse liitmise võtmetena, kus analüüs vajab kirjete linkimist:

  • Pseudonüümiseeri. Asenda ACC-00123456-AB alati ACC-99876543-XY-ga. Sama sisend annab alati sama väljundi. Liitmised töötavad ikka. Algset väärtust ei saa leida ilma võtmeta.

ID-de jaoks, mida analüüsis pole vaja:

  • Redakteeri. Asenda [REDACTED]-iga. Lihtne. Püsiv.

Samm 5: Salvesta jagatud eelseadistusena.

Salvesta kohandatud olem - või komplekt neist - jagatud eelseadistusena. Seadistus kehtib kõikidele kasutusviisidele: pakktöötluse üleslaadimine, API-kõned, brauseri liides. Uued meeskonnaliikmed saavad täieliku konfiguratsiooni kohe.

Juhtumiuuring: 180 000 tugipilefit

Firma leidis oma analüütika laohoonest 180 000 tugipiletti. Nimed ja e-kirjad olid eemaldatud. Kontonumbreid polnud. Iga pilet sisaldas ikka elavat ACC-XXXXXXXX-XX väärtust.

Lahenduse ajakava:

  1. Vastavusametnik määratleb ACC-mustri - 15 minutit
  2. Testib seda 30 näidispiletil - 20 minutit
  3. Kinnitab täpsuse - 10 minutit
  4. Töötleb 180 000 piletit üleöise pakkina
  5. Asendab laohoonetabelid puhta versiooniga

Koguaeg vastamusametnikule: 45 minutit. Ilma kohandatud olemite toeta oleks parandus nõudnud inseneritöö piletit, koodi ülevaatust ja juurutamist. See võtab nädalaid, mitte tunde.

Täpsema pilgu saamiseks, kuidas kohandatud ID-d tekitavad riski AI-tugitoolides, vaata GDPR ja tugiteenuste AI juhend.

Kus kohandatud ID-d levivad

Sisemised ID-d esinevad rohkemates kohtades, kui enamik meeskondi ootab.

Sisedokumendid:

  • Koosoleku märkmed konto- või tellimuse ID viidetega
  • E-posti lõimed kliendikaasuste kohta
  • Esitlused juhtumianalüüsi andmetega

Kolmandate osapooltega jagamine:

  • Aruanded regulaatoritele juhtumi viitenumbritega
  • Auditi failid klientide viidetega
  • Tarnija failid, mis kannavad klientide ID-sid

Uurimine ja analüütika:

  • Kliendi teekonna andmestikud
  • Tugiteenuste kvaliteedi ülevaatuse ekspordid
  • Treeningandmed sisemistele ML-mudelitele

Iga kontekst vajab sama kohandatud olemite seadistust, et toota tõeliselt anonüümset väljundit.

Pseudonüümiseerimine vs. anonüümiseerimine

GDPR tõmbab selge joone.

Pseudonüümiseerimine asendab ID-d asendajatega. Algset isikut saab leida uuesti, kui kellelgi on otsingutabel. Need andmed on ikka isikuandmed. See vähendab riski. See ei eemalda sinu GDPR-kohustusi.

Anonüümiseerimine eemaldab võime taasidentifitseerida. Anonüümsed andmed ei ole isikuandmed. GDPR ei kehti nende suhtes.

Kontonumbrid ja tellimuste ID-d on pseudonüümsed, kui otsingutabelid eksisteerivad. Nende asendamine fikseeritud asendajatega alandab riski, kuid GDPR kehtib ikka. Nende asendamine juhuslike märkidega - ja võtme kustutamine - eemaldab GDPR-kohustuse, kuid katkestab liitmisel põhineva analüüsi.

Kolmandate osapooltega jagamiseks, kellel pole sinu otsingutabeleid: pseudonüümiseerimine võib olla piisav. Sisemiseks analüütikaks on vaja täielikku anonüümiseerimist või ranget juurdepääsukontrolli. Õigusliku vastavuse juhend käsitleb seda, kuidas iga lähenemist oma ROPA jaoks dokumenteerida.

Kokkuvõte

Lünk ei ole tööriista tõrge. See on seadistuse lünk. Ükski tööriist ei suuda teada sinu kontonumbri vormingut, kui sa talle seda ei ütle.

Kohandatud olemite seadistamine sulgeb lünga tundidega. Vastavusmeeskonnad määratlevad vormingud, testavad neid näidisandmetel ja rakendavad neid kõigil kasutusviisidel. Inseneride abi pole vaja.

180 000 redakteerimata kontonumbrit polnud seal seetõttu, et tööriist ebaõnnestus. Need olid seal seetõttu, et tööriistale ei öeldud neid otsida.

Allikad

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.