By · Last updated 2026-03-25

Takaisin BlogiinGDPR & Vaatimustenmukaisuus

Yksi työkalu, 45 maata: 260+ entiteettiä

Brasilian CPF:llä on tarkistusnumerot. Intian PAN on 10-merkkinen aakkosnumeerinen koodi. EU:n IBAN-numerot vaihtelevat maittain. Globaalit verkkokauppa-alustat eivät voi leistää erillisiä ratkaisuja jokaiselle.

March 25, 20267 min lukuaika
global PII compliance260 entity typesBrazilian CPFIndian PANIBAN formats

Yksi työkalu, 45 maata: 260+ entiteettiä

Globaaleilla alustoilla käsitellään samanaikaisesti useiden maiden henkilötietoja. Jokaisella maalla on omat tunnisteformaattinsa. Jokaisella formaatilla on omat sääntönsä. Yhden tunnistustyökalun täytyy hallita kaikki nämä. Useimmat työkalut eivät pysty siihen.

Tunnisteiden hajanaisuusongelma

Markkinapaikka, jossa on myyjiä 45 maasta, saa varsin erilaisia rekisteröitymisasiakirjoja. Brasilialainen myyjä toimittaa CPF:n. Siinä on 11 numeroa, joista kaksi on tarkistusnumeroita. Ne käyttävät tiettyä painotuskaavaa. Intialainen myyjä toimittaa PAN-numeron. Siinä on 10 merkkiä. Kirjaimet ja numerot esiintyvät kiinteissä asemissa. Saksalainen myyjä toimittaa Steuer-ID:n. Siinä on 11 numeroa ja Luhn-tarkistussumma. Hollantilainen myyjä toimittaa BSN:n. Siinä on 9 numeroa ja se käyttää mod-11-vahvistusta.

Jokaisella formaatilla on eri pituus ja rakenne. Yhtä formaattia varten rakennettu regex ei vastaa muita. Laaja "10–12 numeron" kuvio nappaa liikaa — se merkitsee hinnat, päivämäärät ja viitenumerot. Väärät positiiviset kasvavat nopeasti suuressa mittakaavassa.

40-tunnisteen puute

Useimmat yritystason henkilötietotyökalut toimittavat noin 40 tunnistustyyppiä. Yleisiä ovat:

  • Yhdysvaltain sosiaaliturvatunnus
  • Yhdysvaltain passimuoto
  • Yhdysvaltain ajokortti
  • Yleiset luottokorttiformaatit Luhn-vahvistuksella
  • Sähköpostiosoitteet
  • Puhelinnumerot NANP-muodossa
  • IP-osoitteet

Nämä kattavat Pohjois-Amerikan vaatimustenmukaisuuden hyvin. Ne eivät kata globaalia toimintaa.

Miltä puute näyttää alueittain

Etelä-Amerikka: Brasilian CPF ja CNPJ käyttävät Brasilian veroviranomaisen tarkistusalgoritmeja. Argentiinan CUIT käyttää erilaista painotetun summan kaavaa. Kolumbian NIT:llä on oma vahvistusmenetelmänsä. Mikään näistä ei vastaa yhdysvaltalaisia malleja.

Aasia: Intian PAN, Aadhaar, GSTIN ja äänestäjäkortti ovat kukin erillisessä muodossa. Japanin My Number on 12-numeroinen. Etelä-Korean henkilötunnus ja Kiinan kansallinen tunniste vaativat kukin oman tunnistajansa.

EU:n jäsenvaltiot: Kattava EU-kattavuus edellyttää IBAN-muotoja kaikille 27 jäsenvaltiolle. Jokaisella on maakohtainen pituus ja muoto. Tarvitaan myös jokainen kansallinen tunnitemuoto — mukaan lukien Saksan Steuer-ID, Ranskan NIR, Hollannin BSN, Puolan PESEL ja Ruotsin Personnummer, sekä Slovenian EMŠO, Kroatian OIB, Bulgarian EGN ja Romanian CNP.

Mitä 260+ entiteettiä kattaa

Yli 260 entiteetin kirjasto kattaa kaikkien 27 EU:n jäsenvaltion kansalliset tunnisteet. Se vahvistaa kaikki EU:n IBAN-muodot. Se kattaa Etelä-Amerikan tunnisteet: Brasilian CPF ja CNPJ, Argentiinan CUIT, Kolumbian NIT. Se kattaa aasialaiset tunnisteet: Intian PAN, Aadhaar, GSTIN, Japanin My Number, Korean RRN. Se kattaa brittiläiset tunnisteet: NI-numero, NHS-numero, NINO-variantit. Se kattaa lääketieteelliset tunnisteet: Yhdysvaltain NPI, DEA-numerot, sairaaloidenMRN-muodot. Se kattaa taloudelliset tunnisteet: SWIFT-koodit, BIC-muodot, tilinumerokuviot.

Miksi tunnistuskattavuus on vaatimustenmukaisuuskysymys

Jokainen kehys edellyttää, että sen tunnisteet löydetään ja suojataan. GDPR kattaa EU:n myyjätiedot. LGPD kattaa brasilialaisten myyjien tiedot. Intian DPDP Act kattaa intialaisten myyjien tiedot.

"Asianmukainen suojaus" tarkoittaa, että työkalu löysi tunnisteen. Puuttuva Aadhaar ei ole konfigurointivirhe. Se on kattavuusvirhe. Globaaleille alustoille se ero tarkoittaa osittaisen vaatimustenmukaisuuden ja todellisen suojauksen välistä eroa.

Yksi käyttöönotto, jossa on 260+ entiteettikattavuus, hoitaa kaikki nämä lainkäyttöalueet — ei erillisiä alueellisia työkaluja, ei erillisiä käsittelyputkia eikä manuaalista rikastamista formaateille, jotka 40-tunnistajan työkalu jättää huomaamatta.

Lisätietoja siitä, miten kattavuus vastaa GDPR-velvoitteita, löytyy GDPR-vaatimustenmukaisuusresursseistamme. Auditointipolusta ja päivityskäytännöistä löydät tietoa tietoturva- ja vaatimustenmukaisuussivulta.

Lähteet

Valmiina suojaamaan tietojasi?

Aloita PII-anonymisointi yli 285 entiteettityypillä 48 kielellä.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.