By · Last updated 2026-03-25

Atpakaļ uz BloguGDPR un Atbilstība

Viens rīks, 45 valstis: 260+ entītijas

Brazīlijas CPF satur pārbaudes ciparus. Indijas PAN ir 10 rakstzīmju burtciparu kods. ES IBAN formāti atšķiras katrā valstī. Globālas e-komercijas platformas nevar atļauties atsevišķus reģionālos rīkus.

March 25, 20267 min lasīšanai
global PII compliance260 entity typesBrazilian CPFIndian PANIBAN formats

Viens rīks, 45 valstis: 260+ entītijas

Globālas platformas vienlaikus apstrādā personas datus no daudzām valstīm. Katrai valstij ir savi ID formāti. Katram formātam ir savas noteikumu kopas. Vienam noteikšanas rīkam jātiek galā ar visiem. Lielākā daļa rīku ar to netiek.

Identifikatoru fragmentācijas problēma

Tirgus platforma ar pārdevējiem 45 valstīs saņem ļoti atšķirīgus reģistrācijas dokumentus. Brazīlijas pārdevējs iesniedz CPF. Tam ir 11 cipari. Divi no tiem ir pārbaudes cipari. Tie izmanto noteiktu svēruma formulu. Indijas pārdevējs iesniedz PAN. Tam ir 10 rakstzīmes. Burti un cipari atrodas fiksētās pozīcijās. Vācijas pārdevējs iesniedz Steuer-ID. Tam ir 11 cipari un Luhn kontrolsumma. Nīderlandes pārdevējs iesniedz BSN. Tam ir 9 cipari un izmanto mod-11 validāciju.

Katram formātam ir atšķirīgs garums un struktūra. Viens regulārās izteiksmes modelis, kas veidots vienam formātam, neatbilst pārējiem. Plašs "10-12 ciparu" modelis uztver pārāk daudz. Tas atzīmē cenas, datumus un atsauces numurus. Viltus pozitīvo rezultātu skaits strauji pieaug lielos apjomos.

40 identifikatoru plaisa

Vairums uzņēmumu klases PII rīku tiek piegādāti ar aptuveni 40 identifikatoru tipiem. Biežāk sastopamie ir:

  • ASV sociālās apdrošināšanas numurs
  • ASV pases formāts
  • ASV vadītāja apliecība
  • Vispārīgi kredītkaršu formāti ar Luhn validāciju
  • E-pasta adreses
  • Tālruņa numuri NANP formātā
  • IP adreses

Tie labi nodrošina Ziemeļamerikas atbilstību. Tie nesedz globālas darbības.

Kā plaisa izskatās pa reģioniem

Dienvidamerika: Brazīlijas CPF un CNPJ izmanto kontrolsummu algoritmus no Brazīlijas fiskālās iestādes. Argentīnas CUIT izmanto atšķirīgu svērto summu formulu. Kolumbijas NIT ir savs validācijas mehānisms. Neviens no tiem neatbilst ASV paraugiem.

Āzija: Indijas PAN, Aadhaar, GSTIN un vēlētāja ID katram ir atšķirīgs formāts. Japānas My Number satur 12 ciparus. Dienvidkorejas Iedzīvotāju reģistrācijas numurs un Ķīnas nacionālais ID katrs prasa savu atpazīšanas moduli.

ES dalībvalstis: Pilna ES pārklājuma nodrošināšanai nepieciešami IBAN formāti visām 27 dalībvalstīm. Katrai ir valstij raksturīgs garums un formāts. Tāpat vajadzīgs katras valsts nacionālā ID formāts. Tas ietver Vācijas Steuer-ID, Francijas NIR, Nīderlandes BSN, Polijas PESEL un Zviedrijas Personnummer. Kā arī Slovēnijas EMŠO, Horvātijas OIB, Bulgārijas EGN un Rumānijas CNP.

Ko aptver 260+ entītiju bibliotēka

260+ entītiju bibliotēka sedz visu 27 ES dalībvalstu nacionālos ID. Tā validē visus ES IBAN formātus. Aptver Dienvidamerikas ID: Brazīlijas CPF un CNPJ, Argentīnas CUIT, Kolumbijas NIT. Aptver Āzijas ID: Indijas PAN, Aadhaar, GSTIN, Japānas My Number, Korejas RRN. Aptver Apvienotās Karalistes ID: NI Number, NHS Number, NINO varianti. Aptver medicīnas ID: ASV NPI, DEA numuri, slimnīcu MRN formāti. Aptver finanšu ID: SWIFT kodi, BIC formāti, konta numuru paraugi.

Kāpēc noteikšanas pārklājums ir atbilstības jautājums

Katrs regulējums prasa, lai tā identifikatori tiktu atrasti un aizsargāti. GDPR aptver ES pārdevēju datus. LGPD aptver Brazīlijas pārdevēju datus. Indijas DPDP likums aptver Indijas pārdevēju datus.

"Atbilstoša aizsardzība" nozīmē, ka rīks atrada identifikatoru. Nepamanīts Aadhaar numurs nav konfigurācijas kļūme. Tas ir pārklājuma trūkums. Globālām platformām šī plaisa ir robeža starp daļēju atbilstību un reālu aizsardzību.

Viena izvietošana ar 260+ entītiju pārklājumu apstrādā visas šīs jurisdikcijas. Nav atsevišķu reģionālo rīku. Nav atsevišķu apstrādes cauruļvadu. Nav manuālas bagātināšanas formātiem, kurus 40 atpazinēju rīks nespēj aptvert.

Sīkāku informāciju par to, kā pārklājums saskan ar GDPR pienākumiem, skatiet GDPR atbilstības resursos. Par audita ierakstiem un atjaunināšanas politikām skatiet drošības un atbilstības informācijā.

Avoti

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.