By · Last updated 2026-04-27

Bumalik sa BlogGDPR & Pagsunod

Global PII: SSN, CPF, Aadhaar at Iba Pa

Naaangkop ang GDPR sa mga German Steuer-ID, French NIR, Swedish Personnummer, at 260+ pang uri ng identifier na hindi pa naririnig ng karamihan sa mga tool.

April 27, 20268 min basahin
global PII coverageEU identifier detectionSteuer-ID French NIRBrazilian CPF285+ entity types GDPR

Global PII: SSN, CPF, Aadhaar at Iba Pa

Ang Problema sa US-Centric na PII Tool

Karamihan sa mga PII tool ay binuo sa Estados Unidos. Nagtutok ang mga ito sa mga US na format ng data. Ang Social Security Number ay may siyam na digit sa format na AAA-BB-CCCC. Ang mga segment nito na area, group, at serial ay sumusunod sa mga dokumentadong patakaran. Mahusay na nahuhuli ng mga US-focused na tool ito. Nakikita rin nila ang mga US na numero ng telepono, email address, at driver's license. Nami-miss nila ang bawat pambansang ID na ginagamit sa labas ng US.

Hindi nagpapahintulot ang GDPR ng US-only na exemption. Kunin ang German Steuer-ID. Ito ay isang 11-digit na tax ID. Ibinibigay ito ng Bundeszentralamt fur Steuern. Ang panghuling digit nito ay isang checksum. Tinutukoy nito ang isang residente ng Germany tulad ng isang SSN na tumuturing sa isang Amerikanong mamamayan. Sinasaklaw ng GDPR Article 4 ang "anumang impormasyon na nauugnay sa isang natukoy o natutukoy na natural na tao." Ang Steuer-ID ay akma sa kahulugang iyon. Personal na data ito. Totoo iyon kahit kilala man o hindi ng iyong tool ang format.

Ang mga multa ng GDPR ay sumusunod sa EU-specific na PII exposure sa mga sistema na gumagamit ng US-only na tool. Totoo ang compliance gap. Nagresulta ang mga enforcement action. Tingnan ang aming GDPR compliance guide para sa konteksto.

Ang European Identifier Landscape

Malaki ang coverage gap. Narito ang isang bansa-sa-bansang breakdown.

Germany: Steuer-ID — 11 digit, checksum-validated. Sozialversicherungsnummer — 12 field, structured. Reisepass — 10 character na may mga authority code.

France: Ang NIR ang pambansang social security ID. Mayroon itong 15 digit. Nino-encode ng mga ito ang kasarian, taon ng kapanganakan, buwan ng kapanganakan, departamento, komuna, at isang check key. Ang SIRET ay may 14 na digit. Ang SIREN ay may siyam.

Sweden: Gumagamit ang Personnummer ng format na YYMMDD-XXXX. Sinasaklaw ng Samordningsnummer ang mga hindi residente. Ang halaga ng araw ay offset ng 60.

Norway: Ang Fodselsnummer ay may 11 na halaga sa format na DDMMYYNNNKK. Naka-encode ang kasarian sa gitnang grupo. Ang D-nummer ay nag-o-offset ng halaga ng araw ng 40.

Brazil: Ang CPF — Cadastro de Pessoas Fisicas — ay may 11 digit na may dalawang check value. Ang CNPJ ang 14-numero na business ID.

India: Ang Aadhaar ay isang 12-digit na biometric ID. Gumagamit ito ng Verhoeff check. Ang PAN ay isang 10-digit na tax ID na may mga titik at numero.

UAE: Ang Emirates ID ay may 15 numero sa format na 784-taon ng kapanganakan-sequence-check.

Isang global na HR team na sumasaklaw sa 12 bansa ay nangangailangan ng isang tool. Kailangan nito na hawakan ang lahat ng 12 pambansang format ng ID sa isang pass. Ang pagpapanatili ng mga hiwalay na regex library bawat bansa ay hindi magagawa.

Ang 285+ Entity Type Architecture

Sinasaklaw ng 285+ entity type library ang lahat ng EU member state na format. Sinasaklaw din nito ang mga pangunahing APAC ID. Kabilang dito ang Aadhaar, PAN, CPF, CNPJ, Emirates ID, at Thai citizen ID. Kasama rin ang mga US na format — SSN, EIN, state driver's license. Isang engine ang humahawak sa lahat. Ina-update ang library habang nagbabago ang mga format.

Ito ang agwat na iniiwanan ng karamihan sa mga tool. Tingnan ang entities reference upang suriin kung ano ang nasasaklaw. Para sa presyo ng API ayon sa dami, bisitahin ang pricing.

Mga Pinagmulan

Handa nang protektahan ang iyong data?

Simulan ang anonymization ng PII gamit ang 285+ uri ng entidad sa 48 wika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.