By · Last updated 2026-04-27

Kembali ke BlogGDPR & Pematuhan

PII Global: SSN, CPF, Aadhaar & Lagi-lagi

GDPR terpakai kepada Steuer-ID Jerman, NIR Perancis, Personnummer Sweden, dan 260+ jenis pengenal lain yang kebanyakan alat tidak pernah dengar.

April 27, 20268 min baca
global PII coverageEU identifier detectionSteuer-ID French NIRBrazilian CPF285+ entity types GDPR

PII Global: SSN, CPF, Aadhaar & Lagi-lagi

Masalah Alat PII yang Berpusat di AS

Kebanyakan alat PII dibina di Amerika Syarikat. Ia menyasarkan format data AS. Nombor Keselamatan Sosial mempunyai sembilan digit dalam format AAA-BB-CCCC. Segmen kawasan, kumpulan, dan sirinya mengikuti peraturan yang didokumentasikan. Alat berorientasikan AS menangkapnya dengan baik. Mereka juga mengesan nombor telefon AS, alamat e-mel, dan lesen memandu. Mereka terlepas setiap ID kebangsaan yang digunakan di luar AS.

GDPR tidak membenarkan pengecualian hanya-AS. Ambil Steuer-ID Jerman. Ia adalah ID cukai 11 digit. Bundeszentralamt fur Steuern mengeluarkannya. Digit terakhirnya adalah checksum. Ia mengenal pasti pemastautin Jerman seperti SSN mengenal pasti warga Amerika. GDPR Artikel 4 meliputi "sebarang maklumat yang berkaitan dengan seseorang semula jadi yang dikenal pasti atau boleh dikenal pasti." Steuer-ID memenuhi takrifan tersebut. Ia adalah data peribadi. Itu benar sama ada alat anda mengetahui formatnya atau tidak.

Denda GDPR telah mengikuti pendedahan PII khusus EU dalam sistem yang menggunakan alat hanya-AS. Jurang pematuhan adalah nyata. Tindakan penguatkuasaan telah berlaku. Lihat panduan pematuhan GDPR kami untuk konteks.

Landskap Pengenal Eropah

Jurang liputan adalah besar. Berikut adalah pecahan mengikut negara.

Jerman: Steuer-ID -- 11 digit, disahkan checksum. Sozialversicherungsnummer -- 12 medan, berstruktur. Reisepass -- 10 aksara dengan kod autoriti.

Perancis: NIR adalah ID keselamatan sosial kebangsaan. Ia mempunyai 15 digit. Ia mengekod jantina, tahun lahir, bulan lahir, jabatan, komun, dan kunci semak. SIRET mempunyai 14 digit. SIREN mempunyai sembilan.

Sweden: Personnummer menggunakan format YYMMDD-XXXX. Samordningsnummer meliputi bukan pemastautin. Nilai hari diimbangi sebanyak 60.

Norway: Fodselsnummer mempunyai 11 nilai dalam format DDMMYYNNNKK. Jantina dikodkan dalam kumpulan tengah. D-nummer mengimbangi nilai hari sebanyak 40.

Brazil: CPF -- Cadastro de Pessoas Fisicas -- mempunyai 11 digit dengan dua nilai semak. CNPJ adalah ID perniagaan 14 nombor.

India: Aadhaar adalah ID biometrik 12 digit. Ia menggunakan semakan Verhoeff. PAN adalah ID cukai 10 digit dengan huruf dan nombor.

UAE: ID Emirates mempunyai 15 nombor dalam format 784-tahun lahir-urutan-semak.

Pasukan HR global yang merangkumi 12 negara memerlukan satu alat. Ia mesti mengendalikan semua 12 format ID kebangsaan dalam satu larian. Mengekalkan perpustakaan regex berasingan mengikut negara tidak praktikal.

Seni Bina 285+ Jenis Entiti

Perpustakaan 285+ jenis entiti meliputi semua format negara anggota EU. Ia juga meliputi ID APAC utama. Ini termasuk Aadhaar, PAN, CPF, CNPJ, ID Emirates, dan ID warga Thailand. Format AS -- SSN, EIN, lesen memandu negeri -- turut disertakan. Satu enjin mengendalikan semuanya. Perpustakaan dikemaskini apabila format berubah.

Inilah jurang yang kebanyakan alat tinggalkan terbuka. Lihat rujukan entiti untuk menyemak apa yang diliputi. Untuk harga API mengikut volum, lawati harga.

Sumber

Sedia untuk melindungi data anda?

Mulakan pengenalan PII dengan 285+ jenis entiti dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.