By · Last updated 2026-06-01

Bumalik sa BlogGDPR & Pagsunod

Mga EU National ID na Napalampas ng Iyong Tool ng PII

Ang Steueridentifikationsnummer ng Germany, Numero fiscal ng France, Codice Fiscale ng Italy, NIF/NIE ng Spain - ang mga tool ng PII na nakatuon sa US ay madaling nakaka-detect ng SSN ngunit napalampas ang karamihan ng EU identifier.

June 1, 20267 min basahin
EU national identifiersSteueridentifikationsnummerCodice FiscaleNIFmultinational GDPRtax ID detection

Mga EU National ID na Napalampas ng Iyong Tool ng PII

Ang mga numero ng tax ID ay napaka-sensitibo. Lumilitaw ang mga ito sa mga payslip, mga form ng buwis, at mga aplikasyon sa bangko. Kung sila ay nailabas, nagbibigay-daan sila sa panloloko at pagnanakaw ng pagkakakilanlan.

Itinuturing ng GDPR ang mga ito bilang personal na datos. Ang kanilang tunay na panganib sa mundo ay mataas. Bawat bansang EU ay gumagamit ng sariling format ng pambansang identifier. Karamihan sa mga tool ng PII ay itinayo para sa merkado ng US o UK. Madali nilang nahahanap ang mga SSN at NINO. Madalas nilang napalampas ang Steueridentifikationsnummer, Codice Fiscale, at BSN. Ito ay mga format na pinoproseso ng mga European team araw-araw.

Ang Landscape ng EU Tax ID

Ang bawat bansang EU ay may sariling format. Narito ang mga pinakakaraniwang format.

Germany - Steueridentifikationsnummer

Ang Steuer-ID ay 11 digit. Itinalaga ito sa kapanganakan. Ang unang digit ay 1-9 (hindi kailanman 0). Walang tatlong magkaparehong digit ang lumalabas nang sunud-sunod. Halimbawa: 12345678901. Ginagamit din ang Steuernummer: 10-11 digit, nag-iiba ang format ayon sa estado.

France - Numero fiscal de reference

Ang SPI ay 13 digit. Inilalabas ito ng DGFiP, ang awtoridad sa buwis ng Pransya. Sa mga dokumento ng buwis ito ay lumalabas bilang "Identifiant fiscal".

Italy - Codice Fiscale

Ang Codice Fiscale ay 16 alphanumeric na character. Ini-encode nito ang apelyido, pangalan, taon ng kapanganakan, buwan ng kapanganakan, araw ng kapanganakan, at munisipalidad. Halimbawa: RSSMRA85M01H501Z. Ang format ay mabe-verify ng checksum.

Spain - NIF at NIE

Ginagamit ng mga mamamayang Espanyol ang numero ng DNI kasama ang isang check letter: 8 digit + titik, hal. 12345678A. Ang mga dayuhang naninirahan ay gumagamit ng NIE: prefix X/Y/Z + 7 digit + check letter, hal. X1234567A. Ang mga entidad ay gumagamit ng CIF: titik + 8 digit, hal. B12345678.

Netherlands - BSN

Ang BSN (Burgerservicenummer) ay 9 digit. Gumagamit ito ng 11-proef check-digit algorithm. Napaka-karaniwan nito sa mga dokumento ng payroll at benepisyo.

Poland - PESEL

Ang PESEL ay 11 digit. Ang unang 6 ay nag-e-encode ng petsa ng kapanganakan. Ang mga huling digit ay nag-e-encode ng kasarian at sequence.

Belgium - Numero de registre national

Ang RN ay 11 digit. Ini-encode nito ang petsa ng kapanganakan, sequence, at mga check digit.

Portugal - NIF

Ang Portuguese NIF (Numero de Identificacao Fiscal) ay 9 digit na may check digit. Ang abbreviation ay pareho sa NIF ng Spain ngunit ang format ay iba.

Sweden - Personnummer

Ang Personnummer ay 10 o 12 digit. Ini-encode nito ang petsa ng kapanganakan at isang sequence number. Mga format: YYYYMMDD-XXXX o YYMMDD-XXXX.

Finland - Henkilotunnus

Ang HETU ay 11 character. Ini-encode nito ang petsa, isang separator, isang sequence, at isang check character. Format: DDMMYY-XXXC.

Ang Napalampas ng Mga Karaniwang Tool

Kasama ang mga pattern na ito bilang default ang mga tool ng US at UK:

  • US SSN (XXX-XX-XXXX).
  • UK NINO (XX 99 99 99 X).
  • Mga numero ng pasaporte ng US.
  • Mga pattern ng lisensya sa pagmamaneho ng US.
  • Mga pangunahing numero ng credit card.

Ang mga pambansang identifier ng EU ay madalas na wala. Ang mga tool na itinayo sa default na set ng recognizer ng Presidio ay nagpapalampas ng mga ito. Nang walang mga EU-specific na extension, walang coverage ng EU.

Isang Tunay na Compliance Gap

Isang kumpanya ng payroll ng Aleman ang nagsisilbi sa 500 client na kumpanya. Ang kanyang workflow ay nag-aalis ng mga pangalan, email, IBAN, at numero ng telepono. Ngunit nagpapalampas ito ng mga German Steueridentifikationsnummer. Ang format na iyon ay hindi kailanman nasa karaniwang setup.

Isang DPA audit ang nakakahanap ng hindi na-redact na mga Steuer-ID sa mga PDF ng payslip. Ang kumpanya ay nahaharap sa mga gastos sa remediation para sa mga nakaraang dokumento. Nahaharap ito sa enforcement ng DPA sa ilalim ng GDPR Article 83. Nahaharap ito sa contractual na pananagutan sa mga kliyente nito.

Ang gap ay hindi natagpuan ng kumpanya. Una itong nahanap ng regulator.

Tingnan ang aming GDPR conformance guide upang mapatakbo ang iyong sariling coverage check.

Order ng Priyoridad para sa EU Coverage

Magdagdag ng mga pattern ng identifier sa order na ito kung nagpapatakbo ka sa maraming bansang EU.

Tier 1 - Pinakamataas na dami:

  1. Germany: Steueridentifikationsnummer.
  2. France: Numero fiscal.
  3. Italy: Codice Fiscale.
  4. Spain: NIF/NIE.
  5. Netherlands: BSN.

Tier 2 - Makabuluhan ngunit mas maliliit na merkado:

  1. Poland: PESEL.
  2. Belgium: RN.
  3. Sweden: Personnummer.
  4. Portugal: NIF.
  5. Austria: Sozialversicherungsnummer.

Tier 3 - Mga tiyak na kaso ng paggamit:

Ang natitirang 17 miyembro ng EU. Magdagdag batay sa kung saan pinoproseso ng iyong team ang datos.

Pagdaragdag ng Steueridentifikationsnummer

Ang German Steuer-ID ang pinakamahusay na unang pattern na idaragdag. Ang format nito ay malinaw at well-documented.

Ang Steuer-ID ay 11 digit. Ang unang digit ay 1-9. Walang tatlong magkaparehong digit ang lumalabas nang sunud-sunod. Ang isang custom na algorithm ay nagva-validate ng check digit.

Paglalarawan sa simpleng wika para sa paglikha ng pattern: "Mga numero ng buwis ng Aleman: 11 digit. Ang unang digit ay 1-9. Ang iba pang 10 digit ay maaaring magsama ng mga zero."

Pagkatapos makabuo ng pattern, subukan ito laban sa mga German payslip at sertipiko ng buwis. Suriin ang rate ng detection at rate ng maling positibo. Mag-deploy lamang pagkatapos mapasa ng validation.

Idagdag ang pattern sa iyong preset na nagsasalita ng Aleman. Para sa mga mixed-language na set ng dokumento, ipares ito sa language detection. Inilalapat nito ang mga tamang pattern sa mga tamang dokumento.

Isang Preset o Marami?

Opsyon 1 - Mga preset na tiyak sa bansa:

Gumawa ng isang preset bawat bansa. Mag-route ng mga dokumento ayon sa pinagmulan. Nagbibigay ito ng mas mababang rate ng maling positibo. Nangangailangan ito ng higit pang routing logic.

Opsyon 2 - Combined EU preset:

Gumawa ng isang preset na may lahat ng aktibong pattern ng EU identifier. Mas simple itong patakbuhin. Mas mataas ang panganib ng maling positibo sa generic na teksto. Gumagana nang maayos kapag inaasahan ang mga identifier sa buong dokumento.

Para sa mga dokumento ng payroll: gamitin ang Opsyon 1 na may routing ayon sa pinagmulan. Para sa mga mixed na set ng dokumento: gamitin ang Opsyon 2 na may pag-tune ng threshold.

Tingnan ang security and compliance overview para sa kung paano naaangkop ang configuration ng preset sa isang buong workflow ng compliance.

Isarado ang Gap Bago ang Audit

Naaangkop ang GDPR sa parehong paraan sa bawat miyembro ng EU. Ang mga tool na itinayo sa US ay madalas na hindi. Ang Codice Fiscale, BSN, at Steuer-ID ay nagdadala ng parehong panganib tulad ng SSN. Lumilitaw ang mga ito nang madalas din sa mga ibinabahaging dokumento.

Ang mga custom entity pattern ay nagsasara ng detection gap sa loob ng ilang oras. Magdagdag ng pattern ng Steuer-ID. Subukan ito laban sa sample na German payslip. I-deploy ito sa lahat ng workflow. Walang paghihintay sa vendor ng tool. Walang DPA audit na kailangan upang mahanap ang gap.


Hinahayaan ka ng anonym.legal na magdagdag ng mga custom entity type sa pamamagitan ng preset configuration interface. Ang mga pattern ay bina-validate laban sa iyong mga sample na dokumento bago mag-deploy.

Mga Sanggunian

Handa nang protektahan ang iyong data?

Simulan ang anonymization ng PII gamit ang 285+ uri ng entidad sa 48 wika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.