Mga EU National ID na Napalampas ng Iyong Tool ng PII
Ang mga numero ng tax ID ay napaka-sensitibo. Lumilitaw ang mga ito sa mga payslip, mga form ng buwis, at mga aplikasyon sa bangko. Kung sila ay nailabas, nagbibigay-daan sila sa panloloko at pagnanakaw ng pagkakakilanlan.
Itinuturing ng GDPR ang mga ito bilang personal na datos. Ang kanilang tunay na panganib sa mundo ay mataas. Bawat bansang EU ay gumagamit ng sariling format ng pambansang identifier. Karamihan sa mga tool ng PII ay itinayo para sa merkado ng US o UK. Madali nilang nahahanap ang mga SSN at NINO. Madalas nilang napalampas ang Steueridentifikationsnummer, Codice Fiscale, at BSN. Ito ay mga format na pinoproseso ng mga European team araw-araw.
Ang Landscape ng EU Tax ID
Ang bawat bansang EU ay may sariling format. Narito ang mga pinakakaraniwang format.
Germany - Steueridentifikationsnummer
Ang Steuer-ID ay 11 digit. Itinalaga ito sa kapanganakan. Ang unang digit ay 1-9 (hindi kailanman 0). Walang tatlong magkaparehong digit ang lumalabas nang sunud-sunod. Halimbawa: 12345678901. Ginagamit din ang Steuernummer: 10-11 digit, nag-iiba ang format ayon sa estado.
France - Numero fiscal de reference
Ang SPI ay 13 digit. Inilalabas ito ng DGFiP, ang awtoridad sa buwis ng Pransya. Sa mga dokumento ng buwis ito ay lumalabas bilang "Identifiant fiscal".
Italy - Codice Fiscale
Ang Codice Fiscale ay 16 alphanumeric na character. Ini-encode nito ang apelyido, pangalan, taon ng kapanganakan, buwan ng kapanganakan, araw ng kapanganakan, at munisipalidad. Halimbawa: RSSMRA85M01H501Z. Ang format ay mabe-verify ng checksum.
Spain - NIF at NIE
Ginagamit ng mga mamamayang Espanyol ang numero ng DNI kasama ang isang check letter: 8 digit + titik, hal. 12345678A. Ang mga dayuhang naninirahan ay gumagamit ng NIE: prefix X/Y/Z + 7 digit + check letter, hal. X1234567A. Ang mga entidad ay gumagamit ng CIF: titik + 8 digit, hal. B12345678.
Netherlands - BSN
Ang BSN (Burgerservicenummer) ay 9 digit. Gumagamit ito ng 11-proef check-digit algorithm. Napaka-karaniwan nito sa mga dokumento ng payroll at benepisyo.
Poland - PESEL
Ang PESEL ay 11 digit. Ang unang 6 ay nag-e-encode ng petsa ng kapanganakan. Ang mga huling digit ay nag-e-encode ng kasarian at sequence.
Belgium - Numero de registre national
Ang RN ay 11 digit. Ini-encode nito ang petsa ng kapanganakan, sequence, at mga check digit.
Portugal - NIF
Ang Portuguese NIF (Numero de Identificacao Fiscal) ay 9 digit na may check digit. Ang abbreviation ay pareho sa NIF ng Spain ngunit ang format ay iba.
Sweden - Personnummer
Ang Personnummer ay 10 o 12 digit. Ini-encode nito ang petsa ng kapanganakan at isang sequence number. Mga format: YYYYMMDD-XXXX o YYMMDD-XXXX.
Finland - Henkilotunnus
Ang HETU ay 11 character. Ini-encode nito ang petsa, isang separator, isang sequence, at isang check character. Format: DDMMYY-XXXC.
Ang Napalampas ng Mga Karaniwang Tool
Kasama ang mga pattern na ito bilang default ang mga tool ng US at UK:
- US SSN (XXX-XX-XXXX).
- UK NINO (XX 99 99 99 X).
- Mga numero ng pasaporte ng US.
- Mga pattern ng lisensya sa pagmamaneho ng US.
- Mga pangunahing numero ng credit card.
Ang mga pambansang identifier ng EU ay madalas na wala. Ang mga tool na itinayo sa default na set ng recognizer ng Presidio ay nagpapalampas ng mga ito. Nang walang mga EU-specific na extension, walang coverage ng EU.
Isang Tunay na Compliance Gap
Isang kumpanya ng payroll ng Aleman ang nagsisilbi sa 500 client na kumpanya. Ang kanyang workflow ay nag-aalis ng mga pangalan, email, IBAN, at numero ng telepono. Ngunit nagpapalampas ito ng mga German Steueridentifikationsnummer. Ang format na iyon ay hindi kailanman nasa karaniwang setup.
Isang DPA audit ang nakakahanap ng hindi na-redact na mga Steuer-ID sa mga PDF ng payslip. Ang kumpanya ay nahaharap sa mga gastos sa remediation para sa mga nakaraang dokumento. Nahaharap ito sa enforcement ng DPA sa ilalim ng GDPR Article 83. Nahaharap ito sa contractual na pananagutan sa mga kliyente nito.
Ang gap ay hindi natagpuan ng kumpanya. Una itong nahanap ng regulator.
Tingnan ang aming GDPR conformance guide upang mapatakbo ang iyong sariling coverage check.
Order ng Priyoridad para sa EU Coverage
Magdagdag ng mga pattern ng identifier sa order na ito kung nagpapatakbo ka sa maraming bansang EU.
Tier 1 - Pinakamataas na dami:
- Germany: Steueridentifikationsnummer.
- France: Numero fiscal.
- Italy: Codice Fiscale.
- Spain: NIF/NIE.
- Netherlands: BSN.
Tier 2 - Makabuluhan ngunit mas maliliit na merkado:
- Poland: PESEL.
- Belgium: RN.
- Sweden: Personnummer.
- Portugal: NIF.
- Austria: Sozialversicherungsnummer.
Tier 3 - Mga tiyak na kaso ng paggamit:
Ang natitirang 17 miyembro ng EU. Magdagdag batay sa kung saan pinoproseso ng iyong team ang datos.
Pagdaragdag ng Steueridentifikationsnummer
Ang German Steuer-ID ang pinakamahusay na unang pattern na idaragdag. Ang format nito ay malinaw at well-documented.
Ang Steuer-ID ay 11 digit. Ang unang digit ay 1-9. Walang tatlong magkaparehong digit ang lumalabas nang sunud-sunod. Ang isang custom na algorithm ay nagva-validate ng check digit.
Paglalarawan sa simpleng wika para sa paglikha ng pattern: "Mga numero ng buwis ng Aleman: 11 digit. Ang unang digit ay 1-9. Ang iba pang 10 digit ay maaaring magsama ng mga zero."
Pagkatapos makabuo ng pattern, subukan ito laban sa mga German payslip at sertipiko ng buwis. Suriin ang rate ng detection at rate ng maling positibo. Mag-deploy lamang pagkatapos mapasa ng validation.
Idagdag ang pattern sa iyong preset na nagsasalita ng Aleman. Para sa mga mixed-language na set ng dokumento, ipares ito sa language detection. Inilalapat nito ang mga tamang pattern sa mga tamang dokumento.
Isang Preset o Marami?
Opsyon 1 - Mga preset na tiyak sa bansa:
Gumawa ng isang preset bawat bansa. Mag-route ng mga dokumento ayon sa pinagmulan. Nagbibigay ito ng mas mababang rate ng maling positibo. Nangangailangan ito ng higit pang routing logic.
Opsyon 2 - Combined EU preset:
Gumawa ng isang preset na may lahat ng aktibong pattern ng EU identifier. Mas simple itong patakbuhin. Mas mataas ang panganib ng maling positibo sa generic na teksto. Gumagana nang maayos kapag inaasahan ang mga identifier sa buong dokumento.
Para sa mga dokumento ng payroll: gamitin ang Opsyon 1 na may routing ayon sa pinagmulan. Para sa mga mixed na set ng dokumento: gamitin ang Opsyon 2 na may pag-tune ng threshold.
Tingnan ang security and compliance overview para sa kung paano naaangkop ang configuration ng preset sa isang buong workflow ng compliance.
Isarado ang Gap Bago ang Audit
Naaangkop ang GDPR sa parehong paraan sa bawat miyembro ng EU. Ang mga tool na itinayo sa US ay madalas na hindi. Ang Codice Fiscale, BSN, at Steuer-ID ay nagdadala ng parehong panganib tulad ng SSN. Lumilitaw ang mga ito nang madalas din sa mga ibinabahaging dokumento.
Ang mga custom entity pattern ay nagsasara ng detection gap sa loob ng ilang oras. Magdagdag ng pattern ng Steuer-ID. Subukan ito laban sa sample na German payslip. I-deploy ito sa lahat ng workflow. Walang paghihintay sa vendor ng tool. Walang DPA audit na kailangan upang mahanap ang gap.
Hinahayaan ka ng anonym.legal na magdagdag ng mga custom entity type sa pamamagitan ng preset configuration interface. Ang mga pattern ay bina-validate laban sa iyong mga sample na dokumento bago mag-deploy.
Mga Sanggunian
- Bundeszentralamt fur Steuern: Steueridentifikationsnummer. VERIFIED-EXTERNAL.
- GDPR Articles 4, 9, 32 - gdpr-info.eu. VERIFIED-EXTERNAL.
- EDPB: Guidelines on Supervisory Authority Competence. VERIFIED-EXTERNAL.