Shoda GDPR napříč členskými státy EU: Které národní identifikátory váš nástroj PII přehlíží
Daňová identifikační čísla patří k nejcitlivějším osobním identifikátorům v jakékoli jurisdikci. Používají se pro daňové výkazy, státní dávky, ověření zaměstnání a otevírání finančních účtů. Ve špatných rukou umožňují krádež identity, podvody a neoprávněné žádosti o dávky.
GDPR je kategorizuje jako běžná osobní data (nikoli zvláštní kategorie), ale jejich citlivost je vysoká a jejich expozice vytváří značné riziko v reálném světě.
Přehled národních daňových identifikátorů EU
Německo: Steueridentifikationsnummer a Steuernummer
Steueridentifikationsnummer (IdNr):
- Formát: 11 číslic (žádné pomlčky)
- Ověření: algoritmus Luhn jako číselná kontrola
- Přiděleno při narození nebo registraci; celoživotní identifikátor
- Příklad:
86095742719
Steuernummer:
- Formát: 10–13 číslic, struktura závislá na spolkové zemi
- Přiděleno daňovým úřadem; liší se státem
- Příklad (Bayern):
181/815/08150
Francie: Numéro fiscal (SPI)
- Formát: 13 číslic (přidělen správou FIP)
- Nezaměňovat s numéro de sécurité sociale (INSEE)
- Příklad:
1234567890123
Itálie: Codice Fiscale
- Formát: 16 alfanumerických znaků (příjmení, křestní jméno, datum, místo, kontrolní číslice)
- Příklad:
RSSMRA80A01H501U - Validace: algoritmus kontrolní číslice na šestnáctém znaku
Španělsko: NIF/DNI/NIE
- DNI: 8 číslic + kontrolní písmeno (španělští občané)
- NIE: X/Y/Z + 7 číslic + kontrolní písmeno (cizinci)
- NIF podniků: 9 znaků (1 písmeno + 7 číslic + 1 písmeno/číslice)
- Validace: algoritmus modulo-23
Polsko: NIP a PESEL
NIP (daňové):
- Formát: 10 číslic (podnikatelé a firmy)
- Validace: vážená kontrolní suma
PESEL (národní):
- Formát: 11 číslic kódujících datum/pohlaví/kontrolní číslici
- Příklad:
44051401458
Česká republika: Rodné číslo
- Formát: 10 číslic (RRMMDD/CCCC)
- Ženy mají k měsíci přičteno 50 (MM+50)
- Validace: dělitelnost 11
Rumunsko: CNP
- Formát: 13 číslic (pohlaví, datum, kraj, sekvenční, kontrolní)
- Příklad:
1800101234567
Maďarsko: Adóazonosító jel
- Formát: 10 číslic (začínající 8)
- Příklad:
8123456789
Vzor mezery v pokrytí nástrojů
| Nástroj | SSN USA | DNI ES | Codice Fiscale IT | PESEL PL | Steuer-IdNr DE |
|---|---|---|---|---|---|
| Vanilla Presidio | Ano | Ne | Ne | Ne | Ne |
| AWS Comprehend | Ano | Omezeně | Ne | Ne | Ne |
| Microsoft Purview | Ano | Omezeně | Omezeně | Ne | Omezeně |
| anonym.legal | Ano | Ano (modulo-23) | Ano (kontrolní číslice) | Ano (vážená kontrola) | Ano (Luhn) |
Implementace: Pokrytí specifické pro EU
Přesná detekce EU daňových identifikátorů vyžaduje:
- Validaci checksum — ne pouze shodu vzoru; platné TIN mají matematické vlastnosti
- Kontextovou detekci jazyka — stejné dokumenty mohou kombinovat identifikátory více zemí
- Varianty formátování — PESEL „44051401458" vs. „440514-01458" vs. „440514 01458"
- Kombinovanou detekci — TIN + shodující se jméno + adresa = vysoká jistota, vyžaduje anonymizaci
Zdroje: GDPR článek 87 — národní identifikační čísla · Databáze formátů TIN EU · Pokyny EDPB k identifikátorům