Co Presidio přehlíží: 220+ typů entit nezbytných pro detekci PII v souladu s GDPR
Microsoft Presidio dodáván s přibližně 40 výchozími rozpoznávači entit. Pro nasazení v USA zpracovávající dokumenty zaměřené na USA to pokrývá základní kategorie: čísla sociálního zabezpečení, americké pasy, americké řidičské průkazy, kreditní karty, e-mailové adresy, telefonní čísla a osobní jména.
Pro nasazení v EU je mezera v pokrytí značná. GDPR se vztahuje na všechna osobní data EU bez ohledu na státní příslušnost. Evropské organizace zpracovávající data svých vlastních občanů potřebují rozpoznávače, které Presidio neposkytuje out of the box.
Mezera v pokrytí Presidia EU: Co chybí
Finanční identifikátory
- IBAN — chybí pro 31 zemí SEPA (formáty AT, BE, CH, DE, FR, IT, ES, NL atd.)
- BIC/SWIFT kódy — identifikace banky
- Čísla karet EU DBS — formáty specifické pro zemi
Národní daňové identifikátory
- Německo: Steueridentifikationsnummer (11 číslic), Steuernummer
- Itálie: Codice Fiscale (16 znaků), Partita IVA (11 číslic)
- Španělsko: DNI, NIE, NIF s ověřením modulo-23
- Francie: Numéro fiscal (13 číslic)
- Polsko: PESEL (11 číslic), NIP (10 číslic)
- Rumunsko: CNP (13 číslic)
- Maďarsko: TAJ (9 číslic s validací modulo-9)
- Řecko: AFM (9 číslic), AMKA (11 číslic)
Zdravotní identifikátory
- Česká republika: Rodné číslo (10 číslic, kódující datum/pohlaví)
- Dánsko: CPR číslo (modulus-11)
- Švédsko: Personnummer (Luhnsův algoritmus)
- Norsko: Fødselsnummer
- Finsko: Henkilötunnus
Řidičské průkazy (EU formáty)
Každá členská země EU má vlastní formát, který je v souladu s GDPR osobními daty:
- DE: 2 písmena + 6 číslic + 1 písmeno + 1 číslice
- FR: číselné série 12 číslic
- IT: alfanumerické, mixované formáty
- PL: 9 znaků s kontrolní číslicí
Registrační čísla vozidel
Formáty SPZ se liší v každé zemi EU — jsou to osobní data propojená s vlastníky vozidel prostřednictvím registrací.
Státní průkazy totožnosti
Každá členská země EU vydává národní průkazy totožnosti s odlišnými formáty čísla — všechna jsou osobní data pod GDPR.
Kvantifikace mezery v pokrytí
Pro typickou německou finanční instituci zpracovávající zákaznické dokumenty:
| Typ entity | Presidio výchozí | Pokrytí potřebné pro GDPR |
|---|---|---|
| Německé IBAN | Žádné | Požadováno |
| Steueridentifikationsnummer | Žádné | Požadováno |
| Německý pas | Omezeně (US vzor) | Specifická validace DE |
| Datumové formáty | Základní | Formáty DD.MM.YYYY |
| Číslo bankovního účtu | Žádné | BBAN formáty |
Přístup anonym.legal: 285+ entit EU
anonym.legal začíná tam, kde Presidio ve výchozím nastavení končí:
- 31 zemí SEPA — IBAN detekce s validací checksum pro každý stát
- 27 členských států EU — formáty národních daňových identifikátorů s validací
- 24 zemí EU — formáty řidičských průkazů
- Zdravotní čísla — CPR, PESEL, personnummer, rodné číslo a dalších 20+ formátů
- Průkazy totožnosti — formáty průkazů totožnosti 27 EU zemí
Pro EU organizaci vyžadující GDPR shodu není Presidio výchozí konfigurace startovacím bodem — je to prázdné místo vyžadující 6–18 měsíců vlastního rozpoznávacího vývoje.
Zdroje: Dokumentace rozpoznávačů Presidia · Pokyny k anonymizaci GDPR WP29 · Implementující nařízení eIDAS EU