Zpět na blogGDPR a shoda

Co Presidio přehlíží: 220+ typů entit nezbytných pro...

Presidio dodáváno s ~40 výchozími rozpoznávači entit zaměřenými na americké identifikátory.

April 21, 20267 min čtení
Presidio entity coverageEU GDPR PIIIBAN detectionEuropean identifiersPresidio vs managed

Co Presidio přehlíží: 220+ typů entit nezbytných pro detekci PII v souladu s GDPR

Microsoft Presidio dodáván s přibližně 40 výchozími rozpoznávači entit. Pro nasazení v USA zpracovávající dokumenty zaměřené na USA to pokrývá základní kategorie: čísla sociálního zabezpečení, americké pasy, americké řidičské průkazy, kreditní karty, e-mailové adresy, telefonní čísla a osobní jména.

Pro nasazení v EU je mezera v pokrytí značná. GDPR se vztahuje na všechna osobní data EU bez ohledu na státní příslušnost. Evropské organizace zpracovávající data svých vlastních občanů potřebují rozpoznávače, které Presidio neposkytuje out of the box.

Mezera v pokrytí Presidia EU: Co chybí

Finanční identifikátory

  • IBAN — chybí pro 31 zemí SEPA (formáty AT, BE, CH, DE, FR, IT, ES, NL atd.)
  • BIC/SWIFT kódy — identifikace banky
  • Čísla karet EU DBS — formáty specifické pro zemi

Národní daňové identifikátory

  • Německo: Steueridentifikationsnummer (11 číslic), Steuernummer
  • Itálie: Codice Fiscale (16 znaků), Partita IVA (11 číslic)
  • Španělsko: DNI, NIE, NIF s ověřením modulo-23
  • Francie: Numéro fiscal (13 číslic)
  • Polsko: PESEL (11 číslic), NIP (10 číslic)
  • Rumunsko: CNP (13 číslic)
  • Maďarsko: TAJ (9 číslic s validací modulo-9)
  • Řecko: AFM (9 číslic), AMKA (11 číslic)

Zdravotní identifikátory

  • Česká republika: Rodné číslo (10 číslic, kódující datum/pohlaví)
  • Dánsko: CPR číslo (modulus-11)
  • Švédsko: Personnummer (Luhnsův algoritmus)
  • Norsko: Fødselsnummer
  • Finsko: Henkilötunnus

Řidičské průkazy (EU formáty)

Každá členská země EU má vlastní formát, který je v souladu s GDPR osobními daty:

  • DE: 2 písmena + 6 číslic + 1 písmeno + 1 číslice
  • FR: číselné série 12 číslic
  • IT: alfanumerické, mixované formáty
  • PL: 9 znaků s kontrolní číslicí

Registrační čísla vozidel

Formáty SPZ se liší v každé zemi EU — jsou to osobní data propojená s vlastníky vozidel prostřednictvím registrací.

Státní průkazy totožnosti

Každá členská země EU vydává národní průkazy totožnosti s odlišnými formáty čísla — všechna jsou osobní data pod GDPR.

Kvantifikace mezery v pokrytí

Pro typickou německou finanční instituci zpracovávající zákaznické dokumenty:

Typ entityPresidio výchozíPokrytí potřebné pro GDPR
Německé IBANŽádnéPožadováno
SteueridentifikationsnummerŽádnéPožadováno
Německý pasOmezeně (US vzor)Specifická validace DE
Datumové formátyZákladníFormáty DD.MM.YYYY
Číslo bankovního účtuŽádnéBBAN formáty

Přístup anonym.legal: 285+ entit EU

anonym.legal začíná tam, kde Presidio ve výchozím nastavení končí:

  • 31 zemí SEPA — IBAN detekce s validací checksum pro každý stát
  • 27 členských států EU — formáty národních daňových identifikátorů s validací
  • 24 zemí EU — formáty řidičských průkazů
  • Zdravotní čísla — CPR, PESEL, personnummer, rodné číslo a dalších 20+ formátů
  • Průkazy totožnosti — formáty průkazů totožnosti 27 EU zemí

Pro EU organizaci vyžadující GDPR shodu není Presidio výchozí konfigurace startovacím bodem — je to prázdné místo vyžadující 6–18 měsíců vlastního rozpoznávacího vývoje.

Zdroje: Dokumentace rozpoznávačů Presidia · Pokyny k anonymizaci GDPR WP29 · Implementující nařízení eIDAS EU

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.