A Presidio 220+ GDPR-entitást hagy ki: az EU-s lefedettségi rés
2026-ra frissítve
A Microsoft Presidio alapértelmezés szerint körülbelül 40 entitásfelismerővel rendelkezik. US-telepítéseknél ez elegendő. Lefedi az SSN-eket, az USA-s útleveleket, a jogosítványokat, a hitelkártyákat és az e-mail-címeket.
EU-s telepítéseknél a hiány nagy. A GDPR az összes EU-s személyes adatot lefedi. Ez az érintett állampolgárságától függetlenül érvényes. Az EU-s csapatoknak olyan felismerőkre van szükségük, amelyeket a Presidio nem tartalmaz.
Mit tartalmaz a Presidio?
A Presidio alapértelmezései négy csoportba sorolhatók.
US-alapú azonosítók:
- US Social Security Number (SSN)
- US Passport Number
- US Driver's License Number
- US Bank Account Number
- US ITIN
- US Medical License Number
Univerzális azonosítók:
- E-mail-cím
- Telefonszám
- IP-cím
- Hitelkártyaszám
- Kriptopénztárca-cím
- URL
Szöveges entitások (NER-alapú):
- PERSON
- LOCATION
- ORGANIZATION
- DATE_TIME
Korlátozott nemzetközi lefedettség:
- UK NHS Number
- UK National Insurance Number (NINO)
- Néhány pénzügyi azonosító
Összesen: körülbelül 40 felismerő.
Mire van szükségük az EU-s csapatoknak?
Pénzügyi azonosítók
Az IBAN a legtöbb EU-s üzleti fájlban megjelenik. Kifizetésekben, számlákon és bérszámfejtési dokumentumokban egyaránt előfordul. Az IBAN az ISO 13616 szabványt követi. A Presidio-nak nincs IBAN-felismerője.
Vegyünk egy német fintech céget. Minden fizetési fájlban van IBAN. IBAN-felismerés nélkül az eszköz csak hitelkártyaszámokat keres. A fő EU-s fizetési azonosítót kihagyja. Ez azt jelenti, hogy egy kulcsfontosságú GDPR-hatálya alá eső adatot soha nem talál meg.
Nemzeti adóazonosítók
Ezek egyike sem szerepel a Presidio alapértelmezéseiben:
- Német Steueridentifikationsnummer: 11 számjegy
- Francia NIR: 15 számjegy ellenőrző kulccsal
- Olasz Codice Fiscale: 16 karakter ellenőrző összeggel
- Spanyol NIF/NIE: 9 karakter betűvel
- Holland BSN: 9 számjegy elfproef-ellenőrzéssel
Egy EU-s bérszámfejtési csapat több tagállamból érkező fájlokat kezel. Ezek nélkül a legérzékenyebb azonosítókat hagyja ki a nyilvántartásokban.
Nemzeti egészségügyi azonosítók
Az UK NHS Number le van fedve. Ezek nincsenek:
- Francia NIR (egészségügyi azonosítóként is)
- Német Krankenkassennummer
- Olasz Codice Fiscale (egészségügyi azonosítóként is)
- Holland BSN (egészségbiztosításhoz is használják)
Az EU-s egészségügyi csapatoknak ezekre van szükségük a GDPR-szintű adatvédelemhez.
EU-s jogosítványok
Az EU-s jogosítványokra a 2006/126/EK irányelv vonatkozik. Minden tagállamnak saját formátuma van. Az alfanumerikus szerkezet országonként eltér. A Presidio csak US-jogosítvány-felismerőkkel rendelkezik. EU-s jogosítványa egyáltalán nem támogat. Ez azt jelenti, hogy az EU-s jogosítvány-adatok felismerés nélkül haladnak át.
Áfaszámok
Az EU-s áfaszámok minden B2B-ügyletben megjelennek. Formátum: 2 betűs országkód plusz 8–12 számjegy. A Presidio-nak nincs áfaszám-felismerője. Az áfaszámok cégekhez és azok tulajdonosaihoz köthetők. A GDPR értelmében személyes adatnak minősülnek.
A GDPR-kötelezettségekről bővebben lásd a GDPR-megfelelőségi forrásokat.
Az egyedi felismerők költsége
Amikor az EU-s csapatok felfedezik a hiányt, egyedi felismerőket építenek. Ez valódi időt igényel.
Idő felismerőnként (hozzávetőleges becslés):
- Formátum kutatása: 1–2 óra
- Python-osztály megírása: 2–4 óra
- Regex és ellenőrzés megépítése: 2–4 óra
- Kontextusszavak hozzáadása: 1–2 óra
- Tesztek megírása: 2–3 óra
- Telepítés és ellenőrzés: 1–2 óra
Ez felismerőnként 9–17 óra. Ezek csak hozzávetőleges becslések.
Példa: egy német fintech négy felismerőre van szüksége.
IBAN, Steuer-ID, EU-s jogosítvány, német áfaszám.
- 4 felismerő, felismerőnként 13 óra = 52 óra munka
- 100 euró/óra áron: körülbelül 5 200 euró
Ez csak az első megépítést fedezi. A formátumok idővel változnak. Új szélső esetek kerülnek elő. A Presidio API-frissítések tönkretehetnek dolgokat. Minden változás fejlesztői felülvizsgálatot és javítást igényel. A folyamatos munka évről évre növeli a költségeket.
A kezelt könyvtár
Az anonym.legal 285+ entitástípussal egészíti ki a Presidio-t. A csapat naprakészen tartja a könyvtárat. Az EU-s azonosítók az első naptól elérhetők.
Ami meghaladja a Presidio alapértelmezéseit:
- IBAN minden EU-tagállami formátumban
- Tagállami adóazonosítók: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL és egyebek
- EU-s nemzeti egészségügyi azonosítók
- Áfaszámok (EU-formátum)
- EU-s jogosítványformátumok
- Európai útlevélformátumok
- Entitásvariánsok 48 támogatott nyelven
Ha Németország frissíti az adóazonosító-formátumot, a frissítés a szolgáltatással együtt megjelenik. Nem kell pull request a csapatodtól.
A könyvtárban nem szereplő azonosítókhoz az egyedi entitásépítő lehetővé teszi a saját minták hozzáadását. Nincs szükség Python-kódra.
Lásd a biztonsági és megfelelőségi részleteket, hogy megtudja, hogyan működnek a frissítések és az auditnaplók.
A német fintech példája
Egy német fintech cégnek IBAN-okat, BIC-eket, Steuer-ID-ket és Handelsregisternummernöket kell felismernie ügyfél-fájlokban.
A Presidio alapértelmezett felismerési aránya erre a négy típusra: 0%.
Egyik sem szerepel az alapértelmezett könyvtárban. Ez nem gyenge precizitás. Nulla felismerés. Az eszköz nem részben hagyja ki őket. Egyáltalán nem látja őket.
Költség-összehasonlítás:
| Megközelítés | Első évi költség |
|---|---|
| Egyedi felismerők (4 × 13 óra × 100 euró/óra) | ~5 200 euró plusz folyamatos karbantartás |
| Kezelt entitáskönyvtár (Pro csomag) | 180 euró/év, mind a négy lefedve |
A különbség az első évben körülbelül 29-szeres. Ezután évente az egyedi karbantartás tovább növeli a költséget. A kezelt szolgáltatás ára változatlan marad.
Összefoglalás
A Presidio alapértelmezései jól szolgálják a US-felhasználási eseteket. A GDPR-hatálya alá eső EU-s telepítéseknél elmaradnak. A hiány vagy egyedi felismerő-fejlesztést, vagy egy kezelt szolgáltatást igényel.
Azoknak az EU-s csapatoknak, ahol a megfelelőség kötelező és a mérnöki kapacitás szűk, egy előre megépített EU-s entitáskönyvtár eltávolít egy 50+ órás fejlesztési projektet. A fájlok az első naptól feldolgozhatók. Nem kell előbb egyedi kód.