Presidio praleidžia 220+ BDAR objektus: ES aprėpties spraga
Atnaujinta 2026 metams
Microsoft Presidio postatyme yra apie 40 numatytųjų objektų atpažintuvų. JAV diegimams tai veikia. Jis apima SSN, JAV pasus, vairuotojo pažymėjimus, kredito korteles ir el. pašto adresus.
ES diegimams spraga yra didelė. BDAR apima visus ES asmens duomenis. Tai taikoma nepriklausomai nuo duomenų subjekto pilietybės. ES komandos turi atpažintuvų, kurių Presidio nėra postatyme.
Ką Presidio apima
Presidio numatytieji nustatymai skirstomi į keturias grupes.
JAV centriniai ID:
- JAV socialinio draudimo numeris (SSN)
- JAV paso numeris
- JAV vairuotojo pažymėjimo numeris
- JAV banko sąskaitos numeris
- JAV ITIN
- JAV medicinos licencijos numeris
Universalūs ID:
- El. pašto adresas
- Telefono numeris
- IP adresas
- Kredito kortelės numeris
- Kriptovaliutų piniginės adresas
- URL
Teksto objektai (NER pagrindu):
- ASMUO
- VIETA
- ORGANIZACIJA
- DATA_LAIKAS
Riboti tarptautiniai:
- JK NHS numeris
- JK nacionalinio draudimo numeris (NINO)
- Kai kurie finansiniai identifikatoriai
Iš viso: apie 40 atpažintuvų.
Ko reikia ES komandoms
Finansiniai ID
IBAN pasirodo daugelyje ES verslo failų. Jis pasirodo mokėjimuose, sąskaitose faktūrose ir darbo užmokestyje. IBAN seka ISO 13616. Presidio neturi IBAN atpažintuvo.
Imkite vokiečių finansų technologijų įmonę. Kiekviename mokėjimo faile yra IBAN. Be IBAN aptikimo įrankis ieško tik kredito kortelių numerių. Pagrindinis ES mokėjimo ID yra praleistas. Tai reiškia, kad svarbi BDAR apimama duomenų dalis niekada nerandama.
Nacionaliniai mokesčių ID
Nė vienas iš šių nėra Presidio numatytuosiuose nustatymuose:
- Vokietijos Steueridentifikationsnummer: 11 skaitmenų
- Prancūzijos NIR: 15 skaitmenų su patikrinamuoju raktu
- Italijos Codice Fiscale: 16 simbolių su kontroline suma
- Ispanijos NIF/NIE: 9 simboliai su raide
- Nyderlandų BSN: 9 skaitmenys su elfproef validacija
ES darbo užmokesčio komanda tvarko failus iš daugelio valstybių narių. Be šių ji praleidžia jautriausius tuose įrašuose esančius ID.
Nacionaliniai sveikatos ID
JK NHS numeris yra apimamas. Šie -- ne:
- Prancūzijos NIR (taip pat sveikatos ID)
- Vokietijos Krankenkassennummer
- Italijos Codice Fiscale (taip pat sveikatos ID)
- Nyderlandų BSN (naudojamas sveikatos draudimui)
ES sveikatos priežiūros komandoms reikia šių BDAR lygio duomenų apsaugai.
ES vairuotojo pažymėjimai
ES vairuotojo pažymėjimai patenka į Direktyvos 2006/126/EB taikymo sritį. Kiekviena valstybė narė turi savo formatą. Raidinė-skaitmeninė struktūra skiriasi pagal šalį. Presidio turi tik JAV vairuotojo pažymėjimų atpažintuvus. Jis neturi ES vairuotojo pažymėjimų palaikymo. Tai reiškia, kad ES vairuotojo pažymėjimų duomenys praeina neaptikti.
PVM numeriai
ES PVM numeriai pasirodo kiekviename B2B sandoryje. Formatas: 2 raidžių šalies kodas ir 8–12 skaitmenų. Presidio neturi PVM atpažintuvo. PVM numeriai susieja įmones ir jų savininkus. Pagal BDAR jie yra asmens duomenys.
Daugiau apie BDAR įpareigojimus žr. BDAR atitikties ištekliai.
Pasirinktinių atpažintuvų kaina
Kai ES komandos atranda spragą, jos kuria pasinktinius atpažintuvus. Tai reikalauja tikro laiko.
Laikas vienam atpažintuvui (apytikslis įvertinimas):
- Formato tyrimas: 1–2 valandos
- Python klasės rašymas: 2–4 valandos
- Regex ir validacijos kūrimas: 2–4 valandos
- Konteksto žodžių pridėjimas: 1–2 valandos
- Testų rašymas: 2–3 valandos
- Diegimas ir tikrinimas: 1–2 valandos
Tai 9–17 valandų vienam atpažintuvui. Tai tik apytiksliai įverčiai.
Pavyzdys: vokiečių finansų technologijų įmonei reikia keturių atpažintuvų.
IBAN, Steuer-ID, ES vairuotojo pažymėjimas, vokiškas PVM.
- 4 atpažintuvai po 13 valandų = 52 darbo valandos
- Po 100 EUR valanda: apie 5 200 EUR
Tai apima tik pirmąjį kūrimą. Formatai keičiasi laikui bėgant. Atsiranda naujų atvejų. Presidio API atnaujinimai gali viską sulaužyti. Kiekvienas keitimas reikalauja kūrėjo, kuris peržiūri ir taiso. Nuolatinis darbas didina išlaidas metai po metų.
Valdoma biblioteka
anonym.legal išplečia Presidio su 285+ objektų tipų. Komanda nuolat atnaujina biblioteką. ES identifikatoriai yra įtraukti nuo pirmosios dienos.
Kas viršija Presidio numatytuosius:
- IBAN visais ES valstybių narių formatais
- Valstybių narių mokesčių ID: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL ir kt.
- ES nacionaliniai sveikatos ID
- PVM numeriai (ES formatas)
- ES vairuotojo pažymėjimų formatai
- Europos paso formatai
- Objektų variantai 48 palaikomose kalbose
Kai Vokietija atnaujina mokesčių ID formatą, atnaujinimas pateikiamas su paslauga. Iš jūsų komandos nereikia jokios pull request.
ID, kurių nėra bibliotekoje, pasirinktinis objektų kūrėjas leidžia jums pridėti šablonus. Python kodo nereikia.
Žr. saugos ir atitikties informacija apie tai, kaip veikia atnaujinimai ir audito sekos.
Vokiečių finansų technologijų pavyzdys
Vokiečių finansų technologijų įmonei reikia aptikti IBAN, BIC, Steuer-ID ir Handelsregisternummern klientų failuose.
Presidio numatytasis aptikimo rodiklis šiems keturiems tipams: 0 %.
Nė vienas nėra numatytojoje bibliotekoje. Tai ne prastas tikslumas. Tai nulis aptikimų. Įrankis jų nepraleidžia iš dalies. Jis jų visai nemato.
Išlaidų palyginimas:
| Metodas | Pirmų metų išlaidos |
|---|---|
| Pasirinktiniai atpažintuvai (4 x 13 val. po 100 EUR/val.) | ~5 200 EUR plius nuolatinė priežiūra |
| Valdoma objektų biblioteka (Pro planas) | 180 EUR per metus, visi keturi apimti |
Skirtumas yra apie 29 kartus pirmaisiais metais. Kiekvienais metais po to pasirinktinė priežiūra prideda daugiau išlaidų. Valdoma paslauga kaina lieka stabili.
Išvada
Presidio numatytieji nustatymai gerai tarnauja JAV naudojimo atvejams. ES diegimams pagal BDAR jie nepakanka. Spraga reikalauja arba pasirinktinio atpažintuvo darbo, arba valdomos paslaugos.
ES komandoms, kurioms privaloma atitiktis ir inžinerijos laikas yra ribotas, iš anksto sukurta ES objektų biblioteka pašalina 50+ valandų kūrimo projektą. Failai gali būti apdorojami nuo pirmosios dienos. Pirmo pasirinktinio kodo nereikia.