By · Last updated 2026-06-05

Atgal į BlogąGDPR ir Atitiktis

Presidio praleidžia 220+ BDAR objektus

Presidio postatyme yra ~40 numatytųjų objektų atpažintuvų, sutelktų ties JAV identifikatoriais. Europos organizacijoms reikia IBAN, Codice Fiscale ir kitų.

June 5, 20267 min skaityti
Presidio entity coverageEU GDPR PIIIBAN detectionEuropean identifiersPresidio vs managed

Presidio praleidžia 220+ BDAR objektus: ES aprėpties spraga

Atnaujinta 2026 metams

Microsoft Presidio postatyme yra apie 40 numatytųjų objektų atpažintuvų. JAV diegimams tai veikia. Jis apima SSN, JAV pasus, vairuotojo pažymėjimus, kredito korteles ir el. pašto adresus.

ES diegimams spraga yra didelė. BDAR apima visus ES asmens duomenis. Tai taikoma nepriklausomai nuo duomenų subjekto pilietybės. ES komandos turi atpažintuvų, kurių Presidio nėra postatyme.

Ką Presidio apima

Presidio numatytieji nustatymai skirstomi į keturias grupes.

JAV centriniai ID:

  • JAV socialinio draudimo numeris (SSN)
  • JAV paso numeris
  • JAV vairuotojo pažymėjimo numeris
  • JAV banko sąskaitos numeris
  • JAV ITIN
  • JAV medicinos licencijos numeris

Universalūs ID:

  • El. pašto adresas
  • Telefono numeris
  • IP adresas
  • Kredito kortelės numeris
  • Kriptovaliutų piniginės adresas
  • URL

Teksto objektai (NER pagrindu):

  • ASMUO
  • VIETA
  • ORGANIZACIJA
  • DATA_LAIKAS

Riboti tarptautiniai:

  • JK NHS numeris
  • JK nacionalinio draudimo numeris (NINO)
  • Kai kurie finansiniai identifikatoriai

Iš viso: apie 40 atpažintuvų.

Ko reikia ES komandoms

Finansiniai ID

IBAN pasirodo daugelyje ES verslo failų. Jis pasirodo mokėjimuose, sąskaitose faktūrose ir darbo užmokestyje. IBAN seka ISO 13616. Presidio neturi IBAN atpažintuvo.

Imkite vokiečių finansų technologijų įmonę. Kiekviename mokėjimo faile yra IBAN. Be IBAN aptikimo įrankis ieško tik kredito kortelių numerių. Pagrindinis ES mokėjimo ID yra praleistas. Tai reiškia, kad svarbi BDAR apimama duomenų dalis niekada nerandama.

Nacionaliniai mokesčių ID

Nė vienas iš šių nėra Presidio numatytuosiuose nustatymuose:

  • Vokietijos Steueridentifikationsnummer: 11 skaitmenų
  • Prancūzijos NIR: 15 skaitmenų su patikrinamuoju raktu
  • Italijos Codice Fiscale: 16 simbolių su kontroline suma
  • Ispanijos NIF/NIE: 9 simboliai su raide
  • Nyderlandų BSN: 9 skaitmenys su elfproef validacija

ES darbo užmokesčio komanda tvarko failus iš daugelio valstybių narių. Be šių ji praleidžia jautriausius tuose įrašuose esančius ID.

Nacionaliniai sveikatos ID

JK NHS numeris yra apimamas. Šie -- ne:

  • Prancūzijos NIR (taip pat sveikatos ID)
  • Vokietijos Krankenkassennummer
  • Italijos Codice Fiscale (taip pat sveikatos ID)
  • Nyderlandų BSN (naudojamas sveikatos draudimui)

ES sveikatos priežiūros komandoms reikia šių BDAR lygio duomenų apsaugai.

ES vairuotojo pažymėjimai

ES vairuotojo pažymėjimai patenka į Direktyvos 2006/126/EB taikymo sritį. Kiekviena valstybė narė turi savo formatą. Raidinė-skaitmeninė struktūra skiriasi pagal šalį. Presidio turi tik JAV vairuotojo pažymėjimų atpažintuvus. Jis neturi ES vairuotojo pažymėjimų palaikymo. Tai reiškia, kad ES vairuotojo pažymėjimų duomenys praeina neaptikti.

PVM numeriai

ES PVM numeriai pasirodo kiekviename B2B sandoryje. Formatas: 2 raidžių šalies kodas ir 8–12 skaitmenų. Presidio neturi PVM atpažintuvo. PVM numeriai susieja įmones ir jų savininkus. Pagal BDAR jie yra asmens duomenys.

Daugiau apie BDAR įpareigojimus žr. BDAR atitikties ištekliai.

Pasirinktinių atpažintuvų kaina

Kai ES komandos atranda spragą, jos kuria pasinktinius atpažintuvus. Tai reikalauja tikro laiko.

Laikas vienam atpažintuvui (apytikslis įvertinimas):

  • Formato tyrimas: 1–2 valandos
  • Python klasės rašymas: 2–4 valandos
  • Regex ir validacijos kūrimas: 2–4 valandos
  • Konteksto žodžių pridėjimas: 1–2 valandos
  • Testų rašymas: 2–3 valandos
  • Diegimas ir tikrinimas: 1–2 valandos

Tai 9–17 valandų vienam atpažintuvui. Tai tik apytiksliai įverčiai.

Pavyzdys: vokiečių finansų technologijų įmonei reikia keturių atpažintuvų.

IBAN, Steuer-ID, ES vairuotojo pažymėjimas, vokiškas PVM.

  • 4 atpažintuvai po 13 valandų = 52 darbo valandos
  • Po 100 EUR valanda: apie 5 200 EUR

Tai apima tik pirmąjį kūrimą. Formatai keičiasi laikui bėgant. Atsiranda naujų atvejų. Presidio API atnaujinimai gali viską sulaužyti. Kiekvienas keitimas reikalauja kūrėjo, kuris peržiūri ir taiso. Nuolatinis darbas didina išlaidas metai po metų.

Valdoma biblioteka

anonym.legal išplečia Presidio su 285+ objektų tipų. Komanda nuolat atnaujina biblioteką. ES identifikatoriai yra įtraukti nuo pirmosios dienos.

Kas viršija Presidio numatytuosius:

  • IBAN visais ES valstybių narių formatais
  • Valstybių narių mokesčių ID: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL ir kt.
  • ES nacionaliniai sveikatos ID
  • PVM numeriai (ES formatas)
  • ES vairuotojo pažymėjimų formatai
  • Europos paso formatai
  • Objektų variantai 48 palaikomose kalbose

Kai Vokietija atnaujina mokesčių ID formatą, atnaujinimas pateikiamas su paslauga. Iš jūsų komandos nereikia jokios pull request.

ID, kurių nėra bibliotekoje, pasirinktinis objektų kūrėjas leidžia jums pridėti šablonus. Python kodo nereikia.

Žr. saugos ir atitikties informacija apie tai, kaip veikia atnaujinimai ir audito sekos.

Vokiečių finansų technologijų pavyzdys

Vokiečių finansų technologijų įmonei reikia aptikti IBAN, BIC, Steuer-ID ir Handelsregisternummern klientų failuose.

Presidio numatytasis aptikimo rodiklis šiems keturiems tipams: 0 %.

Nė vienas nėra numatytojoje bibliotekoje. Tai ne prastas tikslumas. Tai nulis aptikimų. Įrankis jų nepraleidžia iš dalies. Jis jų visai nemato.

Išlaidų palyginimas:

MetodasPirmų metų išlaidos
Pasirinktiniai atpažintuvai (4 x 13 val. po 100 EUR/val.)~5 200 EUR plius nuolatinė priežiūra
Valdoma objektų biblioteka (Pro planas)180 EUR per metus, visi keturi apimti

Skirtumas yra apie 29 kartus pirmaisiais metais. Kiekvienais metais po to pasirinktinė priežiūra prideda daugiau išlaidų. Valdoma paslauga kaina lieka stabili.

Išvada

Presidio numatytieji nustatymai gerai tarnauja JAV naudojimo atvejams. ES diegimams pagal BDAR jie nepakanka. Spraga reikalauja arba pasirinktinio atpažintuvo darbo, arba valdomos paslaugos.

ES komandoms, kurioms privaloma atitiktis ir inžinerijos laikas yra ribotas, iš anksto sukurta ES objektų biblioteka pašalina 50+ valandų kūrimo projektą. Failai gali būti apdorojami nuo pirmosios dienos. Pirmo pasirinktinio kodo nereikia.

Šaltiniai

Pasiruošę apsaugoti savo duomenis?

Pradėkite anonimizuoti PII su 285+ subjektų tipais 48 kalbomis.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.