anonym.legal

By · Last updated 2026-06-05

Povratak na blogGDPR i usklađenost

Presidio propusta 220+ GDPR entiteta

Presidio isporucuje oko 40 podrazumevanih prepoznavaca entiteta usmerenih na US identifikatore. Evropske organizacije trebaju IBAN, Codice Fiscale i jos mnogo toga.

June 5, 20267 min čitanja
Presidio entity coverageEU GDPR PIIIBAN detectionEuropean identifiersPresidio vs managed

Presidio propusta 220+ GDPR entiteta: EU jaz u pokrivenosti

Azurirano za 2026.

Microsoft Presidio isporucuje oko 40 podrazumevanih prepoznavaca entiteta. Za US deploymente, ovo funkcionise. Pokriva SSN, americke pasose, vozacke dozvole, kreditne kartice i emailove.

Za EU deploymente, jaz je veliki. GDPR pokriva sve EU licne podatke. Ovo se primenjuje bez obzira na nacionalnost subjekta podataka. EU timovi trebaju prepoznavace koje Presidio ne isporucuje.

Sta Presidio ukljucuje

Presidio-ovi defaults-i spadaju u cetiri grupe.

US-centricni ID-ovi:

  • US Social Security Number (SSN)
  • US Passport Number
  • US Driver's License Number
  • US Bank Account Number
  • US ITIN
  • US Medical License Number

Univerzalni ID-ovi:

  • Email Address
  • Phone Number
  • IP Address
  • Credit Card Number
  • Crypto Wallet Address
  • URL

Tekstualni entiteti (zasnovani na NER):

  • PERSON
  • LOCATION
  • ORGANIZATION
  • DATE_TIME

Ograniceni medjunarodni:

  • UK NHS Number
  • UK National Insurance Number (NINO)
  • Neki finansijski identifikatori

Ukupno: oko 40 prepoznavaca.

Sta EU timovi trebaju

Finansijski ID-ovi

IBAN se pojavljuje u vecini EU poslovnih fajlova. Pojavljuje se u placanjima, fakturama i platnom spisku. IBAN prati ISO 13616. Presidio nema IBAN prepoznavac.

Uzmite nemacki fintech. Svaki fajl placanja ima IBAN. Bez detekcije IBAN-a, alat trazi samo brojeve kreditnih kartica. Glavni EU identifikator placanja se propusta. To znaci da kljucni deo podataka zastitenih GDPR-om nikada nije pronadjen.

Nacionalni poreski ID-ovi

Nijedan od ovih nije u Presidio-ovim defaults-ima:

  • Nemacki Steueridentifikationsnummer: 11 cifara
  • Francuski NIR: 15 cifara sa kontrolnim kljucem
  • Italijanski Codice Fiscale: 16 karaktera sa kontrolnim zbrojem
  • Spanski NIF/NIE: 9 karaktera sa slovom
  • Holandski BSN: 9 cifara sa elfproef validacijom

EU platni tim obradjuje fajlove iz mnogo drzava clanica. Bez ovih, propusta najosjetljivije ID-ove u tim zapisima.

Nacionalni zdravstveni ID-ovi

UK NHS Number je pokriven. Ovi nisu:

  • Francuski NIR (takodje zdravstveni ID)
  • Nemacki Krankenkassennummer
  • Italijanski Codice Fiscale (takodje zdravstveni ID)
  • Holandski BSN (koristi se za zdravstveno osiguranje)

EU zdravstveni timovi trebaju ove za GDPR-nivo zastite podataka.

EU vozacke dozvole

EU vozacke dozvole padaju pod Direktivu 2006/126/EC. Svaka drzava clanica ima sopstveni format. Alfanumericka struktura se razlikuje po zemlji. Presidio ima prepoznavace vozacke dozvole samo za US. Nema podrske za EU vozacke dozvole. To znaci da podaci o EU vozackim dozvolama prolaze nedetektovani.

PDV brojevi

EU PDV brojevi pojavljuju se u svakom B2B poslu. Format: 2-slovna sifra zemlje plus 8-12 cifara. Presidio nema PDV prepoznavac. PDV brojevi su povezani sa kompanijama i njihovim vlasnicima. Oni su licni podaci prema GDPR-u.

Vise o GDPR obavezama pogledajte na GDPR resursi za uskladjenost.

Trosak prilagodjenih prepoznavaca

Kada EU timovi otkriju jaz, prave prilagodjene prepoznavace. Ovo zahteva pravo vreme.

Vreme po prepoznavacu (gruba procena):

  • Istrazivanje formata: 1-2 sata
  • Pisanje Python klase: 2-4 sata
  • Gradnja regex-a i validacije: 2-4 sata
  • Dodavanje kontekstnih reci: 1-2 sata
  • Pisanje testova: 2-3 sata
  • Deployment i provera: 1-2 sata

To je 9-17 sati po prepoznavacu. Ovo su samo grube procene.

Primer: nemacki fintech treba cetiri prepoznavaca.

IBAN, Steuer-ID, EU vozacka dozvola, nemacki PDV.

  • 4 prepoznavaca po 13 sati = 52 sata rada
  • Po 100 EUR po satu: oko 5.200 EUR

Ovo pokriva samo prvu izgradnju. Formati se menjaju vremenom. Pojavljuju se novi granicni slucajevi. Azuriranja Presidio API-ja mogu da pokidaju stvari. Svaka promena zahteva pregled i popravku od strane programera. Tekuci posao dodaje troskove godinu za godinom.

Upravljana biblioteka

anonym.legal prosiruje Presidio sa 285+ tipova entiteta. Tim odrzava biblioteku azurnom. EU identifikatori su ukljuceni od prvog dana.

Sta ide izvan Presidio-ovih defaults-a:

  • IBAN u svim EU formatima drzava clanica
  • Poreski ID-ovi drzava clanica: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL i vise
  • EU nacionalni zdravstveni ID-ovi
  • PDV brojevi (EU format)
  • EU formati vozackih dozvola
  • Evropski formati pasosa
  • Varijante entiteta na 48 podrzanih jezika

Kada Nemacka azurira format poreskog ID-a, azuriranje se isporucuje sa servisom. Nije potreban pull request od vaseg tima.

Za ID-ove koji nisu u biblioteci, gradilac prilagodjenih entiteta vam omogucuje dodavanje paterna. Python kod nije potreban.

Pogledajte detalje bezbednosti i uskladjenosti za to kako azuriranja i revizijski tragovi funkcionisu.

Primer nemackog fintech-a

Nemacki fintech treba da detektuje IBAN-ove, BIC-ove, Steuer-ID-ove i Handelsregisternummern u fajlovima klijenata.

Presidio default stopa detekcije za ova cetiri tipa: 0%.

Nijedan nije u podrazumevanoj biblioteci. Ovo nije losa preciznost. To je nula detekcija. Alat ih ne propusta delimicno. Uopste ih ne vidi.

Poredjenje troskova:

PristupTrosak za prvu godinu
Prilagodjeni prepoznavaci (4 x 13 sati po 100 EUR/sat)~5.200 EUR plus tekuce odrzavanje
Upravljana biblioteka entiteta (Pro plan)180 EUR/godisnje, sva cetiri pokrivena

Jaz je oko 29x u prvoj godini. Svake sledece godine, prilagodjeno odrzavanje dodaje vise troskova. Cena upravljanog servisa ostaje ista.

Zakljucak

Presidio-ovi defaults-i dobro slaze US slucajeve upotrebe. Za EU deploymente prema GDPR-u, oni zaostaju. Jaz zahteva ili rad na prilagodenim prepoznavacima ili upravljani servis.

Za EU timove gde je uskladjenost obavezna i inzenjersko vreme je ograniceno, pregradjjena EU biblioteka entiteta uklanja projekat izgradnje od 50+ sati. Fajlovi se mogu obradjivati od prvog dana. Prethodni prilagodjeni kod nije potreban.

Izvori

Spremni da zaštitite svoje podatke?

Počnite sa anonimizacijom PII sa 285+ tipova entiteta na 48 jezika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.