By · Last updated 2026-06-05

Vissza a BlograGDPR & Megfelelés

A Presidio 220+ GDPR-entitást hagy ki

A Presidio alapértelmezés szerint ~40 entitásfelismerővel rendelkezik, amelyek elsősorban US-azonosítókra összpontosítanak. Az európai szervezeteknek IBAN-ra, Codice Fiscale-ra és más entitásokra is szükségük van.

June 5, 20267 perc olvasás
Presidio entity coverageEU GDPR PIIIBAN detectionEuropean identifiersPresidio vs managed

A Presidio 220+ GDPR-entitást hagy ki: az EU-s lefedettségi rés

2026-ra frissítve

A Microsoft Presidio alapértelmezés szerint körülbelül 40 entitásfelismerővel rendelkezik. US-telepítéseknél ez elegendő. Lefedi az SSN-eket, az USA-s útleveleket, a jogosítványokat, a hitelkártyákat és az e-mail-címeket.

EU-s telepítéseknél a hiány nagy. A GDPR az összes EU-s személyes adatot lefedi. Ez az érintett állampolgárságától függetlenül érvényes. Az EU-s csapatoknak olyan felismerőkre van szükségük, amelyeket a Presidio nem tartalmaz.

Mit tartalmaz a Presidio?

A Presidio alapértelmezései négy csoportba sorolhatók.

US-alapú azonosítók:

  • US Social Security Number (SSN)
  • US Passport Number
  • US Driver's License Number
  • US Bank Account Number
  • US ITIN
  • US Medical License Number

Univerzális azonosítók:

  • E-mail-cím
  • Telefonszám
  • IP-cím
  • Hitelkártyaszám
  • Kriptopénztárca-cím
  • URL

Szöveges entitások (NER-alapú):

  • PERSON
  • LOCATION
  • ORGANIZATION
  • DATE_TIME

Korlátozott nemzetközi lefedettség:

  • UK NHS Number
  • UK National Insurance Number (NINO)
  • Néhány pénzügyi azonosító

Összesen: körülbelül 40 felismerő.

Mire van szükségük az EU-s csapatoknak?

Pénzügyi azonosítók

Az IBAN a legtöbb EU-s üzleti fájlban megjelenik. Kifizetésekben, számlákon és bérszámfejtési dokumentumokban egyaránt előfordul. Az IBAN az ISO 13616 szabványt követi. A Presidio-nak nincs IBAN-felismerője.

Vegyünk egy német fintech céget. Minden fizetési fájlban van IBAN. IBAN-felismerés nélkül az eszköz csak hitelkártyaszámokat keres. A fő EU-s fizetési azonosítót kihagyja. Ez azt jelenti, hogy egy kulcsfontosságú GDPR-hatálya alá eső adatot soha nem talál meg.

Nemzeti adóazonosítók

Ezek egyike sem szerepel a Presidio alapértelmezéseiben:

  • Német Steueridentifikationsnummer: 11 számjegy
  • Francia NIR: 15 számjegy ellenőrző kulccsal
  • Olasz Codice Fiscale: 16 karakter ellenőrző összeggel
  • Spanyol NIF/NIE: 9 karakter betűvel
  • Holland BSN: 9 számjegy elfproef-ellenőrzéssel

Egy EU-s bérszámfejtési csapat több tagállamból érkező fájlokat kezel. Ezek nélkül a legérzékenyebb azonosítókat hagyja ki a nyilvántartásokban.

Nemzeti egészségügyi azonosítók

Az UK NHS Number le van fedve. Ezek nincsenek:

  • Francia NIR (egészségügyi azonosítóként is)
  • Német Krankenkassennummer
  • Olasz Codice Fiscale (egészségügyi azonosítóként is)
  • Holland BSN (egészségbiztosításhoz is használják)

Az EU-s egészségügyi csapatoknak ezekre van szükségük a GDPR-szintű adatvédelemhez.

EU-s jogosítványok

Az EU-s jogosítványokra a 2006/126/EK irányelv vonatkozik. Minden tagállamnak saját formátuma van. Az alfanumerikus szerkezet országonként eltér. A Presidio csak US-jogosítvány-felismerőkkel rendelkezik. EU-s jogosítványa egyáltalán nem támogat. Ez azt jelenti, hogy az EU-s jogosítvány-adatok felismerés nélkül haladnak át.

Áfaszámok

Az EU-s áfaszámok minden B2B-ügyletben megjelennek. Formátum: 2 betűs országkód plusz 8–12 számjegy. A Presidio-nak nincs áfaszám-felismerője. Az áfaszámok cégekhez és azok tulajdonosaihoz köthetők. A GDPR értelmében személyes adatnak minősülnek.

A GDPR-kötelezettségekről bővebben lásd a GDPR-megfelelőségi forrásokat.

Az egyedi felismerők költsége

Amikor az EU-s csapatok felfedezik a hiányt, egyedi felismerőket építenek. Ez valódi időt igényel.

Idő felismerőnként (hozzávetőleges becslés):

  • Formátum kutatása: 1–2 óra
  • Python-osztály megírása: 2–4 óra
  • Regex és ellenőrzés megépítése: 2–4 óra
  • Kontextusszavak hozzáadása: 1–2 óra
  • Tesztek megírása: 2–3 óra
  • Telepítés és ellenőrzés: 1–2 óra

Ez felismerőnként 9–17 óra. Ezek csak hozzávetőleges becslések.

Példa: egy német fintech négy felismerőre van szüksége.

IBAN, Steuer-ID, EU-s jogosítvány, német áfaszám.

  • 4 felismerő, felismerőnként 13 óra = 52 óra munka
  • 100 euró/óra áron: körülbelül 5 200 euró

Ez csak az első megépítést fedezi. A formátumok idővel változnak. Új szélső esetek kerülnek elő. A Presidio API-frissítések tönkretehetnek dolgokat. Minden változás fejlesztői felülvizsgálatot és javítást igényel. A folyamatos munka évről évre növeli a költségeket.

A kezelt könyvtár

Az anonym.legal 285+ entitástípussal egészíti ki a Presidio-t. A csapat naprakészen tartja a könyvtárat. Az EU-s azonosítók az első naptól elérhetők.

Ami meghaladja a Presidio alapértelmezéseit:

  • IBAN minden EU-tagállami formátumban
  • Tagállami adóazonosítók: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL és egyebek
  • EU-s nemzeti egészségügyi azonosítók
  • Áfaszámok (EU-formátum)
  • EU-s jogosítványformátumok
  • Európai útlevélformátumok
  • Entitásvariánsok 48 támogatott nyelven

Ha Németország frissíti az adóazonosító-formátumot, a frissítés a szolgáltatással együtt megjelenik. Nem kell pull request a csapatodtól.

A könyvtárban nem szereplő azonosítókhoz az egyedi entitásépítő lehetővé teszi a saját minták hozzáadását. Nincs szükség Python-kódra.

Lásd a biztonsági és megfelelőségi részleteket, hogy megtudja, hogyan működnek a frissítések és az auditnaplók.

A német fintech példája

Egy német fintech cégnek IBAN-okat, BIC-eket, Steuer-ID-ket és Handelsregisternummernöket kell felismernie ügyfél-fájlokban.

A Presidio alapértelmezett felismerési aránya erre a négy típusra: 0%.

Egyik sem szerepel az alapértelmezett könyvtárban. Ez nem gyenge precizitás. Nulla felismerés. Az eszköz nem részben hagyja ki őket. Egyáltalán nem látja őket.

Költség-összehasonlítás:

MegközelítésElső évi költség
Egyedi felismerők (4 × 13 óra × 100 euró/óra)~5 200 euró plusz folyamatos karbantartás
Kezelt entitáskönyvtár (Pro csomag)180 euró/év, mind a négy lefedve

A különbség az első évben körülbelül 29-szeres. Ezután évente az egyedi karbantartás tovább növeli a költséget. A kezelt szolgáltatás ára változatlan marad.

Összefoglalás

A Presidio alapértelmezései jól szolgálják a US-felhasználási eseteket. A GDPR-hatálya alá eső EU-s telepítéseknél elmaradnak. A hiány vagy egyedi felismerő-fejlesztést, vagy egy kezelt szolgáltatást igényel.

Azoknak az EU-s csapatoknak, ahol a megfelelőség kötelező és a mérnöki kapacitás szűk, egy előre megépített EU-s entitáskönyvtár eltávolít egy 50+ órás fejlesztési projektet. A fájlok az első naptól feldolgozhatók. Nem kell előbb egyedi kód.

Források

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.