By · Last updated 2026-06-05

Kembali ke BlogGDPR & Kepatuhan

Presidio Melewatkan 220+ Entitas GDPR

Presidio dikirimkan dengan ~40 pengenal entitas default yang berfokus pada pengidentifikasi AS. Organisasi Eropa membutuhkan IBAN, Codice Fiscale.

June 5, 20267 menit baca
Presidio entity coverageEU GDPR PIIIBAN detectionEuropean identifiersPresidio vs managed

Presidio Melewatkan 220+ Entitas GDPR: Kesenjangan Cakupan UE

Diperbarui untuk 2026

Microsoft Presidio dikirimkan dengan sekitar 40 pengenal entitas default. Untuk deployment AS, ini berfungsi. Mencakup SSN, paspor AS, SIM, kartu kredit, dan email.

Untuk deployment UE, kesenjangan ini besar. GDPR mencakup semua data pribadi UE. Ini berlaku tanpa memandang kewarganegaraan subjek data. Tim UE membutuhkan pengenal yang tidak disertakan Presidio.

Yang Disertakan Presidio

Default Presidio terbagi dalam empat kelompok.

ID berpusat di AS:

  • US Social Security Number (SSN)
  • US Passport Number
  • US Driver's License Number
  • US Bank Account Number
  • US ITIN
  • US Medical License Number

ID universal:

  • Alamat Email
  • Nomor Telepon
  • Alamat IP
  • Nomor Kartu Kredit
  • Alamat Dompet Kripto
  • URL

Entitas teks (berbasis NER):

  • PERSON
  • LOCATION
  • ORGANIZATION
  • DATE_TIME

Internasional terbatas:

  • UK NHS Number
  • UK National Insurance Number (NINO)
  • Beberapa pengidentifikasi keuangan

Total: sekitar 40 pengenal.

Yang Dibutuhkan Tim UE

ID Keuangan

IBAN muncul di sebagian besar berkas bisnis UE. Ia muncul dalam pembayaran, faktur, dan penggajian. IBAN mengikuti ISO 13616. Presidio tidak memiliki pengenal IBAN.

Ambil sebuah fintech Jerman. Setiap berkas pembayaran memiliki IBAN. Tanpa deteksi IBAN, alat hanya mencari nomor kartu kredit. ID pembayaran UE utama terlewat. Itu berarti sepotong data yang dilindungi GDPR tidak pernah ditemukan.

ID Pajak Nasional

Tidak ada yang termasuk dalam default Presidio:

  • Steueridentifikationsnummer Jerman: 11 digit
  • NIR Prancis: 15 digit dengan kunci periksa
  • Codice Fiscale Italia: 16 karakter dengan checksum
  • NIF/NIE Spanyol: 9 karakter dengan huruf
  • BSN Belanda: 9 digit dengan validasi elfproef

Tim penggajian UE menangani berkas dari banyak negara anggota. Tanpa ini, ia melewatkan ID paling sensitif dalam rekaman tersebut.

ID Kesehatan Nasional

UK NHS Number sudah tercakup. Yang berikut tidak:

  • NIR Prancis (juga sebagai ID kesehatan)
  • Krankenkassennummer Jerman
  • Codice Fiscale Italia (juga sebagai ID kesehatan)
  • BSN Belanda (digunakan untuk asuransi kesehatan)

Tim kesehatan UE membutuhkan ini untuk perlindungan data tingkat GDPR.

SIM Eropa

SIM Eropa termasuk dalam Directive 2006/126/EC. Setiap negara anggota memiliki formatnya sendiri. Struktur alfanumerik berbeda per negara. Presidio hanya memiliki pengenal SIM AS. Tidak ada dukungan SIM Eropa. Ini berarti data SIM Eropa melewati tanpa terdeteksi.

Nomor PPN

Nomor PPN UE muncul dalam setiap transaksi B2B. Format: kode negara 2 huruf ditambah 8–12 digit. Presidio tidak memiliki pengenal PPN. Nomor PPN terkait dengan perusahaan dan pemiliknya. Mereka adalah data pribadi di bawah GDPR.

Untuk informasi lebih lanjut tentang kewajiban GDPR, lihat sumber daya kepatuhan GDPR.

Biaya Pengenal Kustom

Ketika tim UE menemukan kesenjangan ini, mereka membangun pengenal kustom. Ini memakan waktu nyata.

Waktu per pengenal (perkiraan kasar):

  • Riset format: 1–2 jam
  • Tulis kelas Python: 2–4 jam
  • Bangun regex dan validasi: 2–4 jam
  • Tambahkan kata konteks: 1–2 jam
  • Tulis pengujian: 2–3 jam
  • Deploy dan periksa: 1–2 jam

Itu 9–17 jam per pengenal. Ini hanya perkiraan kasar.

Contoh: fintech Jerman membutuhkan empat pengenal.

IBAN, Steuer-ID, SIM Eropa, PPN Jerman.

  • 4 pengenal pada 13 jam masing-masing = 52 jam kerja
  • Pada €100 per jam: sekitar €5.200

Itu hanya mencakup pembangunan pertama. Format berubah seiring waktu. Kasus edge baru muncul. Pembaruan API Presidio dapat merusak sesuatu. Setiap perubahan memerlukan pengembang untuk meninjau dan memperbaikinya. Pekerjaan berkelanjutan menambah biaya dari tahun ke tahun.

Perpustakaan Terkelola

anonym.legal memperluas Presidio dengan 285+ jenis entitas. Tim menjaga perpustakaan tetap terkini. Pengidentifikasi UE disertakan sejak hari pertama.

Yang melampaui default Presidio:

  • IBAN dalam semua format negara anggota UE
  • ID pajak negara anggota: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL, dan lainnya
  • ID kesehatan nasional Eropa
  • Nomor PPN (format UE)
  • Format SIM Eropa
  • Format paspor Eropa
  • Varian entitas dalam 48 bahasa yang didukung

Ketika Jerman memperbarui format ID pajak, pembaruan dikirimkan bersama layanan. Tidak diperlukan pull request dari tim Anda.

Untuk ID yang tidak ada dalam perpustakaan, pembuat entitas kustom memungkinkan Anda menambahkan pola. Tidak diperlukan kode Python.

Lihat detail keamanan dan kepatuhan untuk cara pembaruan dan jejak audit bekerja.

Contoh Fintech Jerman

Sebuah fintech Jerman perlu mendeteksi IBAN, BIC, Steuer-ID, dan Handelsregisternummer dalam berkas pelanggan.

Tingkat deteksi default Presidio untuk empat jenis ini: 0%.

Tidak ada yang ada dalam perpustakaan default. Ini bukan presisi yang buruk. Ini nol deteksi. Alat tidak hanya sebagian melewatkannya. Alat sama sekali tidak melihatnya.

Perbandingan biaya:

PendekatanBiaya tahun pertama
Pengenal kustom (4 × 13 jam pada €100/jam)~€5.200 ditambah pemeliharaan berkelanjutan
Perpustakaan entitas terkelola (paket Pro)€180/tahun, keempat tercakup

Selisihnya sekitar 29x di tahun pertama. Setiap tahun berikutnya, pemeliharaan kustom menambah lebih banyak biaya. Harga layanan terkelola tetap datar.

Kesimpulan

Default Presidio melayani kasus penggunaan AS dengan baik. Untuk deployment UE di bawah GDPR, mereka tidak memadai. Kesenjangan memerlukan pekerjaan pengenal kustom atau layanan terkelola.

Untuk tim UE di mana kepatuhan diperlukan dan waktu rekayasa terbatas, perpustakaan entitas UE yang sudah dibangun menghilangkan proyek pembangunan 50+ jam. Berkas dapat diproses sejak hari pertama. Tidak diperlukan kode kustom terlebih dahulu.

Sumber

Siap untuk melindungi data Anda?

Mulai anonimisasi PII dengan 285+ jenis entitas dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.