Presidio Melewatkan 220+ Entitas GDPR: Kesenjangan Cakupan UE
Diperbarui untuk 2026
Microsoft Presidio dikirimkan dengan sekitar 40 pengenal entitas default. Untuk deployment AS, ini berfungsi. Mencakup SSN, paspor AS, SIM, kartu kredit, dan email.
Untuk deployment UE, kesenjangan ini besar. GDPR mencakup semua data pribadi UE. Ini berlaku tanpa memandang kewarganegaraan subjek data. Tim UE membutuhkan pengenal yang tidak disertakan Presidio.
Yang Disertakan Presidio
Default Presidio terbagi dalam empat kelompok.
ID berpusat di AS:
- US Social Security Number (SSN)
- US Passport Number
- US Driver's License Number
- US Bank Account Number
- US ITIN
- US Medical License Number
ID universal:
- Alamat Email
- Nomor Telepon
- Alamat IP
- Nomor Kartu Kredit
- Alamat Dompet Kripto
- URL
Entitas teks (berbasis NER):
- PERSON
- LOCATION
- ORGANIZATION
- DATE_TIME
Internasional terbatas:
- UK NHS Number
- UK National Insurance Number (NINO)
- Beberapa pengidentifikasi keuangan
Total: sekitar 40 pengenal.
Yang Dibutuhkan Tim UE
ID Keuangan
IBAN muncul di sebagian besar berkas bisnis UE. Ia muncul dalam pembayaran, faktur, dan penggajian. IBAN mengikuti ISO 13616. Presidio tidak memiliki pengenal IBAN.
Ambil sebuah fintech Jerman. Setiap berkas pembayaran memiliki IBAN. Tanpa deteksi IBAN, alat hanya mencari nomor kartu kredit. ID pembayaran UE utama terlewat. Itu berarti sepotong data yang dilindungi GDPR tidak pernah ditemukan.
ID Pajak Nasional
Tidak ada yang termasuk dalam default Presidio:
- Steueridentifikationsnummer Jerman: 11 digit
- NIR Prancis: 15 digit dengan kunci periksa
- Codice Fiscale Italia: 16 karakter dengan checksum
- NIF/NIE Spanyol: 9 karakter dengan huruf
- BSN Belanda: 9 digit dengan validasi elfproef
Tim penggajian UE menangani berkas dari banyak negara anggota. Tanpa ini, ia melewatkan ID paling sensitif dalam rekaman tersebut.
ID Kesehatan Nasional
UK NHS Number sudah tercakup. Yang berikut tidak:
- NIR Prancis (juga sebagai ID kesehatan)
- Krankenkassennummer Jerman
- Codice Fiscale Italia (juga sebagai ID kesehatan)
- BSN Belanda (digunakan untuk asuransi kesehatan)
Tim kesehatan UE membutuhkan ini untuk perlindungan data tingkat GDPR.
SIM Eropa
SIM Eropa termasuk dalam Directive 2006/126/EC. Setiap negara anggota memiliki formatnya sendiri. Struktur alfanumerik berbeda per negara. Presidio hanya memiliki pengenal SIM AS. Tidak ada dukungan SIM Eropa. Ini berarti data SIM Eropa melewati tanpa terdeteksi.
Nomor PPN
Nomor PPN UE muncul dalam setiap transaksi B2B. Format: kode negara 2 huruf ditambah 8–12 digit. Presidio tidak memiliki pengenal PPN. Nomor PPN terkait dengan perusahaan dan pemiliknya. Mereka adalah data pribadi di bawah GDPR.
Untuk informasi lebih lanjut tentang kewajiban GDPR, lihat sumber daya kepatuhan GDPR.
Biaya Pengenal Kustom
Ketika tim UE menemukan kesenjangan ini, mereka membangun pengenal kustom. Ini memakan waktu nyata.
Waktu per pengenal (perkiraan kasar):
- Riset format: 1–2 jam
- Tulis kelas Python: 2–4 jam
- Bangun regex dan validasi: 2–4 jam
- Tambahkan kata konteks: 1–2 jam
- Tulis pengujian: 2–3 jam
- Deploy dan periksa: 1–2 jam
Itu 9–17 jam per pengenal. Ini hanya perkiraan kasar.
Contoh: fintech Jerman membutuhkan empat pengenal.
IBAN, Steuer-ID, SIM Eropa, PPN Jerman.
- 4 pengenal pada 13 jam masing-masing = 52 jam kerja
- Pada €100 per jam: sekitar €5.200
Itu hanya mencakup pembangunan pertama. Format berubah seiring waktu. Kasus edge baru muncul. Pembaruan API Presidio dapat merusak sesuatu. Setiap perubahan memerlukan pengembang untuk meninjau dan memperbaikinya. Pekerjaan berkelanjutan menambah biaya dari tahun ke tahun.
Perpustakaan Terkelola
anonym.legal memperluas Presidio dengan 285+ jenis entitas. Tim menjaga perpustakaan tetap terkini. Pengidentifikasi UE disertakan sejak hari pertama.
Yang melampaui default Presidio:
- IBAN dalam semua format negara anggota UE
- ID pajak negara anggota: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL, dan lainnya
- ID kesehatan nasional Eropa
- Nomor PPN (format UE)
- Format SIM Eropa
- Format paspor Eropa
- Varian entitas dalam 48 bahasa yang didukung
Ketika Jerman memperbarui format ID pajak, pembaruan dikirimkan bersama layanan. Tidak diperlukan pull request dari tim Anda.
Untuk ID yang tidak ada dalam perpustakaan, pembuat entitas kustom memungkinkan Anda menambahkan pola. Tidak diperlukan kode Python.
Lihat detail keamanan dan kepatuhan untuk cara pembaruan dan jejak audit bekerja.
Contoh Fintech Jerman
Sebuah fintech Jerman perlu mendeteksi IBAN, BIC, Steuer-ID, dan Handelsregisternummer dalam berkas pelanggan.
Tingkat deteksi default Presidio untuk empat jenis ini: 0%.
Tidak ada yang ada dalam perpustakaan default. Ini bukan presisi yang buruk. Ini nol deteksi. Alat tidak hanya sebagian melewatkannya. Alat sama sekali tidak melihatnya.
Perbandingan biaya:
| Pendekatan | Biaya tahun pertama |
|---|---|
| Pengenal kustom (4 × 13 jam pada €100/jam) | ~€5.200 ditambah pemeliharaan berkelanjutan |
| Perpustakaan entitas terkelola (paket Pro) | €180/tahun, keempat tercakup |
Selisihnya sekitar 29x di tahun pertama. Setiap tahun berikutnya, pemeliharaan kustom menambah lebih banyak biaya. Harga layanan terkelola tetap datar.
Kesimpulan
Default Presidio melayani kasus penggunaan AS dengan baik. Untuk deployment UE di bawah GDPR, mereka tidak memadai. Kesenjangan memerlukan pekerjaan pengenal kustom atau layanan terkelola.
Untuk tim UE di mana kepatuhan diperlukan dan waktu rekayasa terbatas, perpustakaan entitas UE yang sudah dibangun menghilangkan proyek pembangunan 50+ jam. Berkas dapat diproses sejak hari pertama. Tidak diperlukan kode kustom terlebih dahulu.