ANSPDCP Rumania: Deteksi CNP dan Pemeriksaan GDPR
Diperbarui untuk 2026
Lembaga perlindungan data Rumania adalah ANSPDCP. Penilaian tahun 2024 menemukan bahwa 78% alat PII gagal mendeteksi Cod Numeric Personal (CNP). Kebanyakan melewatkan langkah checksum. Kesenjangan ini menciptakan risiko kepatuhan nyata karena Rumania memproses data UE untuk banyak klien Barat, sehingga paparan menjadi sangat luas.
ID Nasional Paling Kaya Data di Rumania
CNP adalah pengenal nasional 13 digit. Setiap kelompok digit menyimpan data pribadi:
- Digit 1: Kode gender dan abad. Laki-laki lahir 1900–1999 = 1. Perempuan lahir 1900–1999 = 2. Laki-laki lahir 2000+ = 5. Perempuan lahir 2000+ = 6. Penduduk asing laki-laki = 7. Penduduk asing perempuan = 8. Penduduk lainnya = 9.
- Digit 2–3: Dua digit terakhir tahun lahir.
- Digit 4–5: Bulan lahir (01–12).
- Digit 6–7: Hari lahir (01–31).
- Digit 8–9: Kode kabupaten, mencakup 41 kabupaten dan enam sektor Bucharest (kode 01–52).
- Digit 10–12: Urutan kelahiran dalam hari dan kabupaten tersebut.
- Digit 13: Digit pemeriksaan.
Digit 1 saja sudah mengungkapkan jenis kelamin biologis. Berdasarkan Pasal 9 GDPR, hal ini menjadikan nomor ini item data kategori khusus yang memerlukan perlindungan lebih kuat dari data pribadi biasa.
Cara digit pemeriksaan bekerja: Ambil 12 digit pertama. Kalikan masing-masing dengan bobotnya (2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9). Jumlahkan hasilnya. Bagi dengan 11 dan ambil sisanya. Sisa 10 menghasilkan digit pemeriksaan 1. Sisa 11 berarti kode tidak valid. Sisa lainnya menjadi digit pemeriksaan.
Alat yang melewatkan pengujian ini memiliki dua mode kegagalan. Pertama, setiap string 13 digit ditandai sebagai kecocokan (positif palsu). Kedua, nomor yang rusak lolos pemeriksaan pola tetapi menyimpan data buruk yang perlu ditinjau namun terlewatkan (negatif palsu).
Masalah NER dalam Dokumen Berbahasa Rumania
Menemukan pengenal hanyalah sebagian dari pekerjaan. Teks berbahasa Rumania menambah hambatan deteksi lebih lanjut.
Diakritik: Bahasa Rumania menggunakan ș, ț, ă, â, dan î. Alat yang dilatih dalam bahasa lain sering melewatkan nama dengan huruf-huruf ini. Dokumen lama dalam pengkodean Latin-2 menambah lebih banyak kegagalan.
Format alamat: Jenis jalan menggunakan singkatan — Str., Bd., Al., Cal. Nama kota dan komune mengikuti aturan lokal. Parser yang dibangun untuk alamat Prancis atau Jerman tidak berfungsi baik di sini.
Infleksi nama: Nama berubah bentuk berdasarkan kasus gramatikal dalam bahasa Rumania. Nama orang yang sama terlihat berbeda di bagian berbeda dari kalimat. Model NER harus menangani ini untuk menghubungkan nama di seluruh dokumen.
Lihat panduan deteksi PII APAC kami untuk melihat bagaimana kesenjangan bahasa memengaruhi deteksi di berbagai skrip non-Barat.
Cara Kasus ANSPDCP Berkembang
Kasus ANSPDCP menunjukkan tiga pola.
Kasus pelanggaran BPO: File bersama menyimpan nomor ID karyawan dan data pelanggan UE tanpa enkripsi. Log yang buruk berarti perusahaan tidak dapat mengetahui rekaman mana yang diakses, memperpanjang penyelidikan dan meningkatkan denda.
Paparan layanan kesehatan: Berkas pasien — ID nasional, ID kartu kesehatan, dan diagnosis — sampai ke orang yang salah. Alat PII tidak mendukung format ini, sehingga data keluar tanpa masking.
Kegagalan transfer lintas batas: Perusahaan outsourcing mengirim catatan tertaut pengenal ke pihak non-EEA tanpa Transfer Impact Assessment atau Standard Contractual Clauses. Status Pasal 9 dari data tersebut mengubah celah rutin menjadi pelanggaran yang lebih serius.
Tiga Kontrol untuk Kepatuhan ANSPDCP
Tiga hal berikut membentuk standar teknis minimum:
- Deteksi CNP dengan validasi modulo-11 — pencocokan pola saja tidak cukup.
- NER sadar-diakritik — cakup ș, ț, ă, â, dan î dalam sumber UTF-8 maupun Latin-2.
- Deteksi kartu ID — kartu nasional muncul bersamaan dengan CNP dalam banyak jenis dokumen.
Untuk pandangan lebih luas tentang bagaimana ID nasional menciptakan risiko GDPR, lihat panduan deteksi ID pajak nasional UE kami.