ANSPDCP Romania: Pengesanan CNP dan Pemeriksaan GDPR
Dikemas kini untuk 2026
Badan data Romania ialah ANSPDCP. Penilaian 2024-nya mendapati bahawa 78% alat PII gagal mengesan Cod Numeric Personal (CNP). Kebanyakan melangkau langkah checksum. Jurang itu menimbulkan risiko pematuhan yang nyata. Romania memproses data EU untuk ramai klien Barat. Pendedahannya luas.
ID Nasional Paling Kaya Data Romania
CNP ialah pengenal nasional 13 digit. Setiap kumpulan digit menyimpan data peribadi:
- Digit 1: Kod jantina dan abad. Lelaki lahir 1900-1999 = 1. Perempuan lahir 1900-1999 = 2. Lelaki lahir 2000+ = 5. Perempuan lahir 2000+ = 6. Pemastautin asing lelaki = 7. Pemastautin asing perempuan = 8. Pemastautin lain = 9.
- Digit 2-3: Dua digit terakhir tahun lahir.
- Digit 4-5: Bulan lahir (01-12).
- Digit 6-7: Hari lahir (01-31).
- Digit 8-9: Kod daerah. Merangkumi 41 daerah dan enam sektor Bucharest (kod 01-52).
- Digit 10-12: Susunan kelahiran dalam hari dan daerah tersebut.
- Digit 13: Digit semak.
Digit 1 sahaja mendedahkan jantina biologi. Di bawah Artikel 9 GDPR, itu menjadikan nombor ini item data kategori khas. Ia memerlukan perlindungan lebih kukuh daripada data peribadi biasa.
Cara digit semak berfungsi: Ambil 12 digit pertama. Darabkan setiap satu dengan pemberat (2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9). Tambah hasilnya. Bahagi dengan 11 dan ambil bakinya. Baki 10 memberikan digit semak 1. Baki 11 bermakna kod tidak sah. Mana-mana baki lain adalah digit semak.
Alat yang melangkau ujian ini mempunyai dua mod kegagalan. Pertama, mana-mana rentetan 13 digit ditandai sebagai padanan (positif palsu). Kedua, nombor yang rosak lulus pemeriksaan corak tetapi menyimpan data buruk. Data itu memerlukan semakan dan terlepas (negatif palsu).
Masalah NER dalam Dokumen Berbahasa Romania
Mengesan pengenal hanyalah sebahagian daripada kerja. Teks Romania menambah lebih banyak halangan pengesanan.
Diakritik: Romania menggunakan ș, ț, ă, â, dan î. Alat yang dilatih dalam bahasa lain sering terlepas nama dengan huruf-huruf ini. Dokumen lama dalam pengekodan Latin-2 menambah lebih banyak kegagalan.
Format alamat: Jenis jalan menggunakan bentuk pendek — Str., Bd., Al., Cal. Nama bandar dan komun mengikut peraturan tempatan. Penghurai yang dibina untuk alamat Perancis atau Jerman berprestasi buruk di sini.
Fleksi nama: Nama berubah bentuk mengikut kes tatabahasa dalam bahasa Romania. Nama orang yang sama kelihatan berbeza dalam bahagian ayat yang berbeza. Model NER mesti mengendalikan ini untuk menghubungkan nama merentasi dokumen.
Lihat panduan pengesanan PII APAC kami untuk cara jurang bahasa memberi kesan kepada pengesanan merentasi skrip bukan-Barat.
Cara Kes ANSPDCP Berkembang
Kes ANSPDCP menunjukkan tiga corak.
Kes pelanggaran BPO: Fail yang dikongsi menyimpan nombor ID pekerja dan data pelanggan EU tanpa penyulitan. Log yang lemah bermakna firma tidak dapat memberitahu rekod mana yang diakses. Itu melanjutkan siasatan dan meningkatkan denda.
Pendedahan penjagaan kesihatan: Fail pesakit — ID nasional, ID kad kesihatan, dan diagnosis — sampai kepada orang yang salah. Alat PII tidak menyokong format ini. Data keluar tanpa penyembunyian.
Kegagalan pemindahan rentas sempadan: Firma outsourcing menghantar rekod berkaitan pengenal kepada pihak bukan-EEA. Tiada Penilaian Impak Pemindahan. Tiada Klausa Kontrak Standard. Status Artikel 9 data mengubah jurang rutin menjadi pelanggaran yang lebih serius.
Tiga Kawalan untuk Pematuhan ANSPDCP
Tiga ini membentuk garis asas teknikal minimum:
- Pengesanan CNP dengan pengesahan modulo-11 — padanan corak sahaja tidak mencukupi.
- NER peka diakritik — merangkumi ș, ț, ă, â, dan î dalam sumber UTF-8 dan Latin-2.
- Pengesanan kad ID — kad nasional muncul bersama CNP dalam banyak jenis dokumen.
Untuk pandangan lebih luas tentang cara ID nasional mewujudkan risiko GDPR, lihat panduan pengesanan ID cukai nasional EU kami.