Pengenalan PII Tersuai: Menganonimkan Pengecam Organisasi Berkaitan
PII piawai — SSN, email, nombor telefon, alamat — ditangani oleh pengesan GDPR/HIPAA biasa.
Tetapi organisasi anda juga menggunakan pengenal berpribadi yang bukan standard:
- ID Pekerja: EMP-2024-5731 untuk setiap pekerja dengan riwayat gaji, manfaat, rekod prestasi
- Kod Pelanggan: CUST_US_482019 untuk data pembayaran dan sejarah pesanan
- Nombor Kes/Tiket: CASE-88291 dalam komunikasi sokongan dengan butiran pelanggan
- ID Projek Dalaman: PROJ_2024Q3_447 dalam dokumentasi teknikal dengan nama rekrut dan deadline
Dalam konteks organisasi, pengenal ini adalah sama dengan PII — ia mengenal pasti individu atau transaksi dan boleh dikaitkan dengan maklumat peribadi.
Mengapa Pengesan Generik Tidak Mencukupi
Pengesan biasa mengesan "jenis" umum. Mereka tidak memahami:
- Semantik organisasi: EMP-2024-5731 adalah ID pekerja (mengandungi data gaji) tetapi PROJ-2024-5731 adalah ID projek (mungkin tidak)
- Konteks dokumen: Dalam laporan gaji, EMP-12345 adalah data pekerja sensitif; dalam senarai ahli pasukan, ia mungkin biasa terjadi
- Kolaborasi luar: Email yang dikirim kepada kontraktor mengandungi PROJ_ID berkaitan gaji — maklumat yang tidak patut dikongsi
Menentukan Pengesan Tersuai
Untuk setiap kategori ID organisasi, tentukan:
- Format corak
- Konteks persekitaran (perkataan di sebelahnya)
- Tahap kepercayaan deteksi
- Peraturan penganoniman
Contoh: ID Pekerja
{
"entity_type": "EMPLOYEE_ID",
"patterns": [
{
"name": "emp-standard",
"regex": "\\bEMP[-_]?(19|20)\\d{2}[-_]\\d{4,5}\\b",
"score": 0.9
},
{
"name": "emp-short",
"regex": "\\bEMP[:#]\\s*\\d{4,6}\\b",
"score": 0.75
}
],
"context": {
"regex": "salary|gaji|benefits|manfaat|personnel|pekerja|employee record",
"score_increment": 0.15
}
}
Contoh: ID Pelanggan
{
"entity_type": "CUSTOMER_ID",
"patterns": [
{
"name": "cust-regional",
"regex": "\\bCUST[_-](US|EU|APAC)[-_]\\d{6}\\b",
"score": 0.88
}
],
"context": {
"regex": "customer|payment|order|pesanan|account",
"score_increment": 0.12
}
}
Pengurusan Peringkat Organisasi
Untuk organisasi besar, buat daftar pengesan:
{
"organization": "Company Name",
"custom_recognizers": [
{ "type": "EMPLOYEE_ID", ... },
{ "type": "CUSTOMER_ID", ... },
{ "type": "PROJECT_CODE", ... },
{ "type": "INTERNAL_TICKET", ... }
]
}
Setiap pengecam boleh disatukan ke dalam Presidio atau API penganoniman tersuai anda.
Kesimpulan: PII sebenar organisasi anda meliputi lebih daripada email dan SSN. Penganoniman GDPR penuh memerlukan pengenal organisasi tersuai yang dijelaskan dan ditegakkan oleh peraturan.