Kembali ke BlogGDPR & Pematuhan

Pengenalan PII Tersuai: Menganonimkan Pengecam...

Organisasi anda menggunakan ID pekerja, kod keluaran, atau pengenal dalaman lain yang bukan PII standard.

April 19, 20267 min baca
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

Pengenalan PII Tersuai: Menganonimkan Pengecam Organisasi Berkaitan

PII piawai — SSN, email, nombor telefon, alamat — ditangani oleh pengesan GDPR/HIPAA biasa.

Tetapi organisasi anda juga menggunakan pengenal berpribadi yang bukan standard:

  • ID Pekerja: EMP-2024-5731 untuk setiap pekerja dengan riwayat gaji, manfaat, rekod prestasi
  • Kod Pelanggan: CUST_US_482019 untuk data pembayaran dan sejarah pesanan
  • Nombor Kes/Tiket: CASE-88291 dalam komunikasi sokongan dengan butiran pelanggan
  • ID Projek Dalaman: PROJ_2024Q3_447 dalam dokumentasi teknikal dengan nama rekrut dan deadline

Dalam konteks organisasi, pengenal ini adalah sama dengan PII — ia mengenal pasti individu atau transaksi dan boleh dikaitkan dengan maklumat peribadi.

Mengapa Pengesan Generik Tidak Mencukupi

Pengesan biasa mengesan "jenis" umum. Mereka tidak memahami:

  • Semantik organisasi: EMP-2024-5731 adalah ID pekerja (mengandungi data gaji) tetapi PROJ-2024-5731 adalah ID projek (mungkin tidak)
  • Konteks dokumen: Dalam laporan gaji, EMP-12345 adalah data pekerja sensitif; dalam senarai ahli pasukan, ia mungkin biasa terjadi
  • Kolaborasi luar: Email yang dikirim kepada kontraktor mengandungi PROJ_ID berkaitan gaji — maklumat yang tidak patut dikongsi

Menentukan Pengesan Tersuai

Untuk setiap kategori ID organisasi, tentukan:

  1. Format corak
  2. Konteks persekitaran (perkataan di sebelahnya)
  3. Tahap kepercayaan deteksi
  4. Peraturan penganoniman

Contoh: ID Pekerja

{
  "entity_type": "EMPLOYEE_ID",
  "patterns": [
    {
      "name": "emp-standard",
      "regex": "\\bEMP[-_]?(19|20)\\d{2}[-_]\\d{4,5}\\b",
      "score": 0.9
    },
    {
      "name": "emp-short",
      "regex": "\\bEMP[:#]\\s*\\d{4,6}\\b",
      "score": 0.75
    }
  ],
  "context": {
    "regex": "salary|gaji|benefits|manfaat|personnel|pekerja|employee record",
    "score_increment": 0.15
  }
}

Contoh: ID Pelanggan

{
  "entity_type": "CUSTOMER_ID",
  "patterns": [
    {
      "name": "cust-regional",
      "regex": "\\bCUST[_-](US|EU|APAC)[-_]\\d{6}\\b",
      "score": 0.88
    }
  ],
  "context": {
    "regex": "customer|payment|order|pesanan|account",
    "score_increment": 0.12
  }
}

Pengurusan Peringkat Organisasi

Untuk organisasi besar, buat daftar pengesan:

{
  "organization": "Company Name",
  "custom_recognizers": [
    { "type": "EMPLOYEE_ID", ... },
    { "type": "CUSTOMER_ID", ... },
    { "type": "PROJECT_CODE", ... },
    { "type": "INTERNAL_TICKET", ... }
  ]
}

Setiap pengecam boleh disatukan ke dalam Presidio atau API penganoniman tersuai anda.

Kesimpulan: PII sebenar organisasi anda meliputi lebih daripada email dan SSN. Penganoniman GDPR penuh memerlukan pengenal organisasi tersuai yang dijelaskan dan ditegakkan oleh peraturan.

Sedia untuk melindungi data anda?

Mulakan pengenalan PII dengan 285+ jenis entiti dalam 48 bahasa.