Pengesanan ID Cukai Nasional EU: Corak untuk Kepatuhan GDPR di 27 Negara
ID Peribadi EU, Recital 26 GDPR: Setiap negara EU mempunyai pengenal peribadi yang unik yang boleh mengaitkan maklumat dengan individu. Untuk perlindungan data penuh, organisasi mesti mengesan dan menganonimkan ini.
Salah satu ID paling kerap ialah ID Cukai Nasional — format yang berbeza untuk setiap negara.
Corak Kunci EU
Jerman — Steueridentifikationsnummer (Stn)
Format: 11 digit (XXXXXXXXXXX) tanpa jeda Contoh: 12 345 678 901 Corak regex:
\b\d{2}\s?\d{3}\s?\d{3}\s?\d{3}\b
Konteks: "Steuernummer", "Steuer-ID", "TIN"
Perancis — Numéro SIRET
Format: 14 digit (SIREN 9 digit + NIC 5 digit) Contoh: 12 345 678 901 234 Corak regex:
\b\d{3}\s?\d{3}\s?\d{3}\s?\d{2,5}\b
Konteks: "SIRET", "SIREN", "numéro de TVA"
Itali — Codice Fiscale
Format: 16 watak (huruf + digit, contohnya RSSMRA99A01H501T) Corak regex:
\b[A-Z]{6}\d{2}[A-EHLMPRST]\d{2}[A-Z]\d{3}[A-Z]\b
Konteks: "codice fiscale", "CF"
Sepanyol — DNI (Documento Nacional de Identidad)
Format: 8 digit + 1 huruf (contohnya 12345678-X) Corak regex:
\b\d{8}[-]?[A-Z]\b
Konteks: "DNI", "español", "identidad"
Belanda — BSN (Burgerservicenummer)
Format: 9 digit (dengan mod 11 checksum) Contoh: 123 45 678 Corak regex:
\b\d{3}\s?\d{2}\s?\d{3}\b|\b\d{9}\b
Konteks: "BSN", "burgerservicenummer", "sofinummer"
Penganoniman di Presidio
Daftarkan pengesan setiap negara:
registry.add_recognizer(
PatternRecognizer(
entity_type="TAX_ID_GERMANY",
patterns=[
Pattern(
name="stn",
regex=r"\b\d{2}\s?\d{3}\s?\d{3}\s?\d{3}\b",
score=0.9
)
],
context=PatternRecognitionContext(
context_words=["Steuer", "Steuernummer"],
score_increment=0.1
)
)
)
Pemapis tersuai kemudian menganonimkan setiap pengenal dengan nama negara, contohnya "[REDACTED-GERMAN-TAX-ID]".
Senarai Lengkap 27 Negara EU
Kesimpulan: Penganoniman GDPR penuh memerlukan pengesanan ID Cukai untuk semua 27 negara EU. Setiap negara mempunyai format unik yang memerlukan corak regex dan konteks persekitaran khusus untuk pengesanan yang tepat.