EU þjóðkirkjuskatts auðkenni PII greining: GDPR samhæf dulritun á skattum
Hvert EU-land hefur sitt eigið skatts auðkenni. Flestir PII greining verkætti ná ekki til þessara sniðmáta, sem gera GDPR samhæfi óhappilega.
EU skatts auðkenni sniðmáti
| Land | Auðkenni | Sniðmát | Dæmi |
|---|---|---|---|
| Þýskaland | SteuID | 11 stafir | 12 345 678 901 |
| Frakkland | SIRET | 14 stafir | 80001946500015 |
| Danmörk | CVR | 8 stafir | 12345678 |
| Ítalía | Codice Fiscale | 16 stafir | BNCTNT80A01H501X |
| Spánn | NIF | 8-9 stafir + stafir | 12345678-A |
| Hollan | BSN | 9 stafir | 123456789 |
| Belgía | NSS | 11 stafir | 12.34.56.789.01 |
| Svíþjóð | Personnummer | 12 stafir | 8001011234 |
| Noregi | Fødselsnummer | 11 stafir | 01011050000 |
| Austurríki | SV-Nummer | 10 stafir | 1234 567890 |
Enhver skatts auðkenni hefur sinn eigin sniðmát, stafafjölda, og útreikni gátbrodd.
Af hverju almennar PII greining bera ekki sig
Flestir PII greining verkætti notar endalok sniðmáti fyrir skatts auðkenni:
- Presidio - Þekkir SSNS (bandarískt skatts auðkenni) og nokkra EU skatts auðkenni, en ekki allt
- spaCy - Almenn NER lækan skilgreint endalok for EU skatts
- OpenAI API - Margt PII greining, en ekki allt EU skatts auðkenni
Þess vegna sakna mörg fyrirtæki EU skatts auðkenni í GDPR samhæfi dulritun.
Lausn: Eigin EU skatts auðkenni greining
Aðferð 1: Regex mynstri fyrir hvert land
Settu regex mynstri fyrir hvert EU skatts auðkenni:
tax_id_patterns = {
"DE": r"\d{11}", # SteuID - 11 stafir
"FR": r"\d{14}", # SIRET - 14 stafir
"DK": r"\d{8}", # CVR - 8 stafir
"IT": r"[A-Z]{6}\d{2}[A-Z]\d{2}[A-Z]\d{3}[A-Z]", # Codice - 16 stafir
"ES": r"\d{7,8}[A-Z]", # NIF - 8-9 stafir
}
Aðferð 2: Validation módúl
Validation útfæringu fyrir hvert skatts auðkenni:
def validate_de_steuid(steuid):
"""Validate German tax ID (11 digits)"""
if len(steuid) != 11:
return False
return steuid.isdigit()
def validate_it_codice(codice):
"""Validate Italian Codice Fiscale (16 chars)"""
if len(codice) != 16:
return False
# More complex validation with checksum
return validate_checksum(codice)
Aðferð 3: anonym.legal eigin greini
anonym.legal styður EU skatts auðkenni greini og dulritun fyrir:
- Þýskaland (SteuID)
- Frakkland (SIRET)
- Danmörk (CVR)
- Ítalía (Codice Fiscale)
- Spánn (NIF)
- Og fleiri EU löndum
Þar sem EU skatts auðkenni eru PII með GDPR vernd, rétt greining og dulritun eru nauðsynleg fyrir samhæfi.