Til baka á BloggGDPR & Samræmi

EU þjóðkirkjuskatts auðkenni PII greining...

Hvert EU-land hefur sitt eigið skattauðkenni sniðmát. Þýskaland notar Steueridentifikationsnummer (11 stafir), Frakkland notar SIRET (14 stafir)...

April 19, 20267 mín lestur
EU national identifiersSteueridentifikationsnummerCodice FiscaleNIFmultinational GDPRtax ID detection

EU þjóðkirkjuskatts auðkenni PII greining: GDPR samhæf dulritun á skattum

Hvert EU-land hefur sitt eigið skatts auðkenni. Flestir PII greining verkætti ná ekki til þessara sniðmáta, sem gera GDPR samhæfi óhappilega.

EU skatts auðkenni sniðmáti

LandAuðkenniSniðmátDæmi
ÞýskalandSteuID11 stafir12 345 678 901
FrakklandSIRET14 stafir80001946500015
DanmörkCVR8 stafir12345678
ÍtalíaCodice Fiscale16 stafirBNCTNT80A01H501X
SpánnNIF8-9 stafir + stafir12345678-A
HollanBSN9 stafir123456789
BelgíaNSS11 stafir12.34.56.789.01
SvíþjóðPersonnummer12 stafir8001011234
NoregiFødselsnummer11 stafir01011050000
AusturríkiSV-Nummer10 stafir1234 567890

Enhver skatts auðkenni hefur sinn eigin sniðmát, stafafjölda, og útreikni gátbrodd.

Af hverju almennar PII greining bera ekki sig

Flestir PII greining verkætti notar endalok sniðmáti fyrir skatts auðkenni:

  1. Presidio - Þekkir SSNS (bandarískt skatts auðkenni) og nokkra EU skatts auðkenni, en ekki allt
  2. spaCy - Almenn NER lækan skilgreint endalok for EU skatts
  3. OpenAI API - Margt PII greining, en ekki allt EU skatts auðkenni

Þess vegna sakna mörg fyrirtæki EU skatts auðkenni í GDPR samhæfi dulritun.

Lausn: Eigin EU skatts auðkenni greining

Aðferð 1: Regex mynstri fyrir hvert land

Settu regex mynstri fyrir hvert EU skatts auðkenni:

tax_id_patterns = {
    "DE": r"\d{11}",           # SteuID - 11 stafir
    "FR": r"\d{14}",           # SIRET - 14 stafir
    "DK": r"\d{8}",            # CVR - 8 stafir
    "IT": r"[A-Z]{6}\d{2}[A-Z]\d{2}[A-Z]\d{3}[A-Z]",  # Codice - 16 stafir
    "ES": r"\d{7,8}[A-Z]",     # NIF - 8-9 stafir
}

Aðferð 2: Validation módúl

Validation útfæringu fyrir hvert skatts auðkenni:

def validate_de_steuid(steuid):
    """Validate German tax ID (11 digits)"""
    if len(steuid) != 11:
        return False
    return steuid.isdigit()

def validate_it_codice(codice):
    """Validate Italian Codice Fiscale (16 chars)"""
    if len(codice) != 16:
        return False
    # More complex validation with checksum
    return validate_checksum(codice)

Aðferð 3: anonym.legal eigin greini

anonym.legal styður EU skatts auðkenni greini og dulritun fyrir:

  • Þýskaland (SteuID)
  • Frakkland (SIRET)
  • Danmörk (CVR)
  • Ítalía (Codice Fiscale)
  • Spánn (NIF)
  • Og fleiri EU löndum

Þar sem EU skatts auðkenni eru PII með GDPR vernd, rétt greining og dulritun eru nauðsynleg fyrir samhæfi.

Ertu tilbúinn að vernda gögnin þín?

Byrjaðu að anonymiza PII með 285+ gerðum í 48 tungumálum.