Itzuli BlogeraGDPR & Betetze

Zergatik Auto-Ostaluak PII Tresnak Huts egiten dute...

spaCy 3.4.4 sortzea desberdintsuak NER emaitza baino spaCy 3.5.1. Finantza-zerbitzuak enpresak aurkitzen 3% dokumentuetan anonimizatu ziren...

April 21, 20266 min irakurri
compliance auditenvironment consistencyspaCy versionsself-hosted PIIreproducible anonymization

Zergatik Auto-Ostaluak PII Tresnak Huts egiten dute Betetze Auditearen Ingurune Koherentzia-Arazoa

GDPRren erantzule nagusiaren gaitasunak eskatzen kontsistentea, erreproduzitzea tekniko neurriak. DPA auditeailenak ezbaietan nahiz anonimizazioa gertatua baina nahiz kontsistentea ziren jokoaren prozesuaren gainean.

Auto-ostaluak Presidio despliegua subjetu daude ingurune-espezifiko jokoarena sortzera anonimizazio emaitza direla desberdintsuak sarrera osoa gainean desberdintsuak inguruneak edo denboraaldiak:

Modeloen bertsioaren argaltzea: spaCy hizkuntzaren modeloak bertsio egiten dira. en_core_web_lg 3.4.4 eta en_core_web_lg 3.5.1 ziren entrenaturik desberdintsuak, desberdintsuak enpleguaren datua eta arkitekturak. Berdin dokumentua prozeztua bitan modeloen bertsio ditzake sortzera desberdintsuak NER emaitzak — desberdintsuak nortasun-izenak hautematian, desberdintsuak erakuntzaren sailketa, desberdintsuak lekuaren mugak.

Garapenean → eginduko-gela → produkzioaren lanean, modeloen bertsioeta ditzake:

  • Garatzea: en_core_web_lg 3.4.4 (instalaturik denbora proiektua sortzera)
  • Eginduko-gela: en_core_web_lg 3.5.0 (eguneratua ehun aritzen mantenimendua lanean)
  • Produkzioa: en_core_web_lg 3.5.1 (eguneratua ehun segurtasunaren zurmuna lanean)

Hiru inguruneak, hiru modeloen bertsioeta, hiru desberdintsuak detektatzea jokoenak. Betetze probekin p...

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.