Því er GDPR ekki endalaust
Þegar fyrirtæki móttaka gagnaverndarbeiðni (DSAR), gefa þau oft út gögn sem dreifast um fjóra til sju mismunandi skjalsniðum.
Einn Excel-skrá með viðskiptavinalista getur innihaldið:
- Mótuðu dálka (tölur, texti, já/nei)
- Textareitir með flótandi PII (athugasemdir með netföngum)
- Faldin blöð og faldar línur
- Formúlur sem vísa í aðrar gagnagrunnastöðvar
Einn PDF-skjal getur innihaldið:
- Textaflöt (hægt að draga út)
- Myndir af innfærðum gögnum
- Formum með handskrifuðum innsláttum
- Þema myndir sem innihalda gögn
Ein JSON-skrá getur innihaldið:
- Vel skipulagðar svæði
- Innfallandi málmyndir
- Null og auð gildi sem feldu PII
- Athugasemdareintrygging
Næstum engin PII-afnögunartæki geta höndlað þetta endanlega flæktu. Flestir aðilar setja Python-textaeinkunningu innan á einfaldan PDF/Excel lausn.
Útkomuvogin? Endalaus handvirk endurskoðun, villan sem eru möguleg varðandi framkvæmd, og endaless verðhækkun.
Hvað þarf
Árangursríkt PII-afnögun á mörgum sniðum krefst:
- Margsniðsumsjón - PDF, Word, Excel, JSON, CSV, TXT, bls. allt sem fúið getur innihaldið
- Umfangsmikil aðgreining - Ekki bara þekkt svæði heldur frjáls texti
- Tengivinslur - Gagnagrunnur sem geta innihaldið gögn um gögn
- Útdráttur - Hægt að draga út gögn sem eru falið eða með myndum
- Sannprófun - Baka endalausrar grunnar fyrir endalaust PII
Anonym.legal inniheldur allt þetta.