anonym.legal
Πίσω στο BlogGDPR & Συμμόρφωση

Γιατί 'Διαγράψτε τη Στήλη Email' Δεν Αρκεί...

Τα CSV ερευνητικών αρχείων περιέχουν PII όχι μόνο σε δομημένες στήλες αλλά και σε απαντήσεις ελεύθερου κειμένου.

April 21, 20267 λεπτά ανάγνωσης
research dataCSV anonymizationGDPR Article 89survey datadata sharing

Το Πρόβλημα PII Ελεύθερου Κειμένου στα CSV Ερευνητικών Δεδομένων

Ένα αρχείο ερευνητικών δεδομένων CSV με 5.000 απαντήσεις περιλαμβάνει:

respondent_id,age,region,comments
R4521,34,Yorkshire,"Εργάζομαι στο NHS ως νοσοκόμα στο Νοσοκομείο Αγίου Λουκά στο Bradford"
R4522,28,London,"Η εταιρεία μου Acme Solutions μόλις με απέλυσε"
R4523,45,Scotland,"Επικοινωνήστε μαζί μου στο firstname.lastname@gmail.com αν χρειαστείτε"

Η «στήλη σχολίων» δεν είναι δομημένα δεδομένα — είναι ελεύθερο κείμενο. Ο ερωτηθείς R4521 μόλις αυτοταυτοποιήθηκε: νοσοκόμα, NHS, συγκεκριμένο νοσοκομείο, Bradford. Ο R4522 προσδιόρισε τον εργοδότη. Ο R4523 παρείχε email.

Ανάλυση Κινδύνου GDPR για Δεδομένα Ερευνητικών CSV

Άμεση ταυτοποίηση:

  • Πλήρη ονόματα που αναφέρονται σε συγχωρήσεις
  • Διευθύνσεις email που παρέχονται εθελοντικά
  • Αριθμοί τηλεφώνου σε πεδία σχολίων

Έμμεση ταυτοποίηση (υψηλού κινδύνου):

  • Τίτλοι εργασίας + αναγνωριστικοί οργανισμοί + τοποθεσία → ταυτοποιεί ατομικά
  • Ιατρικές καταστάσεις + ηλικιακή ομάδα + περιφερειακά δεδομένα → ταυτοποιεί σε μικρά δείγματα

Τεχνική Λύση: Ανίχνευση Ελεύθερου Κειμένου Ανά Στήλη

Κατεβάστε τις στήλες ελεύθερου κειμένου ξεχωριστά για ανίχνευση PII, αντί να επεξεργαστείτε ολόκληρο το CSV ως δομημένα δεδομένα.

Πηγές:

Έτοιμοι να προστατεύσετε τα δεδομένα σας;

Ξεκινήστε την ανωνυμοποίηση PII με 285+ τύπους οντοτήτων σε 48 γλώσσες.