Itzuli BlogeraTeknikoa

Berragerratzeko Pribatutasuna: Zergatik ML Taldeak...

ML entrenatzea daten anonimizazioa konsistentea eta berragerratzekoa izan behar du.

April 20, 20266 min irakurri
ML training datareproducible privacyGDPR AI ActCNIL enforcementdata science compliance

Berragerratzeko Pribatutasuna: Zergatik ML Taldeak Konfigurazio Presetuak Behar Dituzten, Ez Soilik Dokumentazioa

DPO-k anonimizazio prozesua dokumentatu zuen onartua. Honela adierazten du: izenak, emaila, telefonoak eta jaiotze eguna kendu entrenatzea daten balantza-metodoaren bidez. Dokumentua 4 orri du eta bete-wikian bizi dago.

Dotzena datena zientzalariak kontsultatzen dute proiektua hasieran. Autoerakuntzea anonimizazio-tresna ezberdinen bertsioak. Zenbait gehitze baliabidea errezeha. Hiru hilebete beranduago, entrenatzea daten gaiak ez diren konsistenteak.

CNIL-ek (Frantziaren DPA) 2024an AI konpainia anitz aztertu zituzten gaizki entrenatzea daten erabiltsa pribatutako datentzat. Dokumentazioa derrigorrezkoa da. Ez dago nahikoa. Teknikai soluzio presetua da.

Iturburuak:

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.