Dades d'entrenament de ML: Presets de privacitat reproducibles
Quan un model de ML es distribueix, la reproducibilitat és critica:
- Mateixes dades entrada = mateix model sortida
- Mateixa anonimització entrada = mateixa pseudonimització sortida
Si la pseudonimització és aleatòria:
- Experiment 1: John Smith → EMP-00001
- Experiment 2: John Smith → EMP-99999
- Els investigadors no saben si les diferències són per variabilitat o pel model
Les anonimizaciones deterministes són critiques.