Rudi kwa BlogKitaalamu

Kufanya Kazi ya ML Data na Mipango ya Kutokuwa na Jina Inayorudia

Kwa ML mafunzo, utahitaji mipango ambayo inazaa matokeo sawa. Kila sasa unakutana na mteja "John Smith", utahitaji aliandike kama "[PERSON_1]" katika kila muda.

April 19, 20266 dakika kusoma
ML training datareproducible privacyGDPR AI ActCNIL enforcementdata science compliance

Kufanya Kazi ya ML Data na Mipango ya Kutokuwa na Jina Inayorudia

Kwa ML mafunzo, utahitaji:

  1. Taarifa ya Kutokuwa na Jina: Kila mteja analezwa na njia sawa
  2. Inayorudia: Kila sasa mteja sawa alionekana, njia sawa
  3. Ujinga: Haiwezi kuwa na "John Smith" katika faili moja na "John S." katika nyingine

Tatizo: Kila Njia Tofauti = Shida ya Kutokuwa na Jina

Kwa ML mafunzo:

  • Faili 1: "John Smith" → "[PERSON_1]"
  • Faili 2: "John Smith" → "[P_001]"
  • Faili 3: "John Smith" → "Mr. John"

ML wako itajifanya kwa sababu kila taarifa inatofauti.

Suluhisho: Marekebisho ya Inayorudia

Anonym.legal ina marekebisho ambayo zinazaa matokeo sawa:

Kila mtu "John Smith":

  • Faili 1 → "[PERSON_1]"
  • Faili 2 → "[PERSON_1]"
  • Faili 3 → "[PERSON_1]"

Hii ndiyo "inayorudia" - matokeo sawa kwa kila muda.


Soma pia:

Tayari kulinda data yako?

Anza kuanonymisha PII na aina 285+ za vitu katika lugha 48.