Garante Italy: GDPR at Teknikal na Pagsunod sa PII
Na-update para sa 2026
Pinaka-Aktibong Privacy Regulator ng Italy
Ang Garante per la protezione dei dati personali ang awtoridad ng data ng Italy. Ito ang pinaka-aktibong AI regulator ng EU.
Dalawang aksyon ang nagtatakda ng pamamaraan nito. Noong Marso 2023, sinabi ng Garante sa OpenAI na ihinto ang ChatGPT para sa mga gumagamit sa Italy. Natuklasan nito na walang wastong legal na batayan para sa paggamit ng data. Natuklasan din nito na walang pag-check ng edad para sa mga menor de edad. Nagdagdag ang OpenAI ng mga kontrol sa edad, isang opt-out sa training, at isang abiso sa privacy sa Italian. Bumalik ang serbisyo noong Abril 2023.
Noong Disyembre 2024, pinarusahan ng awtoridad ang OpenAI ng €15 milyon. Tatlong bagay ang nagdulot ng multa: walang wastong legal na batayan, walang malinaw na abiso tungkol sa paggamit sa training, at walang pag-check ng edad para sa mga menor de edad.
Anumang tool ng AI na humahawak ng personal na data mula sa mga gumagamit sa Italy ay dapat matugunan ang parehong mga pamantayan.
Ano ang Nabigo sa Kaso ng OpenAI
Pinangalanan ng multa na €15 milyon ang mga tiyak na agwat. Bawat isa ay naimamapa sa isang nawawalang teknikal na kontrol.
Legal na batayan ng training data: Tinanggihan ng Garante ang "legitimate interest" bilang batayan para sa training sa data ng gumagamit. Nangangailangan ng explicit na pahintulot o batayan ng kontrata ang AI training sa personal na data. Ang pag-angkin ng "legitimate interest" lamang ay hindi pumapasa.
Transparency: Hindi sinabihan ang mga gumagamit kung paano ginagamit ang kanilang data para sa training. Wala silang malinaw na opt-out.
Pag-verify ng edad: Maaaring ma-access ng mga menor de edad ang ChatGPT nang walang pag-check ng edad. Tinatrato ito ng Garante bilang mahigpit na panuntunan para sa mga consumer AI tool.
Pangunahing implikasyon: Ang anumang sistema ng AI na tumatanggap ng input ng gumagamit sa Italy ay dapat may dokumentadong legal na batayan ng GDPR. Ang "legitimate interest" ay may mataas na panganib.
Mga Italian National Identifier
Ang Italy ay may natatanging mga format ng ID. Madalas na nami-miss ang mga ito ng mga generic na tool. Dapat saklawin ng iyong detection stack ang lahat ng tatlo.
Codice Fiscale
Ang codice fiscale ay isang 16-character na national ID. Nag-e-encode ito ng mga tunog ng apelyido, mga tunog ng pangalan, petsa ng kapanganakan, kasarian, at lugar ng kapanganakan. Ang huling karakter ay isang check digit.
Natuklasan ng teknikal na pagsusuri ng Garante noong 2024 na nakaka-detect ang mga generic na NLP tool ng codice fiscale sa 67% ng oras lamang. Ang pangunahing kabiguan: nagtutugma ang mga tool sa 16-character na pattern ngunit nilalaktawan ang lohika ng check digit. Nagbubunga sila ng mga false positive. Hindi rin ma-verify ng mga tool na nilalaktawan ang mga panuntunan sa pag-encode ng pangalan ang mga kasalukuyang code.
Tatlong bagay ang kailangan ng mahusay na pag-detect:
- Buong check character algorithm
- Mga panuntunan sa pagkuha ng titik ng apelyido at pangalan
- Pagsubok laban sa tunay na lokal na data
Partita IVA
Ang partita IVA ay ang 11-digit na business VAT number ng Italy. Ang huling digit ay isang check digit. Lumalabas ito sa mga invoice, kontrata, at liham ng negosyo. Dapat patakbuhin ng iyong tool ang check digit algorithm, hindi lamang tumugma sa isang 11-digit na pattern.
Tessera Sanitaria
Ang health card (tessera sanitaria) ay nagtatago ng codice fiscale bilang bahagi ng code nito. Ang data ng kalusugan ay special-category sa ilalim ng GDPR Article 9. Nagpapataas iyon ng kinakailangang antas ng pag-iingat.
Mga Kinakailangan ng Garante para sa Mga Tool ng AI
Sinasaklaw ng gabay ng Garante ang tatlong lugar.
Bago ang pagpoproseso ng AI: Ang PII ay dapat mahanap at alisin bago pumasok ang data sa isang sistema ng AI. Para sa mga tool ng AI na ginagamit sa Italy — kasama ang mga browser extension at MCP server — nangangahulugan ito ng pag-strip ng mga codici fiscali, partite IVA, at data ng kalusugan mula sa mga prompt bago ipadala. Tingnan ang aming gabay sa pagsunod para sa paraan ng pag-record ng hakbang na ito.
Para sa AI training: Kinakailangan ang explicit na legal na batayan. Ang pahintulot ang preferred na batayan ng Garante para sa training sa nilalaman ng gumagamit. Nangangailangan ang "legitimate interest" ng nakasulat na balancing test. Dapat ipakita ng pagsubok na iyon na ang layunin ng training ay hindi nagpapalabis sa mga karapatan ng data ng mga gumagamit.
Para sa mga output ng AI: Ang mga sistema na sumusulat ng nilalaman tungkol sa mga tunay na tao ay dapat tugunan ang panganib ng mga maling pahayag. Pinangalanan ng Garante ang gawa-gawang personal na data bilang isang natatanging panganib na nangangailangan ng teknikal na solusyon.
Ang 63% na Agwat sa Enterprise
Natuklasan ng pagsisiyasat ng Garante noong 2024 na 63% ng mga Italian na kumpanya ay walang GDPR-aligned na patakaran sa AI. Ginawa ng awtoridad ang agwat na ito na isang aktibong pokus ng pag-audit.
Mahirap ipagtanggol ang isang patakaran nang walang mga teknikal na kontrol. Tinatarget ng Garante ang mga kumpanyang umaasa sa mga kawani na mag-self-police ng paggamit ng data. Ipinapakita ng aming pangkalahatang-ideya ng seguridad kung paano sinusuportahan ng automated na mga kontrol ang nakasulat na patakaran.
Apat na Kontrol para sa Pagsunod sa Garante
1. Pre-submission PII filtering
I-strip ang codice fiscale, partita IVA, at data ng tessera sanitaria bago maabot ng input ang anumang modelo ng AI. Ito ang pangunahing teknikal na solusyon na hinihingi ng lohika ng kaso ng Garante.
2. Italian-language NER
Gumamit ng named entity model na sinanay sa Italian na teksto. Halimbawa, spaCy it_core_news. Nami-miss ng mga generic na modelo na sinanay sa English ang mga Italian na pattern ng pangalan. Tingnan ang aming gabay sa multilingual na pag-detect ng PII para sa pagpili ng modelo.
3. Dokumentasyon ng legal na batayan
Para sa bawat tool ng AI na ginagamit: isulat ang legal na batayan. Kung kasangkot ang training, idagdag ang balancing test. I-store ang mga ito kung saan mabilis na mahanap ng mga auditor.
4. Audit trail
I-log na tumakbo ang pag-filter, aling mga uri ng entity ang natuklasan, at ano ang tinanggal. Binibigyan nito ng ebidensya ang mga inspektor nang hindi kinakailangan ng matagal na manual na pagsusuri.