Італійський Garante per la protezione dei dati personali (Garante) є найбільш агресивним регулятором конфіденційності ШІ в ЄС. У березні 2023 року Garante став першим у світі органом захисту даних, який тимчасово заборонив ChatGPT в Італії — змусивши OpenAI впровадити чітку верифікацію віку та заходи прозорості, перш ніж послугу було відновлено. У грудні 2024 року Garante оштрафував OpenAI на €15 мільйонів за незаконну обробку даних італійських користувачів.
Для організацій, що використовують інструменти ШІ в Італії — або розгортають системи ШІ, які можуть обробляти персональні дані італійців — практика виконання норм Garante встановлює найвимогливіші технічні очікування в ЄС.
Справа OpenAI/ChatGPT: що виявив Garante
Штраф Garante проти OpenAI у розмірі €15 мільйонів у грудні 2024 року ґрунтувався на кількох порушеннях:
Збій верифікації віку: ChatGPT був доступний для неповнолітніх в Італії без належної верифікації віку. Garante встановив, що OpenAI не впровадила розумних заходів для запобігання використанню дітьми до 13 років.
Незаконна обробка навчальних даних: Garante встановив, що використання OpenAI даних італійських користувачів для навчання ChatGPT 3.5/4 не мало належної правової підстави. Посилання на «законний інтерес» було відхилено — Garante дійшов висновку, що використання персональних даних для навчання комерційних моделей ШІ вимагає або згоди, або більш чіткої правової підстави, ніж зазвичай наводять постачальники великих мовних моделей.
Відсутність прозорості: OpenAI не повідомляв належним чином італійських користувачів про те, як їхні дані використовувались для навчання, або не надавав доступних механізмів відмови.
Практичні наслідки: Будь-яка система ШІ, що обробляє персональні дані італійців — незалежно від того, чи йдеться про навчання, тонке налаштування або виведення за запитами італійських користувачів — повинна мати задокументовану правову підставу GDPR за стандартами Garante, що виходить за рамки простих посилань на «законний інтерес». Зазвичай вимагається згода або конкретне виконання договору.
Італійські національні ідентифікатори
Codice fiscale: 16-символьний буквено-цифровий податковий код Італії — один із найбільш інформаційно насичених національних ідентифікаторів в ЄС. Структура:
- Символи 1–3: Приголосні прізвища (за конкретними правилами вилучення)
- Символи 4–6: Приголосні та голосні імені (за конкретними правилами вилучення)
- Символи 7–8: Дві останні цифри року народження
- Символ 9: Буква, що позначає місяць народження (A=січень, B=лютий, C=березень, D=квітень, E=травень, H=червень, L=липень, M=серпень, P=вересень, R=жовтень, S=листопад, T=грудень)
- Символи 10–11: День народження (чоловіки: номер дня; жінки: день + 40)
- Символи 12–15: Код Бельф'оре (4 символи) муніципалітету або країни народження
- Символ 16: Контрольний символ (буква, розрахована за конкретним алгоритмом)
Codice fiscale кодує початкові звуки прізвища, початкові звуки імені, дату народження, стать (через кодування дня народження) та місце народження. Це, мабуть, найбільш персонально ідентифікуючий національний ідентифікатор ЄС за інформаційним змістом.
Точність виявлення: Загальні інструменти NLP виявляють codice fiscale лише з точністю 67% (технічний аналіз Garante 2024 року). Збої: інструменти, що знаходять 16-символьні буквено-цифрові шаблони без реалізації алгоритму контрольного символу, не можуть відрізнити дійсні codici fiscali від хибних спрацьовувань; інструменти, що не реалізують правила вилучення прізвища/імені, не можуть перевірити існуючі номери.
Partita IVA: 11-значний номер ПДВ підприємства в Італії із контрольною цифрою, розрахованою за алгоритмом зваженої суми modulus-10. Остання цифра є контрольною. Partita IVA зустрічається у всіх італійських комерційних документах — рахунках-фактурах, контрактах та діловій кореспонденції.
Tessera sanitaria: Медична картка Італії — поєднує codice fiscale з додатковими специфічними для охорони здоров'я даними. Формат включає codice fiscale як компонент.
Вимоги Garante до інструментів ШІ
Рекомендації Garante щодо «технічних та організаційних заходів» для систем ШІ, що обробляють персональні дані Italian:
Перед обробкою ШІ: PII повинен бути ідентифікований та або видалений, або псевдонімізований перед введенням у системи ШІ. Контекст Chrome Extension/інтеграції ШІ Garante: будь-який інструмент ШІ, що отримує персональні дані Italien (імена, codici fiscali, медичні дані) у запитах, повинен мати ці ідентифікатори видаленими перед передачею.
Для навчання ШІ: Потрібна явна задокументована правова підстава. Згода є пріоритетною підставою для Garante при навчанні на контенті, створеному Italian користувачами. «Законний інтерес» вимагає задокументованого балансуючого тесту, що демонструє, що мета навчання не переважає інтереси Italian користувачів щодо захисту даних.
Для виходів ШІ: Системи, що генерують виходи про Italian осіб, повинні впроваджувати захисні заходи проти галюцинацій персональних даних (генерації неправдивої інформації, що приписується реальним особам) — Garante позначив це як специфічний ризик, що потребує технічного зменшення.
63% Italian підприємств не мають сумісних із GDPR політик управління даними ШІ (Garante 2024). Для організацій, що розгортають інструменти ШІ в Італії: виявлення codice fiscale та partita IVA з повною перевіркою контрольного символу, Italian NER (spaCy it_core_news) та задокументована правова підстава GDPR для будь-якого навчання ШІ на Italian персональних даних є базовими вимогами для відповідності Garante.
Джерела: