By · Last updated 2026-06-05

Kembali ke BlogGDPR & Kepatuhan

Garante Italia: Kepatuhan AI & PII

Garante Italia mendenda OpenAI €15 juta pada Desember 2024 dan sempat melarang ChatGPT pada 2023. 63% perusahaan Italia tidak memiliki kebijakan tata kelola data AI.

June 5, 20269 menit baca
Italy Garantecodice fiscale detectionChatGPT ban ItalyItalian data protectionAI GDPR compliance

Garante Italia: Kepatuhan GDPR dan PII Secara Teknis

Diperbarui untuk 2026

Regulator Privasi Paling Aktif Italia

Garante per la protezione dei dati personali adalah otoritas data Italia. Ini adalah regulator AI paling aktif di UE.

Dua tindakan mendefinisikan pendekatannya. Pada Maret 2023, Garante memerintahkan OpenAI untuk menghentikan ChatGPT bagi pengguna di Italia. Garante menemukan tidak ada dasar hukum yang valid untuk penggunaan data. Garante juga menemukan tidak ada pemeriksaan usia untuk anak di bawah umur. OpenAI menambahkan kontrol usia, opsi opt-out pelatihan, dan pemberitahuan privasi dalam bahasa Italia. Layanan kembali aktif pada April 2023.

Pada Desember 2024, otoritas mendenda OpenAI €15 juta. Tiga hal menyebabkan denda tersebut: tidak ada dasar hukum yang valid, tidak ada pemberitahuan yang jelas tentang penggunaan pelatihan, dan tidak ada pemeriksaan usia untuk anak di bawah umur.

Alat AI apa pun yang menangani data pribadi dari pengguna di Italia harus memenuhi standar yang sama ini.

Apa yang Gagal dalam Kasus OpenAI

Denda €15 juta menyebutkan kesenjangan spesifik. Masing-masing dipetakan ke kontrol teknis yang hilang.

Dasar hukum data pelatihan: Garante menolak "kepentingan sah" sebagai dasar untuk pelatihan pada data pengguna. Pelatihan AI pada data pribadi memerlukan persetujuan eksplisit atau dasar kontrak. Klaim "kepentingan sah" saja tidak lolos.

Transparansi: Pengguna tidak diberitahu bagaimana data mereka digunakan untuk pelatihan. Mereka tidak memiliki opsi opt-out yang jelas.

Verifikasi usia: Anak di bawah umur dapat mengakses ChatGPT tanpa pemeriksaan usia. Garante memperlakukan ini sebagai aturan keras untuk alat AI konsumen.

Implikasi utama: Sistem AI apa pun yang menerima masukan pengguna di Italia harus memiliki dasar hukum GDPR yang terdokumentasi. "Kepentingan sah" berisiko tinggi.

Pengenal Nasional Italia

Italia memiliki format ID yang unik. Alat generik sering melewatkannya. Tumpukan deteksi Anda harus mencakup ketiganya.

Codice Fiscale

Codice fiscale adalah ID nasional 16 karakter. Ini mengkodekan bunyi nama belakang, bunyi nama depan, tanggal lahir, jenis kelamin, dan kota lahir. Karakter terakhir adalah digit cek.

Analisis teknis Garante dari 2024 menemukan bahwa alat NLP generik hanya menangkap codice fiscale 67% dari waktu. Kegagalan utama: alat mencocokkan pola 16 karakter tetapi melewatkan logika digit cek. Kemudian mereka menghasilkan positif palsu. Alat yang melewatkan aturan pengkodean nama juga tidak dapat memverifikasi kode yang ada.

Deteksi yang baik membutuhkan tiga hal:

  • Algoritma karakter cek penuh
  • Aturan ekstraksi huruf nama belakang dan nama depan
  • Pengujian terhadap data lokal nyata

Partita IVA

Partita IVA adalah nomor PPN bisnis Italia 11 digit. Digit terakhir adalah digit cek. Muncul dalam faktur, kontrak, dan surat bisnis. Alat Anda harus menjalankan algoritma digit cek, bukan hanya mencocokkan pola 11 digit.

Tessera Sanitaria

Kartu kesehatan (tessera sanitaria) menyimpan codice fiscale sebagai bagian dari kodenya. Data kesehatan adalah kategori khusus berdasarkan Pasal 9 GDPR. Itu meningkatkan tingkat perlindungan yang diperlukan.

Persyaratan Garante untuk Alat AI

Panduan Garante mencakup tiga area.

Sebelum pemrosesan AI: PII harus ditemukan dan dihapus sebelum data memasuki sistem AI. Untuk alat AI yang digunakan di Italia — termasuk ekstensi browser dan server MCP — ini berarti menghapus codici fiscali, partite IVA, dan data kesehatan dari prompt sebelum dikirim. Lihat panduan kepatuhan kami untuk cara mencatat langkah ini.

Untuk pelatihan AI: Diperlukan dasar hukum yang eksplisit. Persetujuan adalah dasar yang disukai Garante untuk pelatihan pada konten pengguna. "Kepentingan sah" memerlukan uji penyeimbangan tertulis. Uji tersebut harus menunjukkan tujuan pelatihan tidak mengabaikan hak data pengguna.

Untuk output AI: Sistem yang menulis konten tentang orang nyata harus mengatasi risiko klaim palsu. Garante telah menyebut data pribadi yang difabrikasi sebagai risiko berbeda yang memerlukan perbaikan teknis.

Kesenjangan Perusahaan 63%

Survei Garante 2024 menemukan bahwa 63% perusahaan Italia tidak memiliki kebijakan AI yang selaras dengan GDPR. Otoritas telah menjadikan kesenjangan ini sebagai fokus audit aktif.

Kebijakan tanpa kontrol teknis sulit dipertahankan. Garante menargetkan perusahaan yang mengandalkan staf untuk mengatur sendiri penggunaan data. Ikhtisar keamanan kami menunjukkan bagaimana kontrol otomatis mendukung kebijakan tertulis.

Empat Kontrol untuk Kepatuhan Garante

1. Penyaringan PII pra-pengiriman

Hapus data codice fiscale, partita IVA, dan tessera sanitaria sebelum input mencapai model AI apa pun. Ini adalah perbaikan teknis utama yang dituntut logika kasus Garante.

2. NER berbahasa Italia

Gunakan model entitas bernama yang dilatih pada teks Italia. Misalnya, spaCy it_core_news. Model yang dilatih dalam bahasa Inggris generik melewatkan pola nama Italia. Lihat panduan deteksi PII multibahasa kami untuk pemilihan model.

3. Dokumentasi dasar hukum

Untuk setiap alat AI yang digunakan: tuliskan dasar hukumnya. Jika pelatihan terlibat, tambahkan uji penyeimbangan. Simpan di tempat yang dapat ditemukan auditor dengan cepat.

4. Jejak audit

Catat bahwa penyaringan berjalan, jenis entitas apa yang ditemukan, dan apa yang dihapus. Ini memberi pemeriksa bukti yang mereka butuhkan tanpa tinjauan manual yang panjang.

Sumber

Siap untuk melindungi data Anda?

Mulai anonimisasi PII dengan 285+ jenis entitas dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.