Geri Sayım Başladı

AB Yapay Zeka Yasası'nın yaptırım takvimi artık soyut değil. Madde 10'un eğitim verisi yönetişim zorunluluğu dahil olmak üzere yüksek riskli yapay zeka sistemi gereksinimleri 2 Ağustos 2026'dan itibaren uygulanıyor. Yüksek riskli yapay zeka sistemlerini eğiten, ince ayar yapan veya dağıtan ve uyumlu eğitim verisi uygulamaları henüz oluşturmamış kuruluşlar için yaklaşık beş aylık bir düzeltme süresi var.

Cezalar GDPR'dan daha büyük: hangisi daha yüksekse 35 milyon Euro veya küresel yıllık cirosun %7'si. GDPR 20 milyon Euro veya %4'te sınırlandırılıyor. AB Yapay Zeka Yasası, dünyanın herhangi bir yerinde yürürlükteki en yüksek riskli yapay zeka düzenlemesidir ve cezaları, büyük teknoloji şirketlerinin bile uyumsuzluğu bir iş yapma maliyeti olarak karşılayamamasını sağlayacak biçimde kalibre edilmiştir.

Yapay Zeka Sistemi Ne Zaman "Yüksek Riskli" Sayılır?

Yapay Zeka Yasası'nın risk sınıflandırması hangi yükümlülüklerin uygulanacağını belirliyor. Yüksek riskli sistemler (Ek III) aşağıdakilerde kullanılan yapay zekayı kapsıyor:

Eğitim ve mesleki eğitim — eğitim kurumlarına erişimi belirleyen veya öğrencileri değerlendiren sistemler
İstihdam — özgeçmiş taraması, mülakat puanlaması, iş gücü izleme
Temel hizmetler — kredi değerlendirme, sigorta fiyatlandırma, acil çağrı yönetimi
Kolluk — tahmine dayalı polislik, suç analitiği, biyometrik tanımlama
Sağlık hizmetleri — tıbbi cihaz yazılımı, klinik karar destek, hasta triyajı
Kritik altyapı — enerji, su, ulaşım ağlarını yöneten sistemler
Adalet idaresi — hukuki araştırma araçları, ceza öneri sistemleri

Kuruluşunuz bu kategorilerin herhangi birinde yapay zeka eğitiyorsa veya dağıtıyorsa Madde 10 sizin için geçerli.

Madde 10: Gerçekte Ne Gerektiriyor

AB Yapay Zeka Yasası'nın Madde 10'u, yüksek riskli yapay zeka sistemleri tarafından kullanılan eğitim, doğrulama ve test veri kümeleri için gereklilikler belirliyor. Temel gereklilikler:

1. Veri Yönetişim Uygulamaları

Eğitim veri kümeleri "uygun veri yönetişim ve yönetim uygulamalarına" tabi olmalı. Bu, veri toplama, veri kalitesi değerlendirmesi ve süregelen izleme için belgelenmiş prosedürleri kapsıyor. Uygulamalar, verinin kullanıldığı amacı ve toplanan veri kategorilerini kapsamalı.

2. Önyargılar İçin İnceleme

Eğitim verisi, ayrımcı çıktılara yol açabilecek "olası önyargılar" açısından incelenmeli. Bu gereklilik operasyonel açıdan önemli: yalnızca kasıtlı ayrımcı tasarımın yokluğunu değil, aktif önyargı testini zorunlu kılıyor.

3. İlgililik, Temsil Gücü ve Doğruluk

Veri kümeleri "ilgili, yeterince temsil edici ve mümkün olan en iyi ölçüde hatasız" olmalı. Bu, veri toplama metodolojisine uzanan bir kalite yükümlülüğü yaratıyor — belirli popülasyonları sistematik olarak yetersiz temsil eden kolaylık örnekleri veya taranmış web verisi, yüksek riskli uygulamalar için bu gerekliği karşılamayabilir.

4. Özel Kişisel Veri Kategorileri

Madde 10(5), mevcut veri kümelerine sahip kuruluşlar için en doğrudan uygulanabilir yükümlülüğü sağlıyor: yüksek riskli yapay zeka sistemleri özel kişisel veri kategorilerini (sağlık verileri, ırk veya etnik köken, siyasi görüşler, dini inançlar, biyometrik veriler) işlediğinde, bu kategoriler yalnızca "önyargı izleme, tespiti ve düzeltilmesini sağlamak amacıyla kesinlikle gerekli olduğunda" ve "gerçek kişilerin temel hakları ve çıkarları için uygun güvenceler kapsamında" işlenebilir.

Pratik sonuç: Yüksek riskli yapay zeka sistemleri için kullanılan çoğu eğitim veri kümesi kişisel veri içeriyor ve bunların çoğu özel kategoriler içeriyor. Madde 10, bu verinin yalnızca gerekli en az düzeyde işlenmesini ve uygun teknik güvenceler kapsamında tutulmasını gerektiriyor — bunların en sağlamlısı anonimleştirme.

Ceza Matematiği: Bu Neden GDPR'ı Aşıyor

AB Yapay Zeka Yasası'nın ceza yapısı, kasıtlı veya ihmalkar ihlaller için GDPR'ı aşıyor:

Düzenleme	Azami Ceza	Ciro Sınırı
GDPR	20 milyon Euro	Küresel cirosun %4'ü
AB Yapay Zeka Yasası (yüksek riskli)	15 milyon Euro	Küresel cirosun %3'ü
AB Yapay Zeka Yasası (yasaklanan uygulamalar)	35 milyon Euro	Küresel cirosun %7'si

Eğitim verisi ihlalleri için geçerli kademe, yüksek riskli sistem kademesidir (15 milyon Euro / %3). Ancak bir VKK'nın, kişisel verileri yeterli güvenceler olmaksızın eğitmek için kullanmanın yasaklanan bir uygulama oluşturduğuna karar vermesi durumunda — Yasa'nın yaptırım pratiği geliştikçe giderek daha olası hale gelen bir belirleme — yasaklanan uygulama cezaları uygulanır.

500 milyon Euro yıllık cirosu olan bir şirket için: %3 = 15 milyon Euro. 5 milyar Euro cirosu olan bir şirket için: %3 = 150 milyon Euro. Bunlar teorik maksimumlar değil — düzenleyicilerin uygulayacağı gerçek hesaplamalardır.

Anonimleştirme Neden Uyum Yanıtı

Anonimleştirme temel bir hukuki basitleştirme yaratır: anonimleştirilmiş veriler GDPR'ın kapsamı dışındadır ve bu nedenle eğitim verisi yönetişimi için Yapay Zeka Yasası risk yüzeyini azaltır.

Madde 10'un en ağır gereksinimleri — özel kategori işleme, kişisel veriyle önyargı izleme, eğitim kümelerindeki veri sahibi hakları — eğitim verisinin kişisel veri içermesi nedeniyle uygulanır. Eğitim başlamadan önce eğitim verisi gerçek anlamda anonimleştirilmişse, bu gereksinimler ya ortadan kalkar ya da önemli ölçüde azalır.

CNIL (Fransız veri koruma otoritesi), 2026'nın başında yayımladığı yapay zeka eğitimi tavsiyelerinde açıkça şunu belirtti: "Eğitim öncesi veri minimizasyonu — model performansı için kesinlikle gerekli olmayan kişisel verilerin anonimleştirilmesi dahil — Madde 10'a uyum için birincil teknik tedbirdir."

Bu marjinal bir yorum değil. AB'nin en teknik açıdan sofistike VKK'sının ana akım yaptırım tutumudur.

Eğitim Verisi için Anonimleştirme Pratik Olarak Ne Anlama Gelir

Eğitim verisi anonimleştirmesi, prodüksiyon verisi anonimleştirmesiyle aynı değil. Eğitim verisi tipik olarak şunlardan oluşur:

Gömülü KKB içeren belgeler — ince ayar örnekleri olarak kullanılan sözleşmeler, e-postalar, raporlar, destek biletleri
Yapılandırılmış kayıtlar — tahmine dayalı modeller eğitmek için kullanılan müşteri veri tabloları
Etiketlenmiş veri kümeleri — kişisel tanımlayıcılar içerebilen ek açıklamalı görüntüler veya metinler
Gerçek kayıtlara dayalı sentetik veri — burada sentetik üretim süreci tanımlayıcı desenleri koruyabilir

Eğitim verisi için etkili anonimleştirme, tüm bu biçimlerde KKB tespit etmeyi ve eğitim işi çalıştırılmadan önce değiştirmeyi veya maskelemeyi gerektirir. Varlık tespiti kapsamlı olmalı — "John Smith"in değiştirildiği ancak "42 Oak Street, Springfield'deki hasta"nın kaldığı verilerle eğitilen bir model, konum desenlerini demografik tahminlerle ilişkilendirmeyi öğrenir.

anonym.legal API'si, eğitim verisini toplu modda işleyerek 48 dilde 285'ten fazla varlık türünü tespit ediyor. Birden fazla dil pazarına hizmet veren Avrupalı yapay zeka şirketleri için yaygın bir senaryo olan çok dilli eğitim veri kümelerine sahip kuruluşlar için bu çapraz dil kapsamı zorunludur. Çok dilli eğitim kümesinin tek bir dilindeki uyum başarısızlığı, tüm sistem için Yapay Zeka Yasası maruziyeti yaratır.

Pratik Kılavuz: Eğitim Hattınızı Anonimleştirme

Adım 1: Eğitim veri kümelerinizi denetleyin

Anonimleştirmeden önce elinizde ne olduğunu bilmeniz gerekiyor. Tüm eğitim verisi kaynakları üzerinde bir tespit geçişi çalıştırın:

```bash

Eğitim belgelerinin bulunduğu bir dizini işle

curl -X POST https://anonym.legal/api/presidio/analyze \ -H "Authorization: Bearer API_ANAHTARINIZ" \ -H "Content-Type: application/json" \ -d '{ "text": "'"$(cat training_document.txt)"'", "language": "en" }' ```

Yanıt, türleri, konumları ve güven puanlarıyla tespit edilen tüm varlıkları listeler. Düzeltmeye başlamadan önce KKB maruziyetini anlamak için veri kümeniz genelinde toplayın.

Adım 2: Toplu anonimleştirme

Büyük eğitim veri kümeleri için birden fazla belgeyi paralel olarak işlemek üzere toplu uç noktayı kullanın:

```python import requests import os import json from pathlib import Path

def anonymize_training_batch(documents: list[dict]) -> list[dict]: response = requests.post( "https://anonym.legal/api/presidio/anonymize-batch", json={"items": documents, "language": "en"}, headers={"Authorization": f"Bearer {os.environ['ANONYM_API_KEY']}"} ) return response.json()["results"]

Eğitim belgelerini yükle

training_dir = Path("./training_data") docs = [ {"id": f.name, "text": f.read_text()} for f in training_dir.glob("*.txt") ]

50'lik gruplar halinde anonimleştir

batch_size = 50 for i in range(0, len(docs), batch_size): batch = docs[i:i+batch_size] results = anonymize_training_batch(batch) for result in results: output_path = training_dir / "anonymized" / result["id"] output_path.write_text(result["text"]) print(f"{result['id']} işlendi: {len(result['items'])} varlık kaldırıldı") ```

Adım 3: Süreci belgeleyin

Madde 10, belgelenmiş veri yönetişim uygulamaları gerektiriyor. Anonimleştirme süreci belgeleriniz şunları içermeli:

Kullanılan tespit modeli ve sürümü
Tespit edilen varlık türleri ve her biri için değiştirme stratejisi
Veri kümesi başına kaldırılan varlık sayılarının kaydı
Anonimleştirme tarihi ve kullanılan eğitim verisi sürümü

Bu belgeler, Madde 10(2)(a)'nın gerektirdiği "veri yönetişim ve yönetim uygulamalarını" oluşturuyor.

Colorado Yapay Zeka Yasası: Paralel ABD Yükümlülüğü

Colorado'nun Yapay Zeka Yasası 30 Haziran 2026'da yürürlüğe giriyor — AB Yapay Zeka Yasası'nın yüksek riskli yaptırım tarihinden beş hafta önce. Colorado yasası, algoritmik ayrımcılığa odaklanan Colorado hukuku kapsamındaki "yüksek riskli yapay zeka sistemleri" için benzer eğitim verisi yükümlülükleri getiriyor.

Hem AB'de hem de Colorado'da faaliyet gösteren kuruluşlar eş zamanlı uyum son tarihleriyle karşı karşıya. Anonimleştirme yaklaşımı her ikisini de karşılıyor: Madde 10 kapsamında eğitim verisi yönetişimi (AB) ve Colorado yasası kapsamında algoritmik ayrımcılık önleme tedbirleri. Teknik uygulama aynı.

Hemen Başlamak

Beş ay, çalışma hemen başlarsa eğitim verisi anonimleştirmesini uygulamak için yeterli. Haziran'da başlarsa yeterli değil.

Uyum sırası:

1-2. haftalar: Veri kümesi denetimi — hangi KKB'nin mevcut olduğunu anlayın
3-6. haftalar: Anonimleştirme hattı uygulaması ve testi
7-10. haftalar: Süreç belgeleme ve hukuki inceleme
11-16. haftalar: Doğrulama — anonimleştirilmiş veri kümelerinin Madde 10 kalite gereksinimlerini karşıladığını doğrulayın
2 Ağustos: Yaptırım tarihi — uyumlu eğitim verisi yönetişimi yerinde

anonym.legal API'si, altyapı değişikliği gerektirmeden mevcut eğitim hatlarına entegre oluyor. GDPR uyum kontrol listesi, GDPR ile Madde 10 arasında örtüşen veri yönetişim belgesi gereksinimlerini kapsıyor.

AB Yapay Zeka Yasası yaptırıma hazır. Yüksek riskli yapay zeka sistemleri geliştiren kuruluşlar için soru uyumun gerekip gerekmediği değil — 2 Ağustos'a kadar hazır olup olmayacakları.

GDPR uyum kontrol listesiyle başlayın →

Sınırlamalar ve Kalan Belirsizlikler

Yapay Zeka Yasası uyumu için anonimleştirme, önemli pratik zorluklarla birlikte gelişen bir alan:

Anonimleştirme eşikleri tanımlanmamış: AB Yapay Zeka Yasası, hangi anonimleştirme düzeyinin "yeterli" olduğunu belirtmiyor. Avrupa Yapay Zeka Ofisi rehberlik yayımlayana veya yaptırım eylemleri standartları netleştirene kadar, kuruluşlar anonimleştirme tekniklerinin düzenleyicileri tatmin edip etmeyeceği konusunda hukuki belirsizlikle karşı karşıya.

Yapay zeka eğitiminde yeniden tanımlama riski: Araştırmalar tutarlı biçimde büyük dil modellerinin iddia edilen anonimleştirilmiş kayıtlar dahil eğitim verilerini ezberleyip yeniden üretebildiğini gösteriyor. GDPR anonimleştirme standartlarını karşılayan teknikler, eğitilmiş modellerden KKB'nin düşman çıkarımına izin verebilir — eğitim öncesi anonimleştirme ile tam olarak ele alınmayan ayrı bir risk.

Sentetik veri sınırlamaları: Sentetik veri üretimi istatistiksel dağılımları korur ancak orijinal veriden yokken ince önyargılar getirebilir ya da nadir ama önemli uç durumları yakalayamazlar. Yalnızca sentetik veriyle eğitilen modeller gerçek dünya dağılımlarında prodüksiyonda düşük performans gösterebilir.

Madde 10 yorumlama açığı: Madde 10'daki "uygun teknik tedbirler" ifadesi yorum gerektiriyor ve çeşitli üye devletlerdeki erken VKK yaptırımı tutarlı standartlara ulaşamadı. Hukuk ekipleri 2026 boyunca EDPB rehberliğini ve üye devlet VKK kararlarını yakından takip etmeli.

Kaynaklar:

AB Yapay Zeka Yasası, Tüzük (AB) 2024/1689, Maddeler 9-17 (yüksek riskli yapay zeka yükümlülükleri), OJ L 2024/1689
AB Yapay Zeka Yasası, Madde 10 — Veri ve veri yönetişimi
CNIL yapay zeka eğitim verisi tavsiyeleri, Ocak 2026
Colorado Yapay Zeka Yasası, SB 205, yürürlük tarihi 30 Haziran 2026
AB Yapay Zeka Yasası yaptırım takvimi: yasaklanan uygulamalar 2 Şubat 2025; yüksek riskli sistemler 2 Ağustos 2026

AB Yapay Zeka Yasası Ağustos 2026: Madde 10'u Karşılamak için Eğitim Verisi Anonimleştirme

Geri Sayım Başladı

Yapay Zeka Sistemi Ne Zaman "Yüksek Riskli" Sayılır?

Madde 10: Gerçekte Ne Gerektiriyor

Ceza Matematiği: Bu Neden GDPR'ı Aşıyor

Anonimleştirme Neden Uyum Yanıtı

Eğitim Verisi için Anonimleştirme Pratik Olarak Ne Anlama Gelir

Pratik Kılavuz: Eğitim Hattınızı Anonimleştirme

Eğitim belgelerinin bulunduğu bir dizini işle

Eğitim belgelerini yükle

50'lik gruplar halinde anonimleştir

Colorado Yapay Zeka Yasası: Paralel ABD Yükümlülüğü

Hemen Başlamak

Sınırlamalar ve Kalan Belirsizlikler

İlgili Makaleler

Japan My Number: Verhoeff & APPI

HDPA Greece: AFM & AMKA Detection

NAIH Hungary: TAJ-Szám and Adóazonosító Jel

Verilerinizi korumaya hazır mısınız?

AB Yapay Zeka Yasası Ağustos 2026: Madde 10'u Karşılamak için Eğitim Verisi Anonimleştirme

Geri Sayım Başladı

Yapay Zeka Sistemi Ne Zaman "Yüksek Riskli" Sayılır?

Madde 10: Gerçekte Ne Gerektiriyor

Ceza Matematiği: Bu Neden GDPR'ı Aşıyor

Anonimleştirme Neden Uyum Yanıtı

Eğitim Verisi için Anonimleştirme Pratik Olarak Ne Anlama Gelir

Pratik Kılavuz: Eğitim Hattınızı Anonimleştirme

Eğitim belgelerinin bulunduğu bir dizini işle

Eğitim belgelerini yükle

50'lik gruplar halinde anonimleştir

Colorado Yapay Zeka Yasası: Paralel ABD Yükümlülüğü

Hemen Başlamak

Sınırlamalar ve Kalan Belirsizlikler

İlgili Makaleler

Japan My Number: Verhoeff & APPI

HDPA Greece: AFM & AMKA Detection

NAIH Hungary: TAJ-Szám and Adóazonosító Jel

Verilerinizi korumaya hazır mısınız?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow