Tarehe Iliyowekwa Inaanza
Tarehe ya tekeleza ya EU AI Sheria si tena kwa kufikiria. Mahitaji ya mifumo ya AI yenye hatari — ikiwa ni pamoja na maagizo ya Makala 10 ya miundombuni ya data ya ujumuishaji — kutumika kutoka Agosti 2, 2026. Shirikishi ambayo unajumuisha, kusasisha, au kuandika mifumo ya AI yenye hatari na haisomi kujenga miundombuni salama ya data ya ujumuishaji hana takribani miezi mitano kukamatika.
Kumfanya ni kubwa kuliko GDPR: hadi €35 milioni au 7% ya kuzuia ya jumla kwa mwaka, kuchukua zaidi. GDPR nawa hadi €20 milioni au 4%. EU AI Sheria ni kumfanya ya AI yenye hatari zaidi katika nguvu mahali pandapo duniani, na kumfanya kujaribisha kukamatika kuwa hata kampuni kubwa za teknolojia hairezi kusambu kwa budi ya kukamatika kwa gharama ya biashara.
Nini Inajumuesha AI Mfumo "Yenye Hatari"?
Tajinifu ya hatari ya Sheria inakamatika mahitaji gani inatumika. Mifumo yenye hatari (Annex III) yajujumuesha AI inatumiwa katika:
- Elimu na utofauti wa kazi — mifumo inakukamatika upatikanaji kwa taasisi za elimu au kukamatika wanafunzi
- Kazi — kukamatika kwa CV, kukamatika kwa mahojiano, kuzuia kwa kazi
- Huduma za kawaida — tathmini ya karibu halisi, bei ya bima, kukamatika kwa dharura
- Utawala wa sheria — kutabiri usalama, uchambuzi wa kosa, kutambua kwa kiunganishi
- Huduma ya kawaida — programu ya vifaa vya kawaida, msaada wa uamuzi wa kawaida, mwanafunzi ya wagonjwa
- Miundombuni ya muhimu — mifumo inayosimamia nishati, maji, mitandao ya kueneza
- Utawala wa haki — zana za utafiti wa kisheria, mifumo ya kumfanya kwa kumfanya
Ka shirikishi lako unajumuisha au kuandika AI katika jamii yoyote hii, Makala 10 inatumika kwa wewe.
Makala 10: Nini Haswa Inahitaji
Makala 10 ya EU AI Sheria inajumuesha mahitaji kwa ujumuishaji, kuangalia, na kujaribu seti zinazotumiwa na mifumo yenye hatari ya AI. Mahitaji ya kawaida:
1. Miundombuni ya Kukamatika Data
Seti za ujumuishaji lazima kuwa chini ya "miundombuni ya kukamatika na kusimamia data kwa kukamatika." Hii yajujumuesha hujifanya kwa kukamatika data, tathmini ya ubora wa data, na ongeza-nza inayoendelea. Miundombuni lazima iyake madhumuni ambayo data inajumuisha na jamii za data zinazokamatika.
2. Kuchunguza kwa Mipango ya Ndilo
Data ya ujumuishaji lazima iangalwe kwa "mipango inayoweza ya kubwa" inayoweza kusababisha matokeo yanayosambaza. Mahitaji hii ni operasional muhimu: inajumuesha utafiti wa ndilo wa kazi, si kumkubaliana na kukuwa ndilo inayokusudiwa.
3. Kuhusiana, Kiswahili, na Usahihi
Seti lazima kuwa "inayohusiana, inatosha inawakilisha, na kwa kwa kiasi kikubwa, bila makosa." Hii inajumuesha mahitaji ya ubora yenye miundombuni ya kukamatika data — sampuli ya rahisi au data iliyochezwa inayoweza kusambaza wazi iliyopo inaweza si kukamatika mahitaji hii kwa programu yenye hatari.
4. Jamii Mahsusi ya Data Mahala
Makala 10(5) inatoa mahitaji yenye karibu inayoweza kukamatika: linapokuwa mifumo yenye hatari ya AI yajujumuesha kukamatika jamii mahsusi ya data mahala (data ya kawaida, asili ya rangi au mahale, maoni ya kufa, imani ya dini, kuzimu kwa biometri), jamii hii inaweza kukamatika tu linapokuwa "haswa inahitajika kwa madhumuni ya kusambaza ndilo, kutambua, na kukamatika ndilo" na "chini ya kinga inayofaa kwa haki ya kawaida na kupigania kwa wanaume**.
Matokeo ya vitendo: Wazi mingi ya ujumuishaji inayotumiwa kwa mifumo yenye hatari ya AI ijumuisha data mahala, na wazi mingi ijumuisha jamii mahsusi. Makala 10 inahitaji kuwa data hii kukamatika tu kwa kiasi cha kawaida inahitajika na chini ya kinga ya teknolojia inayofaa — ambayo kuachia jina ni yenye salama zaidi.
Kuhesabu ya Kumfanya: Kwa Nini Hii Kulazimu GDPR
Miundombuni ya kumfanya ya EU AI Sheria kulazimu GDPR kwa kumfanya na kupuuza:
| Sheria | Kumfanya Zaidi | Matangazo ya Kuzuia |
|---|---|---|
| GDPR | €20 milioni | 4% kuzuia ya jumla |
| EU AI Sheria (yenye hatari) | €15 milioni | 3% kuzuia ya jumla |
| EU AI Sheria (kuweka miundombuni) | €35 milioni | 7% kuzuia ya jumla |
Kwa uvunjaji wa data ya ujumuishaji, tabaka linayotumika ni tabaka la mifumo yenye hatari (€15M / 3%). Hata hivyo, kama DPA inakuamua kuwa ujumuishaji wa data mahala bila kinga inayofaa inajumuesha miundombuni kuweka — tathmini ambayo inakuwa zaidi angavu kama miundombuni ya kumfanya inakujenga — kumfanya kuweka inatumika.
Kwa kampuni na €500M kuzuia ya mwaka: 3% = €15M. Kwa kampuni na €5B kuzuia: 3% = €150M. Hawa si kufikiria zaidi — wao ni hesabu halisi watajifanya wataweza.
Kwa Nini Kuachia Jina Ni Muafaka wa Kukamatika
Kuachia jina inajumuesha kuelezea kisheria kwa kawaida: data iliyokachiwa jina iko nje ya kipimo cha GDPR, na kwa kupanua, inapunguza uso wa hatari wa Sheria ya AI kwa ujumuishaji wa data.
Makala 10 mahitaji yenye mipango zaidi — jamii mahsusi ya kuandika, ongeza-nza ya ndilo na data mahala, haki za kusambaza katika seti za ujumuishaji — kuumika kwa sababu seti za ujumuishaji ijumuisha data mahala. Kama seti za ujumuishaji ni kweli iliyokachiwa jina kabla ya ujumuishaji kuanza, mahitaji hayo yajupata kuondoleza au inapunguza zaidi.
CNIL (Kusambaza kumfanya kwa Ufaransa) ilichapwa ujumuishaji wa uhaba wa data wa AI mapema 2026 kwa uwazi kusema: "Kupangia data kabla ya ujumuishaji — ikiwa ni pamoja na kuachia jina kwa data mahala si haswa inahitajika kwa utendaji wa mfano — ni hatua ya teknolojia ya kawaida kwa muafaka na Makala 10."
Hii si mikazo ambayo hatuna mahitaji. Ni mkakati wa tekeleza wa kawaida wa DPA yenye ujumuishaji wa teknolojia wa Ueuropa.
Nini Kuachia Jina Inamaanisha kwa Ujumuishaji wa Data — Kwa Kufikiria
Kuachia jina kwa data ya ujumuishaji si sawa na kuachia jina kwa data ya uzalishaji. Data ya ujumuishaji haswa ijumuisha:
- Hati na PII iliyojamba — mikataba, barua pepe, ripoti, tiketi za akili inatumiwa kama mifano ya kusasisha
- Rekodi ya kifo — jedwali la data ya mtaja inatumiwa kuandika mifumo ya kutabiri
- Seti za kuweka alama — picha au maandishi na mikazo inaweza kukamatika simu za kibinafsi
- Data ya kwa kawaida kulingana na rekodi halisi — mahali uzalishaji wa kwa kawaida unaweza kusambaza miundo ya kutambua
Kuachia jina kwa data ya ujumuishaji inahitaji kutambua PII katika jinsi hii zote na kuondoleza au kuweka kabla ya kazi ya ujumuishaji inaendelea. Mahitaji ya kutambua lazima iwe na jumla — mfano kuandika kwa data mahali "John Smith" kumkamatika lakini mahali "wagonjwa katika 42 Oak Street, Springfield" kueneza kujifanya mfano kuandika mahale miundo na kutabiri ya jibu.
API ya anonym.legal inakuandika data ya ujumuishaji kwa njia ya kundi, kutambua aina 285+ za mahala katika lugha 48. Kwa shirikishi na seti za ujumuishaji za lugha mingi — hii ilikuwa kawaida kwa kampuni za AI za Kieuro zaidi zaidi kwa lugha mingi ya soko — mwaliko huu wa lugha za kila mahali ni lazima. Uvunjaji wa muafaka katika lugha moja ya seti ya ujumuishaji wa lugha mingi inajumuesha kukamatika kwa AI ya hama nzima.
Mwaliko wa Kufikiria: Kuachia Jina Njia Yako ya Ujumuishaji
Hatua 1: Chaguzi seti zako za ujumuishaji
Kabla ya kuachia jina, unahitaji kujua kile unayo. Eneza kukamatika kupitia zote ujumuishaji wa mahala:
# Andika saraka ya hati za ujumuishaji
curl -X POST https://anonym.legal/api/presidio/analyze \
-H "Authorization: Bearer FUNGUO_YAKO_YA_API" \
-H "Content-Type: application/json" \
-d '{
"text": "'"$(cat training_document.txt)"'",
"language": "en"
}'
Matokeo kuniweza zote mahala yaliyotambuliwa na aina yao, mahala, na alama za kuwa na ujumbe. Kupangisha katika seti yako ya ujumuishaji kumaanisha PII kukamatika kabla ya kuanza kukamatika.
Hatua 2: Kundi kuachia jina
Kwa seti kubwa za ujumuishaji, tumia kukamatika kumfanya kwa kuandika hati mingi sambamba:
import requests
import os
import json
from pathlib import Path
def anonymize_training_batch(documents: list[dict]) -> list[dict]:
response = requests.post(
"https://anonym.legal/api/presidio/anonymize-batch",
json={"items": documents, "language": "en"},
headers={"Authorization": f"Bearer {os.environ['ANONYM_API_KEY']}"}
)
return response.json()["results"]
# Chomeka hati za ujumuishaji
training_dir = Path("./training_data")
docs = [
{"id": f.name, "text": f.read_text()}
for f in training_dir.glob("*.txt")
]
# Kuachia jina katika kundi la 50
batch_size = 50
for i in range(0, len(docs), batch_size):
batch = docs[i:i+batch_size]
results = anonymize_training_batch(batch)
for result in results:
output_path = training_dir / "anonymized" / result["id"]
output_path.write_text(result["text"])
print(f"Kuandika {result['id']}: {len(result['items'])} mahala kuondoleza")
Hatua 3: Hujifanya miundombuni
Makala 10 inahitaji hujifanya miundombuni ya kukamatika data. Hujifanya yako ya kuachia jina inapaswa kukamatika:
- Mfano wa kutambua na toleo linalotumika
- Aina za mahala zinazokamatika na mkakati wa kubadilisha kwa kila moja
- Rekodi ya mahala yaliyokamatika kwa kila seti ya ujumuishaji
- Tarehe ya kuachia jina na toleo la ujumuishaji wa data inatumiwa
Hujifanya hii inajumuesha "miundombuni ya kukamatika na kusimamia data" inahitajika na Makala 10(2)(a).
Colorado AI Sheria: Mahitaji ya Sambamba ya Marekani
Sheria ya AI ya Colorado inatangaza Joni 30, 2026 — wiki mitano kabla ya tekeleza ya EU AI Sheria ya yenye hatari. Sheria ya Colorado inajumuesha mahitaji ya sawa ya data ya ujumuishaji kwa "mifumo yenye hatari ya AI" chini ya sheria ya Colorado, na ujumbe katika kutabiri sambamba.
Shirikishi inayofanya katika zote EU na Colorado inkabiliwa na tarehe zilizoandaliwa. Mkakati wa kuachia jina inatakaa: ujumuishaji wa data chini ya Makala 10 (EU) na hatua za kutabiri sambamba chini ya sheria ya Colorado. Miundombuni ya teknolojia ni sawa.
Kuanza Leo
Miezi mitano ni wakati wa kutosha kutekeleza kuachia jina kwa ujumuishaji wa data kama kazi inaanza haraka. Si wakati wa kutosha kama kazi inaanza Juni.
Mikakati ya muafaka:
- Wiki 1-2: Chaguzi seti za ujumuishaji — kumaanisha nini PII kuonekana
- Wiki 3-6: Utekelezaji wa njia ya kuachia jina na kujaribu
- Wiki 7-10: Hujifanya na kukamatika kisheria
- Wiki 11-16: Kukamatika — angalia seti iliyokachiwa jina kukamatika Makala 10 mahitaji ya ubora
- Agosti 2: Tarehe ya tekeleza — miundombuni salama ya data ya ujumuishaji katika mahali
API ya anonym.legal inajumuisha katika njia za ujumuishaji ulio na miundombuni bila kuhajimu miundombuni ya miundombuni. Orodha ya muafaka ya GDPR yajauliza mahitaji ya hujifanya ya data inayohusiana kati ya GDPR na Makala 10.
EU AI Sheria ni tekeleza-salama. Swali kwa shirikishi zinazojengana mifumo yenye hatari ya AI si kama muafaka inahitajika — ni kama watakuwa salama kwa Agosti 2.
Kuanza na orodha ya muafaka ya GDPR →
Vyanzo:
- EU AI Sheria, Miundombuni (EU) 2024/1689, Makala 9-17 (mahitaji ya AI yenye hatari), OJ L 2024/1689
- EU AI Sheria, Makala 10 — Data na miundombuni ya data
- CNIL ujumuishaji wa ujumuishaji wa data ya AI, Januari 2026
- Colorado AI Sheria, SB 205, inatangaza Juni 30, 2026
- EU AI Sheria tekeleza tarehe: kuweka miundombuni Febuari 2, 2025; mifumo yenye hatari Agosti 2, 2026