Atskaitīšana ir sākusies
Atjaunots 2026. gadam
ES MI Akta termiņš ir reāls. 10. panta noteikumi piemerojami no 2026. gada 2. augusta. Ja jūsu komanda büvē vai darbina augsta riska MI sistemu, rikojietes tagad. Laika ir maz.
Sodi ir augstāki neka VDAR. Maksimalais sods ir 35 miljoni eiro vai 7% no globāla gada apgrozijuma. VDAR ierobezojums ir 20 miljoni eiro vai 4%. Nevienam citam MI tiesibas aktam nav augstāku sodu.
Kuras MI sistemas ir augsta riska?
MI Akts iedala sistemas pec riska. Augsta riska sistēmas (III pielikums) aptver MI, ko izmanto:
- Izglītibā - skolas piekļuves vai studentu novērtēšana
- Darba vietā - CV atlase, interviju novērtēšana, darbinieku monitorings
- Galvenajos pakalpojumos - kreditu novērtēšana, apdrošinasanas cenas, avārias darbibas
- Tiesibsargājošajā darbibā - noziegumu prognozes, biometriskas ID
- Veselibasaprüpē - medicīnas ierīču programmaturas, pacienta triāže
- Infrastruktüra - enerģiijas, üdens vai transporta parvaldiba
- Tieslietas - juridiskas pētniecibas riki, spriedumu riki
Stradājat kādā no šiem? 10. pants attiecas uz jums.
10. pants: četri galvenie noteikumi
- pants nosaka noteikumus datukopam, ko izmanto augsta riska MI sistēmas. Lūk, četri galvenie.
1. Rakstiskā pārvaldība
Datukopam jaseko "atbilstigai datu pārvaldibai un parvaldisanas praksēm." Jums ir jābūt rakstiskiem soļiem vakšanai, kvalitates parbaudeem un pastāvigai parskatisanai.
2. Aizspriedumu testesana
Ieraksti jabüt parbauditiem "iespejamiem aizspriedumiem", kas var izraisit netiesigas izvades. Aktiva testesana ir obligata. Nav pietiekami tikai izvairiities no apzinigiem aizspriedumiem.
3. Precizitate un aptvērtiba
Datukopam jabüt "atbilstigām, pietiekami reprezentativām un brivas no klüdām." Tīmekļa vilkšanas, kurās trükst noteiktu grupas, var neizturet šo parbaudi.
4. Īpaši ierakstu tipi
- panta 5. punkts ir tiešākais noteikums. Kad augsta riska sistema izmanto ipasas kategorijas ierakstus - veselibu, rasi, religiju, politiku, biometriku - jüs droskat tos apstradāt tikai tad, kad tas ir "saripi nepieciesams" aizspriedumu parbaudēm. Jums arī jabüt pielietotam "atbilstigus aizsardzibas pasākumus." Datu tīrīsana ir viens no stiprakajiem aizsardzibas pasākumiem, ko varat izmantot.
Galvenais: vairākums MI modeļu datukopas satur personiskus ierakstus. 10. pants saka - izmantojiet minimumu nepieciesamo, ar stipriem tehniskiem aizsardzibas pasākumiem.
Skatiet müsu juridiskas atbilstibas lapu un drosibas parskatijumu sisakak informacijai.
Sodu pakāpes
ES MI Aktam ir tris sodu pakāpes. Visas parsniedz VDAR tādam pasamveidam parkapumam:
| Regulejums | Maksimalais sods | Apgrozijuma ierobezojums |
|---|---|---|
| VDAR | 20 miljoni eiro | 4% globala apgrozijuma |
| ES MI Akts (augsta riska) | 15 miljoni eiro | 3% globala apgrozijuma |
| ES MI Akts (aizliegts) | 35 miljoni eiro | 7% globala apgrozijuma |
Datakopas parkapumi ietilpst augsta riska pakāpē (15 miljoni / 3%). Ja regulators konstate, ka personisko ierakstu izmantosana bez aizsardzibas pasākumiem ir aizliegta darbiba, tiek pielietota augstāka pakāpe.
Realejie piemēri: 500 miljonu eiro apgrozijums pie 3% = 15 miljoni sods. 5 miljardu eiro apgrozijums pie 3% = 150 miljoni sods. Tas ir reali skaitli, ne teorija.
Kapec datu tīrīšana to risina
Pareizi tirita ieraksti ir arspus VDAR tvēruma. Tas novierS vairākumu 10. panta slogā.
Grütie noteikumi - ipasas kategorijas apstrade, aizspriedumu parbaudes, datu subjektu tiesibas - attiecas tikai tad, ja datukopa satur personiskus ierakstus. Vispirms nonemiet tos. Slogs galvenokārt pazüd.
CNIL (Francijas datu institūcija) to skaidri paudā 2026. gada sakuma. Tā MI norādijums saka: personisko ierakstu datu tīrīsana, kas nav nepieciesami modeļa izpildibai, ir galvenais tehniskais pasākums 10. pantam.
Ta nav marginala doma. Tas ir ES galvena MI regulatora vadosais viedoklis.
Ko datu tīrīsana nozimē praksē
MI modeļa datukopas tīrīsana nav tāda pati kā dzivas razosanas ierakstu tīrīsana. Modeļu datukopas var saturet:
- Dokumenti ar PII - ligumi, e-pasti, ziņojumi, atbalsta biļetes
- Strukturetie ieraksti - klientu tabulas, kas izmantotas prognozesanas modeļu büvesanai
- Iezīmetais saturs - atteli vai teksts ar piezīmem, kas ietver personiskus datus
- Sintetiskie ieraksti - kur generesana joprojam var saglabāt personiskus modeļus
Jums jabüt detektētam PII visos šajos formatos. Viena tipa izlaišana paklauj visu datukopas. Ligums ar nonemtiem vardiem, bet pilnam adresem joprojam macis modeli saskanoties atrašanās vietu ar demogrāfiskiem modeļiem.
anonym.legal API apstrada lielu MI datukopas partijas apstradi. Tas detektes 285+ entitiju tipus 48 valodas. Eiropas MI uznemumiem ar daudzvalodu datukopam cross-valodu aptvērtiba ir kritiska. Robbe vienā valodā rada ES MI Akta risku visā sistemā.
Sisakak informacijai par entitiju detekciju skatiet tokenu sistemas rokasgramatu un entitiju tipu uzziņas.
Praktiskie soli: jusu datukopas tīrīsana
1. solis: vispirms audits
Palaidiet detekcijas pasi pirms ko tīrāt. Tas parada, kādi PII ir klāt:
curl -X POST https://anonym.legal/api/presidio/analyze \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"text": "'"$(cat document.txt)"'",
"language": "en"
}'
Atbilde uzskaita katru detekteto entitiju ar tas tipu, poziciju un vertejumu. Palaidiet to visas failos, lai redzetu pilnu apjomu pirms sakuma.
2. solis: partijas tīrīsana
Lielam datukopam izmantojiet partijas galapunktu, lai apstradatu daudzus failus uzreiz:
import requests
import os
from pathlib import Path
def scrub_batch(documents: list[dict]) -> list[dict]:
response = requests.post(
"https://anonym.legal/api/presidio/anonymize-batch",
json={"items": documents, "language": "en"},
headers={"Authorization": f"Bearer {os.environ['ANONYM_API_KEY']}"}
)
return response.json()["results"]
source_dir = Path("./dataset")
docs = [
{"id": f.name, "text": f.read_text()}
for f in source_dir.glob("*.txt")
]
batch_size = 50
for i in range(0, len(docs), batch_size):
results = scrub_batch(docs[i:i+batch_size])
for result in results:
out = source_dir / "clean" / result["id"]
out.write_text(result["text"])
print(f"Gatavs: {result['id']} - {len(result['items'])} entitijas nonemtas")
3. solis: glabajiet ierakstus
- pants prasa rakstiskus ierakstus par to, ko jūs darījāt. Katrai datukopai glabajiet:
- Izmantoto detekcijas modeli un versiju
- Kuri entitiju tipi tika atrasti un kā katrs tika aizvietots
- Nonemto entitiju skaitu katrai datukopai
- Tīrīsanas datumu un izmantoto datukopas versiju
Tas atbilst "datu pārvaldibas un pārvaldisanas praksem" prasibai 10. panta 2. punkta a) apakspunktā.
Biežākie jautājumi
Vai tīrīsana sabojā modeļa kvalitāti?
Vairākumā gadijumu nē. Modelis mācas modeļus no teksta strukturas, ne personaliem detaļiem. Vārdus, telefona numerus un adreses var aizvietot ar viettururajiem kā [NAME] vai [PHONE], un modelis joprojam mācas tos pašus modeļus. Daudzas pētniecibas komandas ir atklajusas, ka tiritam datukopam razojas modeli ar līdzvērtīgu kvalitāti. Galvenais ir izmantot konsekventus viettururajus, lai modelis redzetu skaidru modeli.
Kā rīkoties, ja mana datukopa ir ļoti liela?
Izmantojiet partijas API. Tas apstrada liela apjoma paraleli. Cenu lapa paradā planus augsta apjoma lietosjumiem. Daudzas komandas apstrada miljonus ierakstu mēnesi.
Kas ar ne-angļu valodas datukopam?
API atbalsta 48 valodas. Katra valoda izmanto detekcijas modeli, kas apmacits taja valodā. Tas nozimē, ka vācu, francu, spānu, japānu un citas valodas ir iekļautas. Skatiet BUJ pilnam valodu sarakstam. Jauktas valodas datukopas arī tiek atbalstitas - jüs varat norādīt valodu katram dokumentam partijas pieprasijumā.
Kolorado MI Akts: divi termini
Kolorado MI Akts stājas spēkā 2026. gada 30. junijā - piecas nedēļas pirms ES termiņa. Tas nosaka līdzīgus noteikumus "augsta riska MI sistemam" valsts tiesibās. Galvenais akcents ir uz aizspriedumiem un diskrimināciju.
Komandas gan ES, gan Kolorado saskaras ar diviem terminem uzreiz. Jusu datukopas tīrīsana palīdz izpildīt abus likumus: 10. pantu (ES) un Kolorado prettendenciju noteikumus. Tehniskie soli ir vienādi.
Rikojietes tagad
Pieci menesī ir pietiekami - ja sākat šodien. Nav pietiekami, ja gaidat lidzī junijam.
Praktisks laika grafiks:
- 1.-2. nedēļa: Revidejiet savas datukopas - uzziniet, kādi personiskie ieraksti ir klāt
- 3.-6. nedēļa: Üzveidojiet un testejiet savu tīrīsanas konveijeru
- 7.-10. nedēļa: Uzrakstiet savus pārvaldibas ierakstus; sanemiet juridisko parskatijumu
- 11.-16. nedēļa: Validejiet - apstipriniet, ka tiritaas datukopas atbilst 10. panta kvalitates noteikumiem
- 2. augusts: Izpildes datums - atbilstosas prakses vietā
anonym.legal API integrējas jusu paša konvejera bez lielām izmainam. Parbauidet cenas apjoma plāniem. BUJ aptver biezākos 10. panta jautajumus.
Izmantojiet VDAR atbilstibas kontrolsarakstu ierakstiem, kas pārklājas starp VDAR un 10. pantu.
ES MI Akts ir gatavs izpildīt. Vai jüsu organizācija būs gatava lidz 2. augustam?
Sāciet ar VDAR atbilstibas kontrolsarakstu →
Ierobezojumi un atklatie jautajumi
Datu tīrīsana MI Akta noteikumiem vēl joprojam attistās. Lūk, galvenie robi.
Slieksnvalezibas nav definestas. ES MI Akts nesaka, kads tīrīsanas limenis ir "pietiekams." Lidzī Eiropas MI birojs neizdod norādijumus, jūs saskaraties ar juridisku risku. Jus varētu nezināt, vai jüsu metode apmierinas regulatorus.
Re-identifikacijas risks paliek. Pētijumi paradā, ka lieliem valodas modeļiem var iegaumēt un atkārtot saturu no savām datukopam. Ieraksti, kas iztureja tīrīsanas standartus pirms modeļa attistibas, joprojam var but izgüstami. Tīrīsana pirms attistibas to pilnigi neatrisina.
Sintetiskie ieraksti ir ierobezoti. Sintētiskā generesana saglabā statistiskos modeļus, bet var pievienot smalkus aizspriedumus vai izlaist retūs iss gadijumus. Modeli, kas büveti tikai no sintetiska satura, var slikti izpilditiies realajā ievade.
10. pants vēl tiek interpretets. Frāze "atbilstigi tehniskie pasakumi" prasa interpretāciju. Agrinas DPA darbs visā ES dalibvalstu nav nostiprinājis skaidrus standartus. Sekojiet EDPB norādijumiem un dalibvalstu lēmumiem visu 2026. gadu.
Avoti
- ES MI Akts, Regula (ES) 2024/1689, 9.-17. pants (augsta riska MI pienakumi), OJ L 2024/1689
- ES MI Akts, 10. pants - Dati un datu pārvaldiba
- CNIL MI datukopas norādijums, 2026. gada janvaris
- Kolorado MI Akts, SB 205, spēkā no 2026. gada 30. junija
- ES MI Akta laika grafiks: aizliegtas prakses 2025. gada 2. februarī; augsta riska sistemas 2026. gada 2. augustā