Atskaitīšana ir sākusies

Atjaunots 2026. gadam

ES MI Akta termiņš ir reāls. 10. panta noteikumi piemerojami no 2026. gada 2. augusta. Ja jūsu komanda büvē vai darbina augsta riska MI sistemu, rikojietes tagad. Laika ir maz.

Sodi ir augstāki neka VDAR. Maksimalais sods ir 35 miljoni eiro vai 7% no globāla gada apgrozijuma. VDAR ierobezojums ir 20 miljoni eiro vai 4%. Nevienam citam MI tiesibas aktam nav augstāku sodu.

Kuras MI sistemas ir augsta riska?

MI Akts iedala sistemas pec riska. Augsta riska sistēmas (III pielikums) aptver MI, ko izmanto:

Izglītibā - skolas piekļuves vai studentu novērtēšana
Darba vietā - CV atlase, interviju novērtēšana, darbinieku monitorings
Galvenajos pakalpojumos - kreditu novērtēšana, apdrošinasanas cenas, avārias darbibas
Tiesibsargājošajā darbibā - noziegumu prognozes, biometriskas ID
Veselibasaprüpē - medicīnas ierīču programmaturas, pacienta triāže
Infrastruktüra - enerģiijas, üdens vai transporta parvaldiba
Tieslietas - juridiskas pētniecibas riki, spriedumu riki

Stradājat kādā no šiem? 10. pants attiecas uz jums.

10. pants: četri galvenie noteikumi

pants nosaka noteikumus datukopam, ko izmanto augsta riska MI sistēmas. Lūk, četri galvenie.

1. Rakstiskā pārvaldība

Datukopam jaseko "atbilstigai datu pārvaldibai un parvaldisanas praksēm." Jums ir jābūt rakstiskiem soļiem vakšanai, kvalitates parbaudeem un pastāvigai parskatisanai.

2. Aizspriedumu testesana

Ieraksti jabüt parbauditiem "iespejamiem aizspriedumiem", kas var izraisit netiesigas izvades. Aktiva testesana ir obligata. Nav pietiekami tikai izvairiities no apzinigiem aizspriedumiem.

3. Precizitate un aptvērtiba

Datukopam jabüt "atbilstigām, pietiekami reprezentativām un brivas no klüdām." Tīmekļa vilkšanas, kurās trükst noteiktu grupas, var neizturet šo parbaudi.

4. Īpaši ierakstu tipi

panta 5. punkts ir tiešākais noteikums. Kad augsta riska sistema izmanto ipasas kategorijas ierakstus - veselibu, rasi, religiju, politiku, biometriku - jüs droskat tos apstradāt tikai tad, kad tas ir "saripi nepieciesams" aizspriedumu parbaudēm. Jums arī jabüt pielietotam "atbilstigus aizsardzibas pasākumus." Datu tīrīsana ir viens no stiprakajiem aizsardzibas pasākumiem, ko varat izmantot.

Galvenais: vairākums MI modeļu datukopas satur personiskus ierakstus. 10. pants saka - izmantojiet minimumu nepieciesamo, ar stipriem tehniskiem aizsardzibas pasākumiem.

Skatiet müsu juridiskas atbilstibas lapu un drosibas parskatijumu sisakak informacijai.

Sodu pakāpes

ES MI Aktam ir tris sodu pakāpes. Visas parsniedz VDAR tādam pasamveidam parkapumam:

Regulejums	Maksimalais sods	Apgrozijuma ierobezojums
VDAR	20 miljoni eiro	4% globala apgrozijuma
ES MI Akts (augsta riska)	15 miljoni eiro	3% globala apgrozijuma
ES MI Akts (aizliegts)	35 miljoni eiro	7% globala apgrozijuma

Datakopas parkapumi ietilpst augsta riska pakāpē (15 miljoni / 3%). Ja regulators konstate, ka personisko ierakstu izmantosana bez aizsardzibas pasākumiem ir aizliegta darbiba, tiek pielietota augstāka pakāpe.

Realejie piemēri: 500 miljonu eiro apgrozijums pie 3% = 15 miljoni sods. 5 miljardu eiro apgrozijums pie 3% = 150 miljoni sods. Tas ir reali skaitli, ne teorija.

Kapec datu tīrīšana to risina

Pareizi tirita ieraksti ir arspus VDAR tvēruma. Tas novierS vairākumu 10. panta slogā.

Grütie noteikumi - ipasas kategorijas apstrade, aizspriedumu parbaudes, datu subjektu tiesibas - attiecas tikai tad, ja datukopa satur personiskus ierakstus. Vispirms nonemiet tos. Slogs galvenokārt pazüd.

CNIL (Francijas datu institūcija) to skaidri paudā 2026. gada sakuma. Tā MI norādijums saka: personisko ierakstu datu tīrīsana, kas nav nepieciesami modeļa izpildibai, ir galvenais tehniskais pasākums 10. pantam.

Ta nav marginala doma. Tas ir ES galvena MI regulatora vadosais viedoklis.

Ko datu tīrīsana nozimē praksē

MI modeļa datukopas tīrīsana nav tāda pati kā dzivas razosanas ierakstu tīrīsana. Modeļu datukopas var saturet:

Dokumenti ar PII - ligumi, e-pasti, ziņojumi, atbalsta biļetes
Strukturetie ieraksti - klientu tabulas, kas izmantotas prognozesanas modeļu büvesanai
Iezīmetais saturs - atteli vai teksts ar piezīmem, kas ietver personiskus datus
Sintetiskie ieraksti - kur generesana joprojam var saglabāt personiskus modeļus

Jums jabüt detektētam PII visos šajos formatos. Viena tipa izlaišana paklauj visu datukopas. Ligums ar nonemtiem vardiem, bet pilnam adresem joprojam macis modeli saskanoties atrašanās vietu ar demogrāfiskiem modeļiem.

anonym.legal API apstrada lielu MI datukopas partijas apstradi. Tas detektes 285+ entitiju tipus 48 valodas. Eiropas MI uznemumiem ar daudzvalodu datukopam cross-valodu aptvērtiba ir kritiska. Robbe vienā valodā rada ES MI Akta risku visā sistemā.

Sisakak informacijai par entitiju detekciju skatiet tokenu sistemas rokasgramatu un entitiju tipu uzziņas.

Praktiskie soli: jusu datukopas tīrīsana

1. solis: vispirms audits

Palaidiet detekcijas pasi pirms ko tīrāt. Tas parada, kādi PII ir klāt:

curl -X POST https://anonym.legal/api/presidio/analyze \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "'"$(cat document.txt)"'",
    "language": "en"
  }'

Atbilde uzskaita katru detekteto entitiju ar tas tipu, poziciju un vertejumu. Palaidiet to visas failos, lai redzetu pilnu apjomu pirms sakuma.

2. solis: partijas tīrīsana

Lielam datukopam izmantojiet partijas galapunktu, lai apstradatu daudzus failus uzreiz:

import requests
import os
from pathlib import Path

def scrub_batch(documents: list[dict]) -> list[dict]:
    response = requests.post(
        "https://anonym.legal/api/presidio/anonymize-batch",
        json={"items": documents, "language": "en"},
        headers={"Authorization": f"Bearer {os.environ['ANONYM_API_KEY']}"}
    )
    return response.json()["results"]

source_dir = Path("./dataset")
docs = [
    {"id": f.name, "text": f.read_text()}
    for f in source_dir.glob("*.txt")
]

batch_size = 50
for i in range(0, len(docs), batch_size):
    results = scrub_batch(docs[i:i+batch_size])
    for result in results:
        out = source_dir / "clean" / result["id"]
        out.write_text(result["text"])
        print(f"Gatavs: {result['id']} - {len(result['items'])} entitijas nonemtas")

3. solis: glabajiet ierakstus

pants prasa rakstiskus ierakstus par to, ko jūs darījāt. Katrai datukopai glabajiet:

Izmantoto detekcijas modeli un versiju
Kuri entitiju tipi tika atrasti un kā katrs tika aizvietots
Nonemto entitiju skaitu katrai datukopai
Tīrīsanas datumu un izmantoto datukopas versiju

Tas atbilst "datu pārvaldibas un pārvaldisanas praksem" prasibai 10. panta 2. punkta a) apakspunktā.

Biežākie jautājumi

Vai tīrīsana sabojā modeļa kvalitāti?

Vairākumā gadijumu nē. Modelis mācas modeļus no teksta strukturas, ne personaliem detaļiem. Vārdus, telefona numerus un adreses var aizvietot ar viettururajiem kā [NAME] vai [PHONE], un modelis joprojam mācas tos pašus modeļus. Daudzas pētniecibas komandas ir atklajusas, ka tiritam datukopam razojas modeli ar līdzvērtīgu kvalitāti. Galvenais ir izmantot konsekventus viettururajus, lai modelis redzetu skaidru modeli.

Kā rīkoties, ja mana datukopa ir ļoti liela?

Izmantojiet partijas API. Tas apstrada liela apjoma paraleli. Cenu lapa paradā planus augsta apjoma lietosjumiem. Daudzas komandas apstrada miljonus ierakstu mēnesi.

Kas ar ne-angļu valodas datukopam?

API atbalsta 48 valodas. Katra valoda izmanto detekcijas modeli, kas apmacits taja valodā. Tas nozimē, ka vācu, francu, spānu, japānu un citas valodas ir iekļautas. Skatiet BUJ pilnam valodu sarakstam. Jauktas valodas datukopas arī tiek atbalstitas - jüs varat norādīt valodu katram dokumentam partijas pieprasijumā.

Kolorado MI Akts: divi termini

Kolorado MI Akts stājas spēkā 2026. gada 30. junijā - piecas nedēļas pirms ES termiņa. Tas nosaka līdzīgus noteikumus "augsta riska MI sistemam" valsts tiesibās. Galvenais akcents ir uz aizspriedumiem un diskrimināciju.

Komandas gan ES, gan Kolorado saskaras ar diviem terminem uzreiz. Jusu datukopas tīrīsana palīdz izpildīt abus likumus: 10. pantu (ES) un Kolorado prettendenciju noteikumus. Tehniskie soli ir vienādi.

Rikojietes tagad

Pieci menesī ir pietiekami - ja sākat šodien. Nav pietiekami, ja gaidat lidzī junijam.

Praktisks laika grafiks:

1.-2. nedēļa: Revidejiet savas datukopas - uzziniet, kādi personiskie ieraksti ir klāt
3.-6. nedēļa: Üzveidojiet un testejiet savu tīrīsanas konveijeru
7.-10. nedēļa: Uzrakstiet savus pārvaldibas ierakstus; sanemiet juridisko parskatijumu
11.-16. nedēļa: Validejiet - apstipriniet, ka tiritaas datukopas atbilst 10. panta kvalitates noteikumiem
2. augusts: Izpildes datums - atbilstosas prakses vietā

anonym.legal API integrējas jusu paša konvejera bez lielām izmainam. Parbauidet cenas apjoma plāniem. BUJ aptver biezākos 10. panta jautajumus.

Izmantojiet VDAR atbilstibas kontrolsarakstu ierakstiem, kas pārklājas starp VDAR un 10. pantu.

ES MI Akts ir gatavs izpildīt. Vai jüsu organizācija būs gatava lidz 2. augustam?

Sāciet ar VDAR atbilstibas kontrolsarakstu →

Ierobezojumi un atklatie jautajumi

Datu tīrīsana MI Akta noteikumiem vēl joprojam attistās. Lūk, galvenie robi.

Slieksnvalezibas nav definestas. ES MI Akts nesaka, kads tīrīsanas limenis ir "pietiekams." Lidzī Eiropas MI birojs neizdod norādijumus, jūs saskaraties ar juridisku risku. Jus varētu nezināt, vai jüsu metode apmierinas regulatorus.

Re-identifikacijas risks paliek. Pētijumi paradā, ka lieliem valodas modeļiem var iegaumēt un atkārtot saturu no savām datukopam. Ieraksti, kas iztureja tīrīsanas standartus pirms modeļa attistibas, joprojam var but izgüstami. Tīrīsana pirms attistibas to pilnigi neatrisina.

Sintetiskie ieraksti ir ierobezoti. Sintētiskā generesana saglabā statistiskos modeļus, bet var pievienot smalkus aizspriedumus vai izlaist retūs iss gadijumus. Modeli, kas büveti tikai no sintetiska satura, var slikti izpilditiies realajā ievade.

10. pants vēl tiek interpretets. Frāze "atbilstigi tehniskie pasakumi" prasa interpretāciju. Agrinas DPA darbs visā ES dalibvalstu nav nostiprinājis skaidrus standartus. Sekojiet EDPB norādijumiem un dalibvalstu lēmumiem visu 2026. gadu.

Avoti

ES MI Akts, Regula (ES) 2024/1689, 9.-17. pants (augsta riska MI pienakumi), OJ L 2024/1689
ES MI Akts, 10. pants - Dati un datu pārvaldiba
CNIL MI datukopas norādijums, 2026. gada janvaris
Kolorado MI Akts, SB 205, spēkā no 2026. gada 30. junija
ES MI Akta laika grafiks: aizliegtas prakses 2025. gada 2. februarī; augsta riska sistemas 2026. gada 2. augustā

Saistītie Raksti

GDPR un Atbilstība

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

Sākt Bezmaksas Izmēģinājumu Skatīt Funkcijas

ES MI Akts 2026. gada augustā: apmācibas datu anonimizācija, lai izpilditu 10. pantu

Atskaitīšana ir sākusies

Kuras MI sistemas ir augsta riska?

10. pants: četri galvenie noteikumi

Sodu pakāpes

Kapec datu tīrīšana to risina

Ko datu tīrīsana nozimē praksē

Praktiskie soli: jusu datukopas tīrīsana

Biežākie jautājumi

Kolorado MI Akts: divi termini

Rikojietes tagad

Ierobezojumi un atklatie jautajumi

Avoti

Saistītie Raksti

Japan My Number: Verhoeff & APPI

HDPA Greece: AFM & AMKA Detection

NAIH Hungary: TAJ-Szám and Adóazonosító Jel

Vai esat gatavi aizsargāt savus datus?

ES MI Akts 2026. gada augustā: apmācibas datu anonimizācija, lai izpilditu 10. pantu

Atskaitīšana ir sākusies

Kuras MI sistemas ir augsta riska?

10. pants: četri galvenie noteikumi

Sodu pakāpes

Kapec datu tīrīšana to risina

Ko datu tīrīsana nozimē praksē

Praktiskie soli: jusu datukopas tīrīsana

Biežākie jautājumi

Kolorado MI Akts: divi termini

Rikojietes tagad

Ierobezojumi un atklatie jautajumi

Avoti

Saistītie Raksti

Japan My Number: Verhoeff & APPI

HDPA Greece: AFM & AMKA Detection

NAIH Hungary: TAJ-Szám and Adóazonosító Jel

Vai esat gatavi aizsargāt savus datus?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow