Atpakaļ uz BloguGDPR un Atbilstība

ES MI Akts 2026. gada augustā: apmācibas datu anonimizācija, lai izpilditu 10. pantu

ES MI Akta pilna izpilde sākas 2026. gada 2. augustā. Sodi lidzī 35 miljoniem eiro vai 7% no globāla apgrozijuma. 10. pants prasa apmācibas datu anonimizāciju.

March 16, 20269 min lasīšanai
EU AI Acttraining dataArticle 10GDPR complianceAI regulation2026 deadlinedata governance

Atskaitīšana ir sākusies

Atjaunots 2026. gadam

ES MI Akta termiņš ir reāls. 10. panta noteikumi piemerojami no 2026. gada 2. augusta. Ja jūsu komanda büvē vai darbina augsta riska MI sistemu, rikojietes tagad. Laika ir maz.

Sodi ir augstāki neka VDAR. Maksimalais sods ir 35 miljoni eiro vai 7% no globāla gada apgrozijuma. VDAR ierobezojums ir 20 miljoni eiro vai 4%. Nevienam citam MI tiesibas aktam nav augstāku sodu.

Kuras MI sistemas ir augsta riska?

MI Akts iedala sistemas pec riska. Augsta riska sistēmas (III pielikums) aptver MI, ko izmanto:

  • Izglītibā - skolas piekļuves vai studentu novērtēšana
  • Darba vietā - CV atlase, interviju novērtēšana, darbinieku monitorings
  • Galvenajos pakalpojumos - kreditu novērtēšana, apdrošinasanas cenas, avārias darbibas
  • Tiesibsargājošajā darbibā - noziegumu prognozes, biometriskas ID
  • Veselibasaprüpē - medicīnas ierīču programmaturas, pacienta triāže
  • Infrastruktüra - enerģiijas, üdens vai transporta parvaldiba
  • Tieslietas - juridiskas pētniecibas riki, spriedumu riki

Stradājat kādā no šiem? 10. pants attiecas uz jums.

10. pants: četri galvenie noteikumi

  1. pants nosaka noteikumus datukopam, ko izmanto augsta riska MI sistēmas. Lūk, četri galvenie.

1. Rakstiskā pārvaldība

Datukopam jaseko "atbilstigai datu pārvaldibai un parvaldisanas praksēm." Jums ir jābūt rakstiskiem soļiem vakšanai, kvalitates parbaudeem un pastāvigai parskatisanai.

2. Aizspriedumu testesana

Ieraksti jabüt parbauditiem "iespejamiem aizspriedumiem", kas var izraisit netiesigas izvades. Aktiva testesana ir obligata. Nav pietiekami tikai izvairiities no apzinigiem aizspriedumiem.

3. Precizitate un aptvērtiba

Datukopam jabüt "atbilstigām, pietiekami reprezentativām un brivas no klüdām." Tīmekļa vilkšanas, kurās trükst noteiktu grupas, var neizturet šo parbaudi.

4. Īpaši ierakstu tipi

  1. panta 5. punkts ir tiešākais noteikums. Kad augsta riska sistema izmanto ipasas kategorijas ierakstus - veselibu, rasi, religiju, politiku, biometriku - jüs droskat tos apstradāt tikai tad, kad tas ir "saripi nepieciesams" aizspriedumu parbaudēm. Jums arī jabüt pielietotam "atbilstigus aizsardzibas pasākumus." Datu tīrīsana ir viens no stiprakajiem aizsardzibas pasākumiem, ko varat izmantot.

Galvenais: vairākums MI modeļu datukopas satur personiskus ierakstus. 10. pants saka - izmantojiet minimumu nepieciesamo, ar stipriem tehniskiem aizsardzibas pasākumiem.

Skatiet müsu juridiskas atbilstibas lapu un drosibas parskatijumu sisakak informacijai.

Sodu pakāpes

ES MI Aktam ir tris sodu pakāpes. Visas parsniedz VDAR tādam pasamveidam parkapumam:

RegulejumsMaksimalais sodsApgrozijuma ierobezojums
VDAR20 miljoni eiro4% globala apgrozijuma
ES MI Akts (augsta riska)15 miljoni eiro3% globala apgrozijuma
ES MI Akts (aizliegts)35 miljoni eiro7% globala apgrozijuma

Datakopas parkapumi ietilpst augsta riska pakāpē (15 miljoni / 3%). Ja regulators konstate, ka personisko ierakstu izmantosana bez aizsardzibas pasākumiem ir aizliegta darbiba, tiek pielietota augstāka pakāpe.

Realejie piemēri: 500 miljonu eiro apgrozijums pie 3% = 15 miljoni sods. 5 miljardu eiro apgrozijums pie 3% = 150 miljoni sods. Tas ir reali skaitli, ne teorija.

Kapec datu tīrīšana to risina

Pareizi tirita ieraksti ir arspus VDAR tvēruma. Tas novierS vairākumu 10. panta slogā.

Grütie noteikumi - ipasas kategorijas apstrade, aizspriedumu parbaudes, datu subjektu tiesibas - attiecas tikai tad, ja datukopa satur personiskus ierakstus. Vispirms nonemiet tos. Slogs galvenokārt pazüd.

CNIL (Francijas datu institūcija) to skaidri paudā 2026. gada sakuma. Tā MI norādijums saka: personisko ierakstu datu tīrīsana, kas nav nepieciesami modeļa izpildibai, ir galvenais tehniskais pasākums 10. pantam.

Ta nav marginala doma. Tas ir ES galvena MI regulatora vadosais viedoklis.

Ko datu tīrīsana nozimē praksē

MI modeļa datukopas tīrīsana nav tāda pati kā dzivas razosanas ierakstu tīrīsana. Modeļu datukopas var saturet:

  • Dokumenti ar PII - ligumi, e-pasti, ziņojumi, atbalsta biļetes
  • Strukturetie ieraksti - klientu tabulas, kas izmantotas prognozesanas modeļu büvesanai
  • Iezīmetais saturs - atteli vai teksts ar piezīmem, kas ietver personiskus datus
  • Sintetiskie ieraksti - kur generesana joprojam var saglabāt personiskus modeļus

Jums jabüt detektētam PII visos šajos formatos. Viena tipa izlaišana paklauj visu datukopas. Ligums ar nonemtiem vardiem, bet pilnam adresem joprojam macis modeli saskanoties atrašanās vietu ar demogrāfiskiem modeļiem.

anonym.legal API apstrada lielu MI datukopas partijas apstradi. Tas detektes 285+ entitiju tipus 48 valodas. Eiropas MI uznemumiem ar daudzvalodu datukopam cross-valodu aptvērtiba ir kritiska. Robbe vienā valodā rada ES MI Akta risku visā sistemā.

Sisakak informacijai par entitiju detekciju skatiet tokenu sistemas rokasgramatu un entitiju tipu uzziņas.

Praktiskie soli: jusu datukopas tīrīsana

1. solis: vispirms audits

Palaidiet detekcijas pasi pirms ko tīrāt. Tas parada, kādi PII ir klāt:

curl -X POST https://anonym.legal/api/presidio/analyze \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "'"$(cat document.txt)"'",
    "language": "en"
  }'

Atbilde uzskaita katru detekteto entitiju ar tas tipu, poziciju un vertejumu. Palaidiet to visas failos, lai redzetu pilnu apjomu pirms sakuma.

2. solis: partijas tīrīsana

Lielam datukopam izmantojiet partijas galapunktu, lai apstradatu daudzus failus uzreiz:

import requests
import os
from pathlib import Path

def scrub_batch(documents: list[dict]) -> list[dict]:
    response = requests.post(
        "https://anonym.legal/api/presidio/anonymize-batch",
        json={"items": documents, "language": "en"},
        headers={"Authorization": f"Bearer {os.environ['ANONYM_API_KEY']}"}
    )
    return response.json()["results"]

source_dir = Path("./dataset")
docs = [
    {"id": f.name, "text": f.read_text()}
    for f in source_dir.glob("*.txt")
]

batch_size = 50
for i in range(0, len(docs), batch_size):
    results = scrub_batch(docs[i:i+batch_size])
    for result in results:
        out = source_dir / "clean" / result["id"]
        out.write_text(result["text"])
        print(f"Gatavs: {result['id']} - {len(result['items'])} entitijas nonemtas")

3. solis: glabajiet ierakstus

  1. pants prasa rakstiskus ierakstus par to, ko jūs darījāt. Katrai datukopai glabajiet:
  • Izmantoto detekcijas modeli un versiju
  • Kuri entitiju tipi tika atrasti un kā katrs tika aizvietots
  • Nonemto entitiju skaitu katrai datukopai
  • Tīrīsanas datumu un izmantoto datukopas versiju

Tas atbilst "datu pārvaldibas un pārvaldisanas praksem" prasibai 10. panta 2. punkta a) apakspunktā.

Biežākie jautājumi

Vai tīrīsana sabojā modeļa kvalitāti?

Vairākumā gadijumu nē. Modelis mācas modeļus no teksta strukturas, ne personaliem detaļiem. Vārdus, telefona numerus un adreses var aizvietot ar viettururajiem kā [NAME] vai [PHONE], un modelis joprojam mācas tos pašus modeļus. Daudzas pētniecibas komandas ir atklajusas, ka tiritam datukopam razojas modeli ar līdzvērtīgu kvalitāti. Galvenais ir izmantot konsekventus viettururajus, lai modelis redzetu skaidru modeli.

Kā rīkoties, ja mana datukopa ir ļoti liela?

Izmantojiet partijas API. Tas apstrada liela apjoma paraleli. Cenu lapa paradā planus augsta apjoma lietosjumiem. Daudzas komandas apstrada miljonus ierakstu mēnesi.

Kas ar ne-angļu valodas datukopam?

API atbalsta 48 valodas. Katra valoda izmanto detekcijas modeli, kas apmacits taja valodā. Tas nozimē, ka vācu, francu, spānu, japānu un citas valodas ir iekļautas. Skatiet BUJ pilnam valodu sarakstam. Jauktas valodas datukopas arī tiek atbalstitas - jüs varat norādīt valodu katram dokumentam partijas pieprasijumā.

Kolorado MI Akts: divi termini

Kolorado MI Akts stājas spēkā 2026. gada 30. junijā - piecas nedēļas pirms ES termiņa. Tas nosaka līdzīgus noteikumus "augsta riska MI sistemam" valsts tiesibās. Galvenais akcents ir uz aizspriedumiem un diskrimināciju.

Komandas gan ES, gan Kolorado saskaras ar diviem terminem uzreiz. Jusu datukopas tīrīsana palīdz izpildīt abus likumus: 10. pantu (ES) un Kolorado prettendenciju noteikumus. Tehniskie soli ir vienādi.

Rikojietes tagad

Pieci menesī ir pietiekami - ja sākat šodien. Nav pietiekami, ja gaidat lidzī junijam.

Praktisks laika grafiks:

  1. 1.-2. nedēļa: Revidejiet savas datukopas - uzziniet, kādi personiskie ieraksti ir klāt
  2. 3.-6. nedēļa: Üzveidojiet un testejiet savu tīrīsanas konveijeru
  3. 7.-10. nedēļa: Uzrakstiet savus pārvaldibas ierakstus; sanemiet juridisko parskatijumu
  4. 11.-16. nedēļa: Validejiet - apstipriniet, ka tiritaas datukopas atbilst 10. panta kvalitates noteikumiem
  5. 2. augusts: Izpildes datums - atbilstosas prakses vietā

anonym.legal API integrējas jusu paša konvejera bez lielām izmainam. Parbauidet cenas apjoma plāniem. BUJ aptver biezākos 10. panta jautajumus.

Izmantojiet VDAR atbilstibas kontrolsarakstu ierakstiem, kas pārklājas starp VDAR un 10. pantu.

ES MI Akts ir gatavs izpildīt. Vai jüsu organizācija būs gatava lidz 2. augustam?

Sāciet ar VDAR atbilstibas kontrolsarakstu →

Ierobezojumi un atklatie jautajumi

Datu tīrīsana MI Akta noteikumiem vēl joprojam attistās. Lūk, galvenie robi.

Slieksnvalezibas nav definestas. ES MI Akts nesaka, kads tīrīsanas limenis ir "pietiekams." Lidzī Eiropas MI birojs neizdod norādijumus, jūs saskaraties ar juridisku risku. Jus varētu nezināt, vai jüsu metode apmierinas regulatorus.

Re-identifikacijas risks paliek. Pētijumi paradā, ka lieliem valodas modeļiem var iegaumēt un atkārtot saturu no savām datukopam. Ieraksti, kas iztureja tīrīsanas standartus pirms modeļa attistibas, joprojam var but izgüstami. Tīrīsana pirms attistibas to pilnigi neatrisina.

Sintetiskie ieraksti ir ierobezoti. Sintētiskā generesana saglabā statistiskos modeļus, bet var pievienot smalkus aizspriedumus vai izlaist retūs iss gadijumus. Modeli, kas büveti tikai no sintetiska satura, var slikti izpilditiies realajā ievade.

10. pants vēl tiek interpretets. Frāze "atbilstigi tehniskie pasakumi" prasa interpretāciju. Agrinas DPA darbs visā ES dalibvalstu nav nostiprinājis skaidrus standartus. Sekojiet EDPB norādijumiem un dalibvalstu lēmumiem visu 2026. gadu.

Avoti

  • ES MI Akts, Regula (ES) 2024/1689, 9.-17. pants (augsta riska MI pienakumi), OJ L 2024/1689
  • ES MI Akts, 10. pants - Dati un datu pārvaldiba
  • CNIL MI datukopas norādijums, 2026. gada janvaris
  • Kolorado MI Akts, SB 205, spēkā no 2026. gada 30. junija
  • ES MI Akta laika grafiks: aizliegtas prakses 2025. gada 2. februarī; augsta riska sistemas 2026. gada 2. augustā

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.