DIBINĀTĀJA PAZIŅOJUMS
Kāpēc es uzsāku šo ekosistēmu — profesionāla pārliecība pēc 28 gadiem
Tavi dati. Tavas atslēgas. Tavi noteikumi.
Katrs produkts šajā ekosistēmā ir veidots uz vienota arhitektūras apņemšanās: tavi dati, tavas atslēgas, tava kontrole. Tava parole nekad neatstāj tavu ierīci. Tavi dokumenti nekad netiek glabāti. Tava šifrēšanas atslēga pieder tikai tev. Neviena ASV mākoņu likumdošana, neviens piegādātāja izsaukums, neviens datu brokeris — nevar sasniegt to, kas nekad netika dalīts.
Fons
28 gadus esmu strādājis tehnoloģiju, drošības un organizatoriskās atbilstības krustpunktā. Es dibināju curta.solutions 1998. gadā. Kopš tā laika esmu kalpojis regulētām organizācijām 26 valstīs — finanšu pakalpojumu, veselības aprūpes, juridiskajā, valdības, ražošanas un tehnoloģiju jomā — kā viņu partneris IT arhitektūrā, drošībā, digitālajā transformācijā un atbilstībā.
To, ko esmu novērojis 28 gadu laikā, nav lēna evolūcija. Tā ir krīze lēnā kustībā — tā, kas sasniedza kritisko punktu ar ģeneratīvās AI parādīšanos un globālo privātuma regulējumu pārklāšanos.
Mana pārliecība
Es uzskatu, ka katrai personai, organizācijai un institūcijai ir tiesības dalīties ar informāciju selektīvi — atklāt regulatoram tikai to, ko regulators ir tiesīgs redzēt, sadarboties ar partneri tikai par datiem, kas ir skaidri atļauti, piedalīties komerciālajā un publiskajā dzīvē, neatsakoties no tā, kas jāpaliek privātam.
Es uzskatu, ka šai tiesībai jābūt praktiski īstenojamai visiem — ne tikai organizācijām ar atbilstības departamentiem un uzņēmuma programmatūras budžetiem. Privātums nevar būt mēroga privilēģija.
Es uzskatu, ka pasaulē, kur ASV likums var sasniegt jebkurus datus, ko tur jebkura ASV uzņēmums visā pasaulē, un kur 77% darbinieku ievada jutīgus datus AI rīkos, kurus viņi nekontrolē, vienīgā arhitektūra, kas var nodrošināt jēgpilnu privātuma garantiju, ir tā, kur dati nekad neatstāj lietotāja kontroli vispirms. Ne līgumiskās garantijas. Ne privātuma politikas. Tehniskā arhitektūra.
Nulles zināšanu autentifikācija. Vietējā apstrāde vispirms. Atgriezeniska šifrēšana, kur atslēga pieder lietotājam. Bezsaistes spējīga darbība. ES jurisdikcija, bez izņēmumiem. Šie nav produktu iezīmes. Tie ir minimālie standarti jebkuram rīkam, kas apgalvo, ka aizsargā personas datus.
Un es uzskatu, ka 28 gadi, kas pavadīti, strādājot organizācijās, kas apstrādā pasaules jutīgākos datus — 28 gadi, kas vēro plaisu starp regulatīvo nodomu un tehnisko realitāti paplašināties — ir devuši man gan izpratni, gan atbildību uzsākt to, kas ekosistēmai joprojām trūkst. Definēt redzējumu, apvienot pareizo komandu un nodrošināt, ka tas tiek izveidots atbilstoši standartiem, ko prasa problēma.
Tiesības anonimizēt personas informāciju nav tehniska iezīme. Tā ir pamata tiesība. Un tiesība, ko nevar praktiski īstenot, nav vispār nekādas tiesības.
Problemas, ko esmu novērojis
Regulējošā fragmentācija: pārāk daudz noteikumu, nav kopīgas valodas
Vidēja lieluma organizācija, kas darbojas globāli, vienlaikus jāievēro 48+ nacionālie un reģionālie privātuma likumi — GDPR, UK GDPR, CCPA, LGPD, PDPA, PIPL, DPDPA, APPI, PIPEDA un desmitiem citu. 24 nacionālās DPA ES vien izsniedz saistošus norādījumus, kas ir konsekventi principā un atšķirīgi praksē. Tas, kas apmierina Vācijas BfDI, automātiski neapmierina Francijas CNIL, Īrijas DPC vai Nīderlandes AP. Nozares specifiskā slāņošana — HIPAA, PCI-DSS, NIS2, AI likums — pievieno prasības, kas reti ir saskaņotas savā starpā.
Rezultāts nav atbilstības ietvars. Tas ir pārvietojams mērķis ar 48 dažādiem mērķiem.
Papīra briesmonis: līgumi, ko neviens nelasa, kontroles, ko neviens neapstiprina
Organizācijas uztur datu apstrādes līgumus ar simtiem apakšapstrādātāju, standarta līguma klauzulas, kas sastāv no 30+ lapām katram pārsūtīšanas attiecībai, apstrādes aktivitāšu reģistriem, DPIA, TIA, LIA — katrs prasa tehnisku ieguldījumu, ko lielākā daļa juridisko komandu nevar neatkarīgi apstiprināt. Praksē: organizācijas paraksta to, ko viņi ir spiesti parakstīt, iesniedz to, ko viņi ir spiesti iesniegt, un cer, ka tehniskā realitāte atbilst līgumiskajam aprakstam. Papīra briesmonis rada atbilstības izskatu. Tas reti rada tās saturu.
Tehniskā nepietiekamība: rīki neatbilst pienākumam
Ģeneratīvās AI balstīta PII atklāšana nav deterministiska. Tas pats dokuments, kas apstrādāts divreiz, rada atšķirīgus rezultātus. Pamatā nesavienojams ar atbilstību — kur jums jāparāda, reproducējami un pārbaudāmi, ka konkrēti dati tika atklāti un apstrādāti pareizi.
Microsoft Presidio, spaCy, Stanza — inženierijas platformas, nevis atbilstības rīki. Ieviešana ražošanā prasa rakstīt pielāgotus atpazītājus katram entitātes tipam un valodai, veidot iepriekšējas/pēcapstrādes caurules, integrēt ar dokumentu formātiem, uzturēt visu, kad regulējumi attīstās. Parasti 30–80 stundas speciālistu inženierijas laika pirms tiek apstrādāts viens dokuments. Lielākajai daļai organizāciju šādas ekspertīzes nav iekšēji.
Personas numurs zviedru darba līgumā, Steuer-ID Vācijas nodokļu formā, PESEL Polijas apdrošināšanas dokumentā, Codice Fiscale Itālijas rēķinā — katrs prasa ne tikai valodas atpazīšanu, bet arī dokumenta tipa apzināšanu. Valodas modeļi, kas apmācīti galvenokārt angļu valodā, rada 69% PII neizdošanās līmeni neangļu tekstā. Likums neveic atšķirību pēc valodas.
Microsoft Purview, AWS Macie, Google Cloud DLP — dārgi, prasa mākoņu savienojamību, piesaista organizācijas. Vēl kritiskāk: visi ir ASV galvenie. CLOUD likums 2018. gadā liek viņiem atklāt datus visā pasaulē uz derīga ASV valdības pieprasījuma pamata. FISA 702. pants ļauj izlūkošanai notikt bez individuālām atļaujām. Schrems II atcēla ES-ASV privātuma vairogu tieši šī iemesla dēļ. Sešu ciparu gada līgums ar ASV mākoņu pakalpojumu sniedzēju nenodrošina GDPR atbilstīgu datu apstrādi.
Nekontrolētās AI problēma: tirgum nav atbildes
77% darbinieku vismaz reizi nedēļā dalās ar jutīgu darba informāciju, izmantojot AI rīkus. 34,8% no visiem AI rīku ievadiem satur informāciju, kas kvalificējas kā jutīga vismaz vienā privātuma regulējumā. Darbinieki izmanto ChatGPT, Copilot, Claude, Gemini, lai sagatavotu līgumus, kopsavilkumus, analizētu izklājlapas — pastāvīgi, automātiski, bez apziņas par to, ko viņi ievada uzvednē.
Tradicionālās DLP sistēmas nevar saprast dabiskās valodas uzvednes semantisko saturu. Tās nevar atšķirt izstrādātāju, kurš lūdz AI izskaidrot koda paraugu, no izstrādātāja, kurš ievieto 50,000 ierakstu ražošanas datu bāzi tajā pašā logā. AI modeļi apstrādā visu. Tie nepiedāvā aizsardzību, brīdinājumus vai revīzijas pēdas, uz kurām DPO var paļauties.
Trūkst tehniskā slāņa, kas padara politiku izpildāmu praksē. Šis slānis tirgū nepastāv nevienā cenu punktā, ko vidēja lieluma organizācija var atļauties, nevienā formā, kas darbojas visos AI rīkos, ko darbinieki faktiski izmanto. Tas ir viens no trūkumiem, ko šī ekosistēma tika izveidota, lai novērstu.
Piekļuves trūkums: atbilstība kā mēroga privilēģija
Solo praktiķis, kopienas organizācija, maza publiska iestāde, pētniecības iestāde — katrs pakļauts tiem pašiem GDPR, tam pašam dzēšanas tiesībām, tam pašam pārkāpumu paziņošanas pienākumam kā globāls banka — bet bez juridiskās komandas, inženierijas resursiem vai uzņēmuma programmatūras budžeta, lai tos pareizi īstenotu. Atbilstības ekosistēma ir apmierinājusi lielas organizācijas, ja arī dārgi. Tā ir apmierinājusi visus pārējos ar mandātu un bez praktiskiem līdzekļiem, lai to izpildītu.
Ekosistēmas atbilde — viena platforma, daudzas izpausmes
Lielā platforma un galvenais piekļuves punkts. Hibrīda divslāņu PII atklāšana (260+ entitātes, 48 valodas, 121 atbilstības iestatījums) visos izvietošanas modeļos — SaaS, pārvaldīts privātais mākoņs un pašpārvaldīts. Visi atvasinātie produkti dalās tajā pašā atklāšanas dzinējā un tajā pašā dibināšanas principā: jauda lietotāja rokās.
Uzņēmuma gaisa atdalīšanas izdevums. 390+ entitātes, 317 pielāgotas regex paraugi, 100% bezsaistes apstrāde, attēlu OCR 37 valodās. Nulles mākoņu atkarība — dati nekad neatstāj ierīci.
Mākoņu PII platforma ar visplašāko piekļuvi. Chrome paplašinājums reāllaika AI iejaukšanai, MCP serveris, Office papildinājums, atgriezeniska šifrēšana. Bezmaksas līdz €29/mēnesī — atbilstība katram budžetam.
Darbstacija vispirms, pilnīgi vietēja. Presidio blakus ierīcē, 7 dokumentu formāti + OCR, partiju apstrāde, šifrēta glabātuve. Vienreizēja mūža licence — bez abonementiem, bez mākoņa, pilnīgi bezsaistē pēc aktivizēšanas.
Instantā publiskā demonstrācijas platforma. Nav nepieciešama konta izveide — ielīmējiet tekstu, anonimizējiet nekavējoties, redziet dzinēju darbībā. Ātrākais veids, kā pieredzēt, ko dara ekosistēma.
Lielā platforma — SaaS · Pārvaldīts privātais · Pašpārvaldīts · 3 izvietošanas modeļi
- //Organizācijas ziņo, ka 67% izstrādātāju nejauši ir atklājuši noslēpumus kodā — deterministiska regex atklāj to, ko NLP palaidīs garām un otrādi
- //Vispārējās AI atklāšana sasniedz 69% neizdošanās līmeni neangļu tekstā — divslāņu ar spaCy + XLM-RoBERTa aizver plaisu visās 48 valodās
- //Neviendabīga rediģēšana starp komandām ir #1 minētais ICO un DPA revīzijas atklājums — iestatījumi nodrošina identisku atklāšanas uzvedību katram lietotājam, katrā sesijā
- //95% no 2024. gada datu pārkāpumiem saistīti ar cilvēku kļūdām — kopīgie iestatījumi novērš katras personas konfigurācijas lēmumus, kas rada variāciju
- //Daudzu piegādātāju PII steki rada revīzijas pēdas trūkumus — 60%+ organizāciju, kas izmanto 3+ PII rīkus, ziņo par saskaņošanas neveiksmēm starp rīkiem
- //Formāta fragmentācija: organizācijas apstrādā PDF, DOCX, XLSX, CSV, JSON vienlaicīgi — katrs formāts iepriekš prasīja atsevišķu pieeju, atsevišķu rīku, atsevišķu revīzijas ierakstu
- //Uzņēmuma PII rīki maksā $50,000–$500,000/gadā — organizācijām ar izmaksu ierobežojumiem vēsturiski nav bijusi neviena iespēja
- //CLOUD likums + FISA 702. pants nozīmē, ka ASV mitinātā "GDPR atbilstošā" apstrāde ir līgumiska fikcija — tikai ES mitināšana pilnībā novērš šo risku
Uzņēmuma gaisa atdalīšana — 390+ entitātes · 317 pielāgotas regex · 100% bezsaistē · Attēlu OCR
- //Nozares specifiska PII — kodu kods, militārā dienesta numuri, iekšējie ID — netiek segti nevienā komerciālā rīkā; pielāgotie atpazītāji prasa nedēļas speciālistu inženierijas izejvielu Presidio
- //Pārklājuma nepilnība ir atklāšanas griesti: neviens vispārīgs rīks neaptver visus PII tipus, visas valodas, visus formātus — 317 kurēti paraugi aizver plaisas, ko neaptver ārējie rīki
- //Piegādātāja paradokss: lai aizsargātu PII, jums ir jādalās ar to ar piegādātāju. Mākoņu apstrāde prasa uzticēties apstrādātājam — arhitektūras pretruna organizācijām, kas apstrādā visjutīgākos datus
- //Gaisa atdalītas vides (aizsardzība, izlūkošana, kritiskā infrastruktūra, pētniecības laboratorijas) nevar izmantot mākoņu atkarīgus rīkus par jebkādu cenu — bezsaistes pieeja pilnībā novērš arhitektūras barjeru
- //Microsoft Purview skaidri nevar skenēt JPEG/PNG — teksta PII ekrānuzņēmumos ir pilnīgi neredzams uzņēmuma DLP stekam pēc dizaina
- //SparkCat ļaunprātīga programmatūra (iOS/Android, 2025. gada decembris) izmantoja OCR, lai nozagtu kriptovalūtas maka atjaunošanas frāzes no ekrānuzņēmumiem — attēlu balstīta teksta PII ir aktīvs uzbrukuma mērķis, nevis teorētisks risks
- //300% pieaugums mākoņu datu pārkāpumos no 2022. līdz 2024. gadam — nulles zināšanas nozīmē, ka mūsu serveru pārkāpums neizpauž neko, jo nekas netiek glabāts
- //ISO 27001:2022 sertificēts ar regulārām pilna kaudzes iekļūšanas testiem — drošības stāvoklis, ko regulētā iepirkšana prasa, ir dokumentēts, pārbaudīts un neatkarīgi audzēts
Mākoņu PII platforma — Bezmaksas → €29/mēnesī · Chrome paplašinājums · MCP serveris · Office papildinājums
- //8.5% no visiem LLM uzvednēm satur PII — reāllaika iejaukšanās pirms iesniegšanas ir vienīgā prevencija, kas darbojas; pēc tam atklāšana palaidīs garām vienīgo logu, kas ir svarīgs
- //Tradicionālais DLP darbojas pēc tam, kad dati ir atstājuši organizāciju — Chrome paplašinājums iejaucas ievades punktā, pirms jebkurš modelis saņem vai apstrādā jutīgu saturu
- //Ģeneratīvās AI atklāšana ir nedeterministiska — tas pats dokuments rada atšķirīgus rezultātus dažādos izpildījumos; neviena probabilistiska sistēma nevar kalpot par regulatīvo aizsardzību
- //Presidio vien atstāj konteksta atkarīgās entitātes; XLM-RoBERTa vien rada nepatiesus pozitīvus formālajā juridiskajā valodā — trešais stāvokļa klasifikācijas slānis novērš nepatiesos pozitīvos, kas liek atbilstības komandām neuzticēties automatizētiem rīkiem
- //Juridiskā atklāšana, medicīnisko ierakstu piekļuves pieprasījumi, regulatīvā revīzija — anonimizētus datus dažreiz ir jāde-anonimizē pilnvarotajai pusei un tikai viņiem; neatgriezeniskas metodes to padara neiespējamu
- //Lietotāja sesijas atslēga nekad neatstāj viņu ierīci — ne mūsu serverus, ne kādu mākoņu, ne kādu apakšapstrādātāju. Tiesības atgriezt anonimizāciju pieder lietotājam, nevis mums.
- //Solo praktiķim ir tādas pašas GDPR dzēšanas tiesību saistības kā globālai bankai — bet bez atbilstības departamenta vai €500K/gadā uzņēmuma programmatūras budžeta
- //764 ES organizācijas vienlaikus tiek izmeklētas par dzēšanas tiesību pārkāpumiem — nevis tāpēc, ka viņi vēlējās pārkāpt; bet tāpēc, ka rīki, lai izpildītu, bija cenu ziņā pārsnieguši viņu iespējas
Darbstacija vispirms · 100% vietējā apstrāde · 7 dokumentu formāti + OCR · Vienreizēja licence
- //300% pieaugums mākoņu datu pārkāpumos no 2022. līdz 2024. gadam — dati, kas nekad neieiet mākoņos, nevar tikt atklāti mākoņu pārkāpumā
- //CLOUD likums + FISA padara ASV mitināto apstrādi juridiski neskaidru ES organizācijām — vietējā apstrāde pilnībā novērš visu pārrobežu pārsūtīšanas problēmu, nodrošinot, ka netiek veikta neviena pārsūtīšana
- //Formāta fragmentācija liek organizācijām uzturēt vairākus rīkus — katrs rīks rada atsevišķu atklāšanas politiku, atsevišķu revīzijas ierakstu, atsevišķu neveiksmes režīmu
- //Datu faili ir aizmirstā PII virsma — izstrādātāji koncentrējas uz datu bāzēm, bet žurnāli satur API atslēgas, lietotāju ID, IP adreses; CSV un JSON tiek dabiski atbalstīti kopā ar strukturētiem dokumentiem
- //Gaisa atdalītas ražošanas vides — ražošanas grīdas, valdības drošas iestādes, pētniecības laboratorijas — nevar pieļaut licenci, kas prasa tīkla piekļuvi; vienreizēja aktivizācija, pēc tam pilnīgi bezsaistes darbība ir vienīgā dzīvotspējīgā arhitektūra
- //Mūža licences bez atkārtotas SaaS atkarības: lietotājs pieder savai instalācijai; piegādātāja abonementa atcelšana nevar atslēgt rīku kritiskā apstrādes brīdī
- //dbt cauruļvadu atjaunošana iznīcina maskēšanas politikas CSV/JSON datos — EDPB 2024 precizē, ka tas pārkāpj GDPR 5. panta 1. punkta (a) noteikumus; glabātuves uzglabāšana ar šifrētu vēsturi nozīmē, ka katram apstrādātajam failam ir auditable, atgūstams ieraksts
- //Organizācijām, kas apstrādā tūkstošiem vecu dokumentu GDPR dzēšanas tiesību atbilstībai, ir nepieciešama partiju spēja — nevis 5 failu dienā SaaS ierobežojums, kas padara uzdevumu operacionāli neiespējamu
Problēmas apmērs
Šie nav izņēmuma neveiksmju gadījumi. Tie ir sistēmiski rezultāti atbilstības vidē, kas ir apsteigusi savu infrastruktūru.