ASUTAJATE ÜLEVAADE
Miks ma selle ökosüsteemi algatasin — professionaalne veendumus pärast 28 aastat
Teie andmed. Teie võtmed. Teie reeglid.
Iga toode selles ökosüsteemis on üles ehitatud ühele arhitektuurilisele kohustusele: teie andmed, teie võtmed, teie kontroll. Teie parool ei lahku kunagi teie seadmest. Teie dokumente ei salvestata kunagi. Teie krüpteerimisvõti kuulub ainult teile. Ükski USA pilveseadus, ükski müüja kutse, ükski andmevahetaja — ei saa ulatuda sinna, mis ei ole kunagi jagatud.
Taust
Olen töötanud 28 aastat tehnoloogia, turvalisuse ja organisatsioonide vastavuse ristumiskohas. Asutasin curta.solutions 1998. aastal. Sellest ajast olen teeninud reguleeritud organisatsioone 26 riigis — finantsteenustes, tervishoius, õiguses, valitsuses, tootmises ja tehnoloogias — nende partnerina IT arhitektuuris, turvalisuses, digitaalses transformatsioonis ja vastavuses.
Mida olen 28 aasta jooksul täheldanud, ei ole aeglane areng. See on kriis aeglases liikumises — kriis, mis saavutas murdepunkti generatiivse AI saabumise ja ühtlaste privaatsuse regulatsioonide globaalsete levikute tõttu.
Minu Veendumus
Usun, et igal inimesel, organisatsioonil ja institutsioonil on õigus jagada teavet valikuliselt — avaldada reguleerijale ainult seda, mida reguleerija on õigustatud nägema, teha koostööd partneriga ainult andmetega, mis on selgesõnaliselt volitatud, osaleda kaubandus- ja avalikus elus, ilma et peaks loobuma sellest, mis peab jääma privaatsuseks.
Usun, et see õigus peab olema praktiliselt teostatav kõigile — mitte ainult organisatsioonidele, kellel on vastavuse osakonnad ja ettevõtte tarkvara eelarved. Privaatsus ei saa olla skaala privileeg.
Usun, et maailmas, kus USA seadus võib ulatuda igasuguste andmeteni, mis on igasuguste USA ettevõtete käes igal pool maailmas, ja kus 77% töötajatest toidavad tundlikke andmeid AI tööriistadesse, mida nad ei kontrolli, on ainus arhitektuur, mis suudab pakkuda tähenduslikku privaatsuse garantiid, selline, kus andmed ei lahku kunagi kasutaja kontrollist. Mitte lepingulised garantiid. Mitte privaatsuspoliitikad. Tehniline arhitektuur.
Nullteadmiste autentimine. Kohalik esmane töötlemine. Tagasipööratav krüptimine, kus võti kuulub kasutajale. Offline-kõlblik töö. EL-i jurisdiktsioon, ilma eranditeta. Need ei ole toote omadused. Need on minimaalne standard igasuguste tööriistade jaoks, mis väidavad, et kaitsevad isikuandmeid.
Ja usun, et 28 aastat töötamist organisatsioonides, mis käsitlevad maailma kõige tundlikumaid andmeid — 28 aastat jälgides reguleeriva kavatsuse ja tehnilise reaalsuse vahelise lõhe suurenemist — on andnud mulle nii arusaamise kui ka vastutuse algatada seda, mida ökosüsteem endiselt vajab. Määratleda visioon, kokku panna õige meeskond ja tagada, et see ehitatakse standardile, mida probleem nõuab.
Õigus anonüümida isikuandmeid ei ole tehniline omadus. See on põhiõigus. Ja õigus, mida ei saa praktiliselt teostada, ei ole üldse õigus.
Probleemid, Mida Olen Täheldanud
Regulatiivne Fragmenteeritus: Liiga Palju Reegleid, Ühtegi Ühist Keelt
Keskmine organisatsioon, mis tegutseb globaalset, peab samal ajal navigeerima 48+ riikliku ja piirkondliku privaatsusseaduse vahel — GDPR, UK GDPR, CCPA, LGPD, PDPA, PIPL, DPDPA, APPI, PIPEDA ja kümned teised. Üksnes EL-is annab 24 riiklikku DPAd siduvaid juhiseid, mis on põhimõtteliselt ühtsed, kuid praktikas erinevad. Mis rahuldab Saksamaa BfDI-d, ei rahulda automaatselt Prantsuse CNIL-i, Iiri DPC-d ega Hollandi AP-d. Sektori-spetsiifiline kihistus — HIPAA, PCI-DSS, NIS2, AI seadus — lisab nõudeid, mis harva üksteisega kooskõlas on.
Tulemus ei ole vastavuse raamistik. See on liikuv sihtmärk, millel on 48 erinevat sihtmärki.
Paberikoletis: Lepingu Tingimused, Mida Keegi Ei Loe, Kontrollid, Mida Keegi Ei Kinnita
Organisatsioonid säilitavad andmete töötlemise lepingud sadade allhangetega, standardlepingutingimused, mis ulatuvad 30+ leheküljeni iga ülekande suhetes, töötlemise tegevuste registrid, DPIAd, TIAd, LIAd — igaühel on tehniline sisend, mida enamik õigusmeeskondi ei saa iseseisvalt kinnitada. Praktikas: organisatsioonid allkirjastavad, mida nad peavad allkirjastama, esitavad, mida nad peavad esitama, ja loodavad, et tehniline reaalsus vastab lepingulisele kirjeldusele. Paberikoletis loob vastavuse näilisuse. See harva loob selle sisu.
Tehniline Ebapiisavus: Tööriistad Ei Vasta Kohustusele
Generatiivse AI-põhine PII tuvastamine on mitte-deterministlik. Sama dokument, mida töödeldakse kaks korda, annab erinevaid tulemusi. Põhimõtteliselt on see kooskõlas vastavusega — kus peate tõendama, et konkreetseid andmeid tuvastati ja käsitleti õigesti, reprodutseeritavalt ja kontrollitavalt.
Microsoft Presidio, spaCy, Stanza — inseneritehnilised platvormid, mitte vastavustööriistad. Tootmisse rakendamine nõuab iga üksuse tüübi ja keele jaoks kohandatud tuvastajate kirjutamist, eel- ja järeltöötlusprotsesside ehitamist, dokumentide formaatidega integreerimist, kõike hooldamist, kui regulatsioonid arenevad. Tüüpiliselt 30–80 tundi spetsialisti inseneritööd enne, kui ükski dokument on töödeldud. Enamikul organisatsioonidel ei ole seda ekspertiisi majas.
Isikukood Rootsi töölepingus, Steuer-ID Saksamaa maksuvormis, PESEL Poola kindlustusdokumendis, Codice Fiscale Itaalia arvel — igaühel on vaja mitte ainult keele tuvastamist, vaid ka dokumentide tüübi teadlikku üksuse tuvastamist. Keeleredelid, mis on peamiselt koolitatud inglise keeles, toodavad 69% PII möödalaskmise määra mitte-ingliskeelses tekstis. Seadus ei tee keele osas erandeid.
Microsoft Purview, AWS Macie, Google Cloud DLP — kallid, nõuavad pilveühendust, lukustavad organisatsioonid. Veelgi kriitilisem: kõik on USA-s asuvad. 2018. aasta CLOUD Act kohustab neid avaldama andmeid igas maailma nurgas kehtiva USA valitsuse taotluse alusel. FISA § 702 võimaldab luurekogumist ilma individuaalsete korraldusteta. Schrems II tühistas EL-USA privaatsuse kilbi just sellepärast. Kuue numbriga aastane leping USA pilveteenuse pakkujaga ei too kaasa GDPR-iga kooskõlalist andmete töötlemist.
Kontrollimatu AI Probleem: Turul Pole Vastust
77% töötajatest jagavad tundlikku tööinfot AI tööriistadega vähemalt kord nädalas. 34.8% kõigist AI tööriistade sisenditest sisaldavad teavet, mis kvalifitseerub tundlikuks vähemalt ühe privaatsuse raamistikuga. Töötajad kasutavad ChatGPT, Copilot, Claude, Gemini lepingute koostamiseks, märkmete kokkuvõtmiseks, tabelarvutuste analüüsimiseks — pidevalt, automaatselt, teadmata, mida nad prompti kleepivad.
Traditsioonilised DLP süsteemid ei suuda mõista loodusliku keele prompti semantilist sisu. Nad ei suuda eristada arendajat, kes palub AI-l selgitada koodimustrit, arendajast, kes kleepib 50 000 kirje tootmisandmebaasi samasse aknasse. AI mudelid töötlevad kõike. Nad ei paku kaitset, ei hoiatust, ei audititeed, millele DPO saaks toetuda.
Puudub tehniline kiht, mis muudab poliitika praktikas jõustatavaks. See kiht ei eksisteeri turul üheski hinnaklassis, mida keskmine organisatsioon endale lubada suudab, üheski vormis, mis töötab AI tööriistadega, mida töötajad tegelikult kasutavad. See on üks lünki, mille sulgemiseks see ökosüsteem loodi.
Ligipääsetavuse Lünk: Vastavus kui Skaala Privileeg
Üksikpraktikant, kogukonna organisatsioon, väike avalik asutus, teadusasutus — igaühel on sama GDPR, sama kustutamise õigus, sama rikkumise teavitamise kohustus nagu globaalsetel pankadel — kuid ilma õigusmeeskonna, inseneritehniliste ressursside või ettevõtte tarkvara eelarveta, et neid korralikult rakendada. Vastavuse ökosüsteem on teeninud suuri organisatsioone piisavalt, kuigi kallilt. See on teeninud kõiki teisi, kellel on mandaadid, kuid mitte praktilisi vahendeid selle täitmiseks.
Ökosüsteemi Vastus — Üks Platvorm, Mitmed Väljendused
Katusplatvorm ja peamine juurdepääsupunkt. Hübriidne kahekordne PII tuvastamine (260+ üksust, 48 keelt, 121 vastavuse eelseadet) kõigi juurutusmudelite kaudu — SaaS, hallatud privaatne pilv ja iseseisev. Kõik tuletatud tooted jagavad sama tuvastusmootorit ja sama asutamisprintsiipi: võim kasutaja käes.
Ettevõtte õhuvahe väljaanne. 390+ üksust, 317 kohandatud regex mustrit, 100% offline töötlemine, pildi OCR 37 keeles. Null pilve sõltuvus — andmed ei lahku kunagi seadmest.
Pilve esmane PII platvorm laiemate juurdepääsuvõimalustega. Chrome'i laiendus reaalajas AI sekkumiseks, MCP server, Office lisand, tagasipööratav krüptimine. Tasuta kuni €29/kuu — vastavus iga eelarve jaoks.
Desktop-esmane, täielikult kohalik. Presidio külgseade seadmes, 7 dokumendi formaati + OCR, partii töötlemine, krüpteeritud seif. Ühekordne igavene litsents — ei tellimusi, ei pilve, täielikult offline pärast aktiveerimist.
Kohene avalik demo platvorm. Konto pole vajalik — kleepige tekst, anonüümige kohe, vaadake mootorit tegevuses. Kiireim viis kogeda, mida ökosüsteem teeb.
Katusplatvorm — SaaS · Hallatud Privaatne · Iseseisev · 3 juurutusmudelit
- //Organisatsioonid teatavad, et 67% arendajatest on kogemata avalikustanud saladusi koodis — deterministlik regex tabab seda, mida NLP jätab vahele ja vastupidi
- //Üldotstarbeline AI tuvastamine saavutab 69% möödalaskmise määra mitte-ingliskeelses tekstis — kahekordne kiht spaCy + XLM-RoBERTa sulgeb lõhe kõigis 48 keeles
- //Ebaühtlane redigeerimine meeskondade vahel on #1 tsiteeritud ICO ja DPA auditi leid — eelseaded tagavad identse tuvastuskäitumise igas kasutajas, igas seansis
- //95% 2024. aasta andmerikkumistest on seotud inimlike eksimustega — jagatud eelseaded elimineerivad isikupõhised konfiguratsioonide otsused, mis loovad variatsiooni
- //Mitme müüja PII virnad loovad auditi jälje lünki — 60%+ organisatsioonidest, kes kasutavad 3+ PII tööriista, teatavad tööriistade vahelisest leppimise ebaõnnestumisest
- //Formaatide fragmentatsioon: organisatsioonid töötlevad PDF, DOCX, XLSX, CSV, JSON samaaegselt — iga formaat nõudis varem eraldi lähenemist, eraldi tööriista, eraldi auditi registrit
- //Ettevõtte PII tööriistade maksumus on $50,000–$500,000/aastas — organisatsioonidel, kellel on kulupiirangud, ei ole ajalooliselt olnud ühtegi valikut
- //CLOUD Act + FISA § 702 tähendab, et USA-s majutatud "GDPR-iga kooskõlas" töötlemine on lepinguline fantaasia — EL-i ainus majutus eemaldab selle kokkupuute täielikult
Ettevõtte Õhuvahe — 390+ üksust · 317 kohandatud regex · 100% offline · Pildi OCR
- //Tööstusharu spetsiifilised PII — tuuma rajatise koodid, sõjaväeteenistuse numbrid, omandi sisemised ID-d — ei ole kaetud ühegi kommertstootega; kohandatud tuvastajad vajavad toor Presidio inseneritööd nädalate kaupa
- //Katvuse puudulikkus on tuvastamise lagi: ükski üldine tööriist ei kata kõiki PII tüüpe, kõiki keeli, kõiki formaate — 317 kureeritud mustrit sulgeb lõhed, mida välja pakutud raamistikud jätavad vahele
- //Müüja paradoks: PII kaitsmiseks peate selle müüjaga jagama. Pilve töötlemine nõuab töötleja usaldamist — arhitektuuriline vastuolu organisatsioonidele, kes käsitlevad kõige tundlikumaid andmeid
- //Õhuvahega keskkonnad (kaitse, luure, kriitiline infrastruktuur, teaduslaborid) ei saa kasutada pilve sõltuvaid tööriistu üheski hinnas — offline-esmane eemaldab arhitektuurilise takistuse täielikult
- //Microsoft Purview ei saa selgelt skaneerida JPEG/PNG — tekst PII ekraanipiltides on ettevõtte DLP virnas täiesti nähtamatu disaini tõttu
- //SparkCat pahavara (iOS/Android, detsember 2025) kasutas OCR-i krüptovaluuta rahakoti taastamise fraaside varastamiseks ekraanipiltidelt — pildipõhine tekst PII on aktiivne rünnaku sihtmärk, mitte teoreetiline risk
- //300% suurenemine pilvepõhistes andmerikkumistes 2022. ja 2024. aasta vahel — nullteadmised tähendab, et meie serverite rikkumine ei paljasta midagi, sest midagi ei salvestata
- //ISO 27001:2022 sertifitseeritud regulaarsete täisläbivaatuste ja testimisega — turvaseisund, mida reguleeritud hankimine nõuab, on dokumenteeritud, kinnitatud ja sõltumatult auditeeritud
Pilve PII Platvorm — Tasuta kuni €29/kuu · Chrome'i Laiendus · MCP Server · Office Lisand
- //8.5% kõigist LLM promptidest sisaldavad PII — reaalajas sekkumine enne esitamist on ainus ennetus, mis töötab; tagantjärele tuvastamine jätab vahele ainulaadse akna, mis on oluline
- //Traditsiooniline DLP töötab pärast andmete lahkumist organisatsioonist — Chrome'i laiendus sekkub sisendi hetkel, enne kui ükski mudel saab või töötleb tundlikku sisu
- //Generatiivne AI tuvastamine on mitte-deterministlik — sama dokument annab erinevaid tulemusi erinevatel jooksudel; ükski tõenäosuslik süsteem ei saa olla regulatiivse kaitse alus
- //Presidio üksi jätab konteksti sõltuvad üksused vahele; XLM-RoBERTa üksi genereerib vale positiivseid tulemusi formaalses õiguskeeles — kolmas seisukoha klassifitseerimise kiht elimineerib vale positiivsed tulemused, mis panevad vastavuse meeskonnad automaatsete tööriistade suhtes umbusklikuks
- //Õiguslik avastus, meditsiiniliste rekordite juurdepääsutaotlused, regulatiivne audit — anonüümseid andmeid tuleb mõnikord de-anonüümida volitatud osapoole poolt ja ainult tema poolt; pöördumatud meetodid muudavad selle võimatuks
- //Kasutaja seansi võti ei lahku kunagi nende seadmest — mitte meie serveritest, mitte üheski pilves, mitte üheski allhankes. Õigus tagasipööramisele kuulub kasutajale, mitte meile.
- //Üksikpraktikant seisab silmitsi sama GDPR-i kustutamise õiguse kohustusega nagu globaalne pank — kuid ilma vastavuse osakonna või €500K/aastas ettevõtte tarkvara eelarveta
- //764 EL-i organisatsiooni on samal ajal uurimise all kustutamise ebaõnnestumiste tõttu — mitte sellepärast, et nad kavatsevad rikkuda; sest vastavuse täitmiseks vajalikud tööriistad olid hinna poolest nende ulatusest väljas
Desktop-Esmane · 100% Kohalik Töötlemine · 7 Dokumendi Formaati + OCR · Ühekordne Litsents
- //300% suurenemine pilvepõhistes andmerikkumistes 2022. ja 2024. aasta vahel — andmed, mis ei sisenenud kunagi pilve, ei saa pilve rikkumise korral avalikuks tulla
- //CLOUD Act + FISA muudavad USA-s majutatud töötlemise EL-i organisatsioonide jaoks õiguslikult ebakindlaks — kohalik töötlemine kõrvaldab kogu piiriülese ülekande probleemi, tagades, et ülekannet ei toimu
- //Formaadi fragmentatsioon sunnib organisatsioone säilitama mitmeid tööriistu — iga tööriist loob eraldi tuvastuspoliiitika, eraldi auditi registri, eraldi ebaõnnestumise režiimi
- //Logifailid on tähelepanuta jäetud PII pind — arendajad keskenduvad andmebaasidele, kuid logid sisaldavad API võtmeid, kasutaja ID-sid, IP-aadresse; CSV ja JSON on natiivsete dokumentide kõrval toetatud
- //Õhuvahega tootmis keskkonnad — tootmisalad, valitsuse turvalised rajatised, teaduslaborid — ei saa taluda litsentsi kontrolli, mis nõuab võrguühendust; ühekordne aktiveerimine, seejärel täielik offline töö on ainus teostatav arhitektuur
- //Igavene litsents ilma korduvate SaaS sõltuvusteta: kasutaja omab oma installatsiooni; müüja tellimuse tühistamine ei saa tööriista kriitilisel töötlemise hetkel keelata
- //dbt torujuhtme taastamine hävitab maskeerimis poliitikad CSV/JSON andmetes — EDPB 2024 täpsustab, et see rikub GDPR Art. 5(1)(a); seifisalvestus krüpteeritud ajalooga tähendab, et igal töödeldud failil on auditeeritav, taastatav register
- //Organisatsioonid, kes töötlevad tuhandeid päranddokumente GDPR-i kustutamise nõuete täitmiseks, vajavad partii võimet — mitte 5 faili päevas SaaS piiri, mis muudab ülesande operatiivselt võimatuks
Probleemi Ulatus
Need ei ole erandlikud ebaõnnestumised. Need on süsteemsed tulemused vastavuse keskkonnast, mis on ületanud oma infrastruktuuri.