PERUSTAJAN LAUSUNTO
Miksi aloitin tämän ekosysteemin — ammatillinen vakaumus 28 vuoden jälkeen
Sinun tietosi. Sinun avaimet. Sinun säännöt.
Jokainen tuote tässä ekosysteemissä perustuu yhteen arkkitehtoniseen sitoumukseen: sinun tietosi, sinun avaimet, sinun hallinta. Salasanasi ei koskaan jätä laitetta. Asiakirjojasi ei koskaan tallenneta. Salauksen avain on vain sinun. Mikään Yhdysvaltojen pilvilainsäädäntö, mikään toimittajan määräys, mikään tietojen välittäjä — ei voi saavuttaa sitä, mitä ei koskaan jaettu.
Tausta
Olen työskennellyt 28 vuotta teknologian, turvallisuuden ja organisaatioiden vaatimusten täyttämisen risteyskohdassa. Perustin curta.solutionsin vuonna 1998. Siitä lähtien olen palvellut säänneltyjä organisaatioita 26 maassa — rahoituspalveluissa, terveydenhuollossa, oikeudellisissa asioissa, hallituksessa, valmistuksessa ja teknologiassa — IT-arkkitehtuurin, turvallisuuden, digitaalisen muutoksen ja vaatimusten täyttämisen kumppanina.
Mitä olen havainnut 28 vuoden aikana, ei ole hidas kehitys. Se on kriisi hidastetussa liikenteessä — kriisi, joka saavutti käännepisteen generatiivisen AI:n ja päällekkäisten tietosuojalainsäädäntöjen maailmanlaajuisen leviämisen myötä.
Vakaumukseni
Uskon, että jokaisella henkilöllä, organisaatiolla ja instituutiolla on oikeus jakaa tietoa valikoivasti — paljastaa sääntelijälle vain se, mitä sääntelijä on oikeutettu näkemään, tehdä yhteistyötä kumppanin kanssa vain niiden tietojen osalta, jotka on nimenomaisesti valtuutettu, osallistua kaupalliseen ja julkiseen elämään luovuttamatta sitä, mikä on pysyttävä yksityisenä.
Uskon, että tämä oikeus on käytännössä toteutettavissa kaikille — ei vain organisaatioille, joilla on vaatimustenmukaisuusosastoja ja yritysohjelmistobudjetteja. Tietosuoja ei voi olla mittakaavan etuoikeus.
Uskon, että maailmassa, jossa Yhdysvaltain laki voi ulottua mihin tahansa tietoon, jota pidetään minkä tahansa Yhdysvaltalaisen yrityksen hallussa missä tahansa maailmassa, ja jossa 77 % työntekijöistä syöttää arkaluontoisia tietoja AI-työkaluihin, joita he eivät hallitse, ainoa arkkitehtuuri, joka voi tarjota merkittävän tietosuojan, on sellainen, jossa tiedot eivät koskaan jätä käyttäjän hallintaa alun perinkään. Ei sopimusvakuutuksia. Ei tietosuojakäytäntöjä. Tekninen arkkitehtuuri.
Nollatietämyksen todennus. Paikallinen ensisijainen käsittely. Käännettävä salaus, jossa avain kuuluu käyttäjälle. Offline-kykyinen toiminta. EU:n toimivalta, ei poikkeuksia. Nämä eivät ole tuoteominaisuuksia. Ne ovat vähimmäisstandardi kaikille työkaluilla, jotka väittävät suojaavansa henkilötietoja.
Ja uskon, että 28 vuoden työskentely maailman herkimpien tietojen käsittelevissä organisaatioissa — 28 vuoden ajan sääntelytarkoituksen ja teknisen todellisuuden välisen kuilun laajenemisen seuraaminen — on antanut minulle sekä ymmärryksen että vastuun aloittaa sen, mitä ekosysteemiltä edelleen puuttuu. Määrittää visio, koota oikea tiimi ja varmistaa, että se rakennetaan ongelman vaatimalla standardilla.
Oikeus anonymisoida henkilötietoja ei ole tekninen ominaisuus. Se on perustavanlaatuinen oikeus. Ja oikeus, jota ei voida käytännössä toteuttaa, ei ole oikeus lainkaan.
Havaitsemiani ongelmia
Sääntelyfragmentaatio: Liikaa sääntöjä, ei yhteistä kieltä
Keskikokoinen organisaatio, joka toimii globaalisti, joutuu samanaikaisesti navigoimaan yli 48 kansallisen ja alueellisen tietosuojalain — GDPR, UK GDPR, CCPA, LGPD, PDPA, PIPL, DPDPA, APPI, PIPEDA ja kymmeniä muita. 24 kansallista DPA:ta EU:ssa antaa sitovia ohjeita, jotka ovat periaatteessa johdonmukaisia mutta käytännössä erilaisia. Se, mikä tyydyttää Saksan BfDI:tä, ei automaattisesti tyydytä Ranskan CNIL:iä, Irlannin DPC:tä tai Alankomaiden AP:ta. Toimialakohtainen kerrostuminen — HIPAA, PCI-DSS, NIS2, AI-laki — lisää vaatimuksia, joita harvoin harmonisoidaan keskenään.
Tuloksena ei ole vaatimustenmukaisuuskehys. Se on liikkuva kohde, jossa on 48 erilaista maalia.
Paperihirviö: Sopimukset, joita kukaan ei lue, valvontaa, jota kukaan ei vahvista
Organisaatiot ylläpitävät tietojenkäsittelysopimuksia satojen alihankkijoiden kanssa, standardoidut sopimuslausekkeet, jotka ulottuvat yli 30 sivun jokaiselle siirtosuhteelle, käsittelytoimintojen rekisterit, DPIA:t, TIA:t, LIA:t — jokainen vaatii teknistä panosta, jota useimmat oikeudelliset tiimit eivät voi itsenäisesti vahvistaa. Käytännössä: organisaatiot allekirjoittavat sen, mitä heidän on allekirjoitettava, arkistoivat sen, mitä heidän on arkistoitava, ja toivovat, että tekninen todellisuus vastaa sopimuksen kuvausta. Paperihirviö luo vaatimustenmukaisuuden vaikutelman. Se harvoin tuottaa sen substanssia.
Tekninen riittämättömyys: Työkalut eivät vastaa velvoitetta
Generatiivinen AI-pohjainen PII-tunnistus on ei-deterministinen. Sama asiakirja käsiteltynä kahdesti tuottaa erilaisia tuloksia. Perustavanlaatuisesti yhteensopimaton vaatimustenmukaisuuden kanssa — missä sinun on osoitettava, toistettavasti ja varmennettavasti, että tietyt tiedot on havaittu ja käsitelty oikein.
Microsoft Presidio, spaCy, Stanza — insinöörialustat, ei vaatimustenmukaisuustyökalut. Tuotantoon käyttöönotto vaatii mukautettujen tunnistimien kirjoittamista jokaiselle entiteettityypille ja kielelle, esikäsittely- ja jälkikäsittelyputkien rakentamista, asiakirjamuotojen integroimista, kaiken ylläpitämistä sääntöjen kehittyessä. Tyypillisesti 30–80 tuntia erikoistuneita insinööriaikoja ennen kuin yksi asiakirja käsitellään. Useimmilla organisaatioilla ei ole tätä asiantuntemusta talon sisällä.
Henkilönumero Ruotsin työsopimuksessa, Steuer-ID Saksan veromuodossa, PESEL Puolan vakuutusasiakirjassa, Codice Fiscale Italian laskussa — jokainen vaatii ei vain kielen tunnistamista vaan asiakirjatyyppitietoista entiteettitunnistusta. Kielelliset mallit, jotka on koulutettu pääasiassa englanniksi, tuottavat 69 % PII-hämissuhteen ei-englanninkielisessä tekstissä. Laki ei tee eroa kielen mukaan.
Microsoft Purview, AWS Macie, Google Cloud DLP — kalliita, vaativat pilviyhteyden, lukitsevat organisaatiot. Kriittisesti: kaikki ovat Yhdysvalloissa pääkonttori. CLOUD Act vuodelta 2018 velvoittaa niitä paljastamaan tietoja missä tahansa maailmassa voimassa olevan Yhdysvaltain hallituksen pyynnön perusteella. FISA:n osio 702 mahdollistaa tiedustelun keräämisen ilman yksittäisiä määräyksiä. Schrems II kumosi EU-US-tietosuojakilven juuri tästä syystä. Kuuden numeron vuosittainen sopimus Yhdysvaltojen pilvipalveluntarjoajan kanssa ei tuota GDPR-vaatimustenmukaista tietojenkäsittelyä.
Hallitsematon AI-ongelma: Markkinoilla ei ole vastausta
77 % työntekijöistä jakaa arkaluontoista työinformaatiota AI-työkalujen kanssa vähintään viikoittain. 34,8 % kaikista AI-työkalujen syötteistä sisältää tietoja, jotka täyttävät arkaluontoisuuden kriteerit ainakin yhden tietosuojakehyksen mukaan. Työntekijät käyttävät ChatGPT:tä, Copilotia, Claudea, Geminia sopimusten laatimiseen, muistiinpanojen tiivistämiseen, taulukkolaskentojen analysoimiseen — jatkuvasti, automaattisesti, ilman tietoisuutta siitä, mitä he liittävät kehotteeseen.
Perinteiset DLP-järjestelmät eivät voi ymmärtää luonnollisen kielen kehotteen semanttista sisältöä. Ne eivät voi erottaa kehittäjää, joka pyytää AI:ta selittämään koodimallia, kehittäjästä, joka liittää 50 000 tietueen tuotantotietokannan samaan ikkunaan. AI-mallit käsittelevät kaiken. Ne eivät tarjoa suojaa, varoituksia tai tarkastushistoriaa, johon DPO voi luottaa.
Puuttuu tekninen kerros, joka tekee politiikan täytäntöönpanosta käytännössä mahdollista. Tämä kerros ei ole markkinoilla missään hintapisteessä, jonka keskikokoinen organisaatio voi maksaa, missään muodossa, joka toimii AI-työkaluissa, joita työntekijät todella käyttävät. Tämä on yksi aukko, jonka tämä ekosysteemi rakennettiin sulkemaan.
Saavutettavuusaukko: Vaatimustenmukaisuus on mittakaavan etuoikeus
Yksityinen ammatinharjoittaja, yhteisöjärjestö, pieni julkinen viranomainen, tutkimuslaitos — jokainen alttiina samalle GDPR:lle, samalle oikeudelle poistamiseen, samalle rikkomusilmoitusvelvoitteelle kuin globaali pankki — mutta ilman oikeudellista tiimiä, insinööriresursseja tai yritysohjelmistobudjettia niiden asianmukaiseen toteuttamiseen. Vaatimustenmukaisuus-ekosysteemi on palvellut suuria organisaatioita riittävästi, joskin kalliisti. Se on palvellut kaikkia muita, joilla on mandaatti mutta ei käytännön keinoja sen täyttämiseksi.
Ekosysteemivastaus — Yksi alusta, useita ilmentymiä
Yhteinen alusta ja ensisijainen pääsykohta. Hybrididuaalikerroksinen PII-tunnistus (260+ entiteettiä, 48 kieltä, 121 vaatimustenmukaisuusasetusta) kaikissa käyttöönotto-malleissa — SaaS, hallinnoitu yksityinen pilvi ja itsehallittu. Kaikki johdetut tuotteet jakavat saman tunnistusmoottorin ja saman perustavan periaatteen: voima käyttäjän käsissä.
Yrityksen ilma-aukko-versio. 390+ entiteettiä, 317 mukautettua regex-mallia, 100 % offline-käsittely, kuvien OCR 37 kielellä. Nollapilvisiteetti — tiedot eivät koskaan jätä laitetta.
Pilvipohjainen PII-alusta laajimmalla pääsyllä. Chrome-laajennus reaaliaikaista AI-torjuntaa varten, MCP-palvelin, Office-lisäosa, käännettävä salaus. Ilmainen 29 €/kk — vaatimustenmukaisuus jokaiselle budjetille.
Työpöytä ensisijaisesti, täysin paikallinen. Presidio-sivuprosessori laitteessa, 7 asiakirjamuotoa + OCR, eräkäsittely, salattu holvi. Kertaluonteinen ikuisuuslisenssi — ei tilauksia, ei pilveä, täysin offline aktivoinnin jälkeen.
Välitön julkinen demoplatform. Ei tiliä vaadita — liitä teksti, anonymisoi heti, näe moottori toiminnassa. Nopein tapa kokea, mitä ekosysteemi tekee.
Yhteinen alusta — SaaS · Hallinnoitu yksityinen · Itsehallittu · 3 käyttöönotto-mallia
- //Organisaatiot raportoivat, että 67 % kehittäjistä on vahingossa paljastanut salaisuuksia koodissa — deterministinen regex nappaa sen, mitä NLP jättää huomiotta ja päinvastoin
- //Yleiskäyttöinen AI-tunnistus saavuttaa 69 % hämissuhteen ei-englanninkielisessä tekstissä — kaksikerroksinen malli spaCy + XLM-RoBERTa sulkee aukon kaikilla 48 kielellä
- //Eri tiimien epäjohdonmukainen peittäminen on #1 mainittu ICO- ja DPA-auditoinnin havainto — asetukset pakottavat identtisen tunnistuskäyttäytymisen jokaiselle käyttäjälle, jokaiselle istunnolle
- //95 % vuoden 2024 tietoturvaloukkauksista liittyy inhimilliseen virheeseen — jaetut asetukset poistavat henkilökohtaiset konfigurointipäätökset, jotka luovat vaihtelua
- //Monitoimittajapohjaiset PII-paketit luovat tarkastushistorian aukkoja — yli 60 % organisaatioista, jotka käyttävät 3+ PII-työkalua, raportoivat sovitusongelmista työkalujen välillä
- //Muotofragmentaatio: organisaatiot käsittelevät PDF-, DOCX-, XLSX-, CSV-, JSON-samaan aikaan — jokainen muoto vaati aiemmin erillisen lähestymistavan, erillisen työkalun, erillisen tarkastushistorian
- //Yrityksen PII-työkalut maksavat 50 000–500 000 dollaria vuodessa — organisaatioilla, joilla on kustannusrajoituksia, ei ole ollut historiallisen vaihtoehtoa lainkaan
- //CLOUD Act + FISA:n osio 702 tarkoittaa, että Yhdysvalloissa isännöity "GDPR-yhteensopiva" käsittely on sopimusfiktiota — EU:lle tarkoitettu isännöinti poistaa tämän altistuksen kokonaan
Yrityksen ilma-aukko — 390+ entiteettiä · 317 mukautettua regex · 100 % offline · Kuvan OCR
- //Toimialakohtaiset PII — ydinvoimalaitoksen koodit, sotilaspalvelusnumerot, omat sisäiset ID:t — ei katettu minkään kaupallisen työkalun toimesta; mukautetut tunnistimet vaativat viikkojen erikoisinsinöörityötä raaka Presidiossa
- //Kattavuuden puutteet ovat tunnistuksen katto: mikään yleinen työkalu ei kata kaikkia PII-tyyppejä, kaikkia kieliä, kaikkia muotoja — 317 kuratoitua mallia sulkevat aukot, joita valmiit kehykset jättävät huomiotta
- //Toimittajaparadoksi: suojellaksesi PII:tä sinun on jaettava se toimittajalle. Pilvikäsittely vaatii luottamusta prosessorille — arkkitehtoninen ristiriita organisaatioille, jotka käsittelevät herkintä dataa
- //Ilma-aukko-ympäristöt (puolustus, tiedustelu, kriittinen infrastruktuuri, tutkimuslaboratoriot) eivät voi käyttää pilvipohjaisia työkaluja minkään hinnan vuoksi — offline-ensimmäinen poistaa arkkitehtonisen esteen kokonaan
- //Microsoft Purview ei voi skannata JPEG/PNG — tekstin PII kuvakaappauksissa on täysin näkymätön yrityksen DLP-paketille suunnitellusti
- //SparkCat-haittaohjelma (iOS/Android, joulukuu 2025) käytti OCR:ää varastaakseen kryptovaluuttalompakon palautuslauseita kuvakaappauksista — kuvapohjainen teksti PII on aktiivinen hyökkäyskohde, ei teoreettinen riski
- //300 % kasvu pilvipohjaisissa tietoturvaloukkauksissa vuosina 2022–2024 — nollatietämyksellä palvelimien rikkomus ei paljasta mitään, koska mitään ei tallenneta
- //ISO 27001:2022 sertifioitu säännöllisellä täydellä pentestaamisella — sääntelyhankinnat vaativat turvallisuusaseman dokumentointia, vahvistamista ja riippumatonta auditointia
Pilvipohjainen PII-alusta — Ilmainen → 29 €/kk · Chrome-laajennus · MCP-palvelin · Office-lisäosa
- //8,5 % kaikista LLM-kehotteista sisältää PII — reaaliaikainen torjunta ennen lähettämistä on ainoa toimiva ehkäisy; jälkikäteen havaittu tunnistus jättää huomiotta ainoan tärkeän ikkunan
- //Perinteinen DLP syttyy sen jälkeen, kun data on lähtenyt organisaatiosta — Chrome-laajennus torjuu syötteen kohdalla, ennen kuin mikään malli vastaanottaa tai käsittelee arkaluontoista sisältöä
- //Generatiivinen AI-tunnistus on ei-deterministinen — sama asiakirja tuottaa eri tuloksia eri käsittelykerroilla; mikään todennäköisyysperusteinen järjestelmä ei voi olla sääntelypuolustuksen perusta
- //Pelkkä Presidio jättää huomiotta kontekstiin liittyvät entiteetit; XLM-RoBERTa yksin tuottaa vääriä positiivisia virheitä muodollisessa oikeuskielessä — kolmas stance-luokituskerros poistaa vääriä positiivisia, jotka saavat vaatimustenmukaisuusryhmät epäilemään automatisoituja työkaluja
- //Oikeudellinen selvitys, lääkärintodistusten pääsypyynnöt, sääntelyauditointi — anonymisoidut tiedot on joskus de-anonymisoitava valtuutetun tahon toimesta ja vain heidän toimesta; peruuttamattomat menetelmät tekevät tämän mahdottomaksi
- //Käyttäjän istuntavihje ei koskaan jätä heidän laitettaan — ei meidän palvelimille, ei mihinkään pilveen, ei mihinkään alihankkijalle. Oikeus palauttaa anonymisointi kuuluu käyttäjälle, ei meille.
- //Yksityinen ammatinharjoittaja kohtaa saman GDPR-oikeuden poistamiseen kuin globaali pankki — mutta ilman vaatimustenmukaisuusosastoa tai 500 000 €/vuosi yritysohjelmistobudjettia
- //764 EU-organisaatiota on samanaikaisesti tutkinnan alla poistamisen epäonnistumisten vuoksi — ei siksi, että he olisivat aikoneet rikkoa; koska vaatimustenmukaisuuden täyttämiseen tarvittavat työkalut olivat hinnoiteltu heidän ulottumattomiinsa
Työpöytä-ensimmäinen · 100 % paikallinen käsittely · 7 asiakirjamuotoa + OCR · Kertaluonteinen lisenssi
- //300 % kasvu pilvipohjaisissa tietoturvaloukkauksissa vuosina 2022–2024 — data, joka ei koskaan siirry pilveen, ei voi altistua pilviloukkauksessa
- //CLOUD Act + FISA tekevät Yhdysvalloissa isännöidystä käsittelystä laillisesti epävarmaa EU-organisaatioille — paikallinen käsittely poistaa koko rajat ylittävän siirto-ongelman varmistamalla, ettei siirtoa tapahdu
- //Muotofragmentaatio pakottaa organisaatiot ylläpitämään useita työkaluja — jokainen työkalu luo erillisen tunnistuskäytännön, erillisen tarkastushistorian, erillisen epäonnistumismuodon
- //Lokitiedostot ovat laiminlyöty PII-pinta — kehittäjät keskittyvät tietokantoihin, mutta lokit sisältävät API-avaimia, käyttäjätunnuksia, IP-osoitteita; CSV ja JSON tuetaan natiivisti yhdessä rakenteellisten asiakirjojen kanssa
- //Ilma-aukko-tuotantoympäristöt — valmistuslaitokset, hallituksen turvalliset tilat, tutkimuslaboratoriot — eivät voi sietää lisenssintarkistusta, joka vaatii verkkoyhteyden; kertaluonteinen aktivointi, sitten täysin offline-toiminta on ainoa toimiva arkkitehtuuri
- //Ikuiset lisenssit ilman toistuvaa SaaS-riippuvuutta: käyttäjä omistaa asennuksensa; toimittajan tilauksen peruutus ei voi estää työkalua kriittisessä käsittelyhetkessä
- //dbt-putkilinjat tuhoavat peittämiskäytännöt CSV/JSON-tiedoissa — EDPB 2024 selventää, että tämä rikkoo GDPR:n artiklaa 5(1)(a); holvitallennus salatulla historiatiedolla tarkoittaa, että jokaisella käsitellyllä tiedostolla on auditoitava, palautettavissa oleva rekisteri
- //Organisaatiot, jotka käsittelevät tuhansia perintöasiakirjoja GDPR:n poistamisvaatimusten täyttämiseksi, tarvitsevat eräkykyä — ei 5 tiedostoa päivässä SaaS-rajoitusta, joka tekee tehtävästä operatiivisesti mahdotonta
Ongelman laajuus
Nämä eivät ole poikkeuksellisia epäonnistumisia. Ne ovat järjestelmällisiä seurauksia vaatimustenmukaisuusympäristöstä, joka on ylittänyt oman infrastruktuurinsa.