TAMKO LA MWANZILISHI
Kwa Nini Nilianzisha Mfumo Huu — Dhamira ya Kitaaluma Baada ya Miaka 28
Data yako. Funguo zako. Kanuni zako.
Kila bidhaa katika mfumo huu imejengwa kwa ahadi moja ya usanifu: data yako, funguo zako, udhibiti wako. Nywila yako haitoki kwenye kifaa chako. Hati zako hazihifadhiwi kamwe. Funguo yako ya usimbaji ni yako pekee. Hakuna sheria ya wingu la Marekani, hakuna wito wa muuzaji, hakuna broker wa data — wanaweza kufikia kile ambacho hakijawahi kushirikiwa.
Muktadha
Kwa miaka 28 nimefanya kazi katika makutano ya teknolojia, usalama, na ufuatiliaji wa shirika. Nilianzisha curta.solutions mwaka 1998. Tangu wakati huo nimehudumia mashirika yanayodhibitiwa katika nchi 26 — katika huduma za kifedha, afya, sheria, serikali, utengenezaji, na teknolojia — kama mshirika wao katika usanifu wa IT, usalama, mabadiliko ya kidijitali, na ufuatiliaji.
Ninachokiona baada ya miaka 28 si mabadiliko polepole. Ni mgogoro katika mwendo wa polepole — mmoja ambao ulifika hatua ya kuvunjika kwa kuwasili kwa AI inayozalisha na kuenea kwa kimataifa kwa kanuni za faragha zinazoshirikiana.
Dhamira Yangu
Ninaamini kwamba kila mtu, shirika, na taasisi wana haki ya kushiriki taarifa kwa kuchagua — kufichua kwa mdhibiti tu kile ambacho mdhibiti anastahili kuona, kushirikiana na mshirika tu juu ya data ambayo imeidhinishwa wazi, kushiriki katika maisha ya kibiashara na ya umma bila kuachilia kile kinapaswa kubaki kuwa faragha.
Ninaamini haki hii inapaswa kutekelezeka kwa vitendo na kila mtu — si tu na mashirika yenye idara za ufuatiliaji na bajeti za programu za biashara. Faragha haiwezi kuwa kipaumbele cha kiwango.
Ninaamini kwamba katika ulimwengu ambapo sheria za Marekani zinaweza kufikia data yoyote iliyoshikiliwa na kampuni yoyote ya Marekani popote duniani, na ambapo 77% ya wafanyakazi wanatoa data nyeti kwenye zana za AI ambazo hawazidhibiti, usanifu pekee unaoweza kutoa dhamana ya faragha yenye maana ni ule ambapo data haitoki kwenye udhibiti wa mtumiaji tangu mwanzo. Si dhamana za mkataba. Si sera za faragha. Usanifu wa kiufundi.
Uthibitisho wa zero-knowledge. Usindikaji wa kwanza wa ndani. Usimbaji wa kurudishwa ambapo funguo inamhusu mtumiaji. Operesheni inayoweza kufanya kazi bila mtandao. Mamlaka ya EU, bila ubaguzi. Hizi si sifa za bidhaa. Ni kiwango cha chini kwa kila zana inayodai kulinda data binafsi.
Na ninaamini kwamba miaka 28 ya kufanya kazi ndani ya mashirika yanayoshughulikia taarifa nyeti zaidi duniani — miaka 28 ya kutazama pengo kati ya dhamira ya kisheria na ukweli wa kiufundi likiongezeka — imenipa uelewa na wajibu wa kuanzisha kile mfumo bado unakosa. Kufafanua maono, kukusanya timu sahihi, na kuhakikisha inajengwa kwa kiwango ambacho tatizo linahitaji.
Haki ya kuficha taarifa binafsi si sifa ya kiufundi. Ni haki ya msingi. Na haki ambayo haiwezi kutekelezwa kwa vitendo si haki yoyote.
Shida Nilizoziona
Kugawanyika kwa Kanuni: Kanuni Nyingi, Hakuna Lugha ya Pamoja
Shirika la kati linalofanya kazi kimataifa lazima lipitie sheria 48+ za faragha za kitaifa na kikanda kwa wakati mmoja — GDPR, UK GDPR, CCPA, LGPD, PDPA, PIPL, DPDPA, APPI, PIPEDA na nyinginezo nyingi. DPAs 24 za kitaifa ndani ya EU pekee zinatoa mwongozo wa kulazimisha ambao ni sawa kwa kanuni lakini tofauti katika mazoezi. Kile kinachoridhisha BfDI ya Ujerumani hakikupi uhakika wa kuridhisha CNIL ya Ufaransa, DPC ya Ireland, au AP ya Uholanzi. Kuweka kanuni maalum kwa sekta — HIPAA, PCI-DSS, NIS2, Sheria ya AI — kunaongeza mahitaji ambayo mara nyingi hayakubaliki na kila mmoja.
Matokeo yake si mfumo wa ufuatiliaji. Ni lengo linalohama lenye alama 48 tofauti.
Monster wa Karatasi: Makubaliano Ambayo Hakuna Anayesoma, Udhibiti Ambayo Hakuna Anayeithibitisha
Mashirika yanahifadhi makubaliano ya usindikaji wa data na mamia ya wasaidizi, Masharti ya Mkataba wa Kawaida yanayoenda hadi kurasa 30+ kwa kila uhusiano wa uhamisho, Rekodi za Shughuli za Usindikaji, DPIAs, TIAs, LIAs — kila moja inahitaji mchango wa kiufundi ambao timu nyingi za kisheria haziwezi kuthibitisha kwa uhuru. Katika mazoezi: mashirika yanatia saini kile wanachohitajika kusaini, kuwasilisha kile wanachohitajika kuwasilisha, na kutumaini kwamba ukweli wa kiufundi unalingana na maelezo ya mkataba. Monster wa karatasi inazalisha muonekano wa ufuatiliaji. Mara nyingi haizalishi kiini chake.
Ukosefu wa Kitaalamu: Zana Hazifanani na Wajibu
Utambuzi wa PII unaotegemea AI inayozalisha si wa kisheria. Hati ile ile iliyoshughulikiwa mara mbili inatoa matokeo tofauti. Kimsingi haiwezi kuendana na ufuatiliaji — ambapo unapaswa kuonyesha, kwa njia inayoweza kuonekana na kuthibitishwa, kwamba data maalum iligundulika na kushughulikiwa ipasavyo.
Microsoft Presidio, spaCy, Stanza — majukwaa ya uhandisi, si zana za ufuatiliaji. Kupeleka kwenye uzalishaji kunahitaji kuandika watambuzi maalum kwa kila aina ya kitu na lugha, kujenga mipango ya kabla/baada ya usindikaji, kuunganishwa na muundo wa hati, kudumisha kila kitu kadri kanuni zinavyoendelea. Kawaida ni masaa 30–80 ya muda wa uhandisi wa kitaalamu kabla ya hati moja kushughulikiwa. Mashirika mengi hayana utaalamu huo ndani.
Nambari ya mtu katika mkataba wa ajira wa Uswidi, Steuer-ID katika fomu ya ushuru ya Ujerumani, PESEL katika hati ya bima ya Poland, Codice Fiscale katika ankara ya Italia — kila moja inahitaji si tu utambuzi wa lugha bali pia utambuzi wa kitu kinachojulikana na aina ya hati. Mifano ya lugha iliyofundishwa hasa kwa Kiingereza inatoa kiwango cha kukosa PII cha 69% katika maandiko yasiyo ya Kiingereza. Sheria haina tofauti kwa lugha.
Microsoft Purview, AWS Macie, Google Cloud DLP — ghali, zinahitaji uunganisho wa wingu, zinawafunga mashirika. Kwa umuhimu zaidi: zote zina makao Marekani. Sheria ya CLOUD ya mwaka 2018 inawalazimisha kufichua data popote duniani kwa ombi halali la serikali ya Marekani. Sehemu ya FISA 702 inaruhusu ukusanyaji wa taarifa bila hati za mtu binafsi. Schrems II ilifuta Mkataba wa Faragha wa EU-Marekani kwa sababu hii. Mkataba wa kila mwaka wa fedha sita na mtoa huduma wa wingu wa Marekani hauzaliishi usindikaji wa data unaokidhi GDPR.
Tatizo la AI Lisilo na Udhibiti: Soko Halina Jibu
77% ya wafanyakazi wanashiriki taarifa nyeti za kazi na zana za AI angalau kila wiki. 34.8% ya maingizo yote ya zana za AI yana taarifa zinazostahili kuwa nyeti chini ya angalau mfumo mmoja wa faragha. Wafanyakazi wanatumia ChatGPT, Copilot, Claude, Gemini kuandika mikataba, kufupisha maelezo, kuchambua karatasi za kazi — mara kwa mara, kiotomatiki, bila ufahamu wa kile wanachopaste kwenye ombi.
Mifumo ya DLP ya jadi haiwezi kuelewa maudhui ya kisemantiki ya ombi la lugha ya asili. Haziwezi kutofautisha kati ya mhandisi anayemuuliza AI kuelezea mfano wa msimbo na mhandisi anayepaste hifadhidata ya uzalishaji yenye rekodi 50,000 kwenye dirisha lile lile. Mifano ya AI inashughulikia kila kitu. Hazitoi ulinzi, hakuna onyo, hakuna rekodi ya ukaguzi ambayo DPO anaweza kutegemea.
Kile kinachokosekana ni safu ya kiufundi inayofanya sera iweze kutekelezeka katika mazoezi. Safu hiyo haipo sokoni kwa bei yoyote ambayo shirika la kati linaweza kumudu, katika aina yoyote inayofanya kazi katika zana za AI ambazo wafanyakazi wanatumia. Hii ni moja ya pengo ambalo mfumo huu ulijengwa kuziba.
Pengos la Upatikanaji: Ufuatiliaji kama Privilege ya Kiwango
Mtaalamu mmoja, shirika la jamii, mamlaka ndogo ya umma, taasisi ya utafiti — kila mmoja anahusika na GDPR sawa, haki sawa ya kufuta, wajibu sawa wa taarifa za uvunjaji kama benki ya kimataifa — lakini bila timu ya kisheria, rasilimali za uhandisi, au bajeti ya programu ya biashara ya €500K kwa mwaka ili kutekeleza ipasavyo. Mfumo wa ufuatiliaji umewahudumia mashirika makubwa vya kutosha, ingawa kwa gharama kubwa. Umewahudumia wengine wote wenye jukumu na hakuna njia halisi ya kulifanikisha.
Majibu ya Mfumo — Jukwaa Moja, Maonyesho Mengi
Jukwaa la kivuli na kitovu kikuu cha ufikiaji. Utambuzi wa PII wa safu mbili za mseto (vitu 260+, lugha 48, mipangilio 121 ya ufuatiliaji) katika mifano yote ya uzalishaji — SaaS, wingu binafsi linalosimamiwa, na kujisimamia. Bidhaa zote zinazotokana zinashiriki injini ile ile ya utambuzi na kanuni ile ile ya msingi: nguvu mikononi mwa mtumiaji.
Toleo la biashara lililo na pengo la hewa. Vitu 390+, mifumo ya regex 317 maalum, usindikaji wa 100% bila mtandao, OCR ya picha katika lugha 37. Hakuna utegemezi wa wingu — data haitoki kwenye kifaa.
Jukwaa la PII la wingu la kwanza lenye ufikiaji mpana. Kiendelezi cha Chrome kwa kukamata AI kwa wakati halisi, MCP Server, Office Add-in, usimbaji wa kurudishwa. Bure hadi €29/kila mwezi — ufuatiliaji kwa kila bajeti.
Kwanza kwa Desktop, usindikaji wa ndani 100%. Presidio sidecar kwenye kifaa, aina 7 za hati + OCR, usindikaji wa kundi, hifadhi iliyosimbwa. Leseni ya kudumu ya mara moja — hakuna usajili, hakuna wingu, inafanya kazi bila mtandao baada ya kuanzishwa.
Jukwaa la maonyesho ya umma la papo hapo. Hakuna akaunti inayohitajika — paste maandiko, anonyma mara moja, ona injini ikifanya kazi. Njia ya haraka zaidi ya kujaribu kile mfumo unachofanya.
Jukwaa la Kivuli — SaaS · Wingu Binafsi · Kujisimamia · mifano 3 ya uzalishaji
- //Mashirika yanaripoti kuwa 67% ya wabunifu wamefunua kwa bahati mbaya siri katika msimbo — regex ya kisheria inakamatwa kile NLP inakosa na kinyume chake
- //Utambuzi wa AI wa jumla unapata kiwango cha kukosa cha 69% katika maandiko yasiyo ya Kiingereza — safu mbili na spaCy + XLM-RoBERTa inaziba pengo katika lugha zote 48
- //Kukosekana kwa uhariri kati ya timu ni ugunduzi wa kwanza wa ICO na DPA — mipangilio inatekeleza tabia sawa ya utambuzi kati ya kila mtumiaji, kila kikao
- //95% ya uvunjaji wa data wa 2024 unahusishwa na makosa ya kibinadamu — mipangilio ya pamoja inondoa maamuzi ya usanidi ya kila mtu ambayo yanaunda tofauti
- //Mifumo ya PII ya wauzaji wengi inaunda pengo la rekodi za ukaguzi — zaidi ya 60% ya mashirika yanayotumia zana 3+ za PII yanaripoti kushindwa kwa usawa kati ya zana
- //Kugawanyika kwa muundo: mashirika yanashughulikia PDF, DOCX, XLSX, CSV, JSON kwa wakati mmoja — kila muundo hapo awali ulihitaji mbinu tofauti, zana tofauti, rekodi tofauti za ukaguzi
- //Zana za PII za biashara zinagharimu $50,000–$500,000/kila mwaka — mashirika yenye vizuizi vya gharama kwa kawaida hayakuwa na chaguo lolote
- //Sheria ya CLOUD + Sehemu ya FISA 702 inamaanisha usindikaji wa "GDPR-unaokidhi" ulio na makao Marekani ni hadithi ya mkataba — ukaribu wa EU pekee unondoa hatari hii kabisa
Biashara ya Air-Gapped — Vitu 390+ · Regex 317 Maalum · 100% Bila Mtandao · OCR ya Picha
- //PII maalum ya tasnia — nambari za vitu vya nyuklia, nambari za huduma za kijeshi, ID za ndani za miliki — hazijafunikwa na zana yoyote ya kibiashara; watambuzi maalum wanahitaji wiki za uhandisi wa kitaalamu katika Presidio mbichi
- //Ukosefu wa kufunika ni dari ya utambuzi: hakuna zana ya jumla inayoandika aina zote za PII, lugha zote, muundo wote — mifumo 317 iliyochaguliwa inaziba pengo ambayo mifumo ya nje inakosa
- //Paradox ya muuzaji: ili kulinda PII lazima ugawane nayo na muuzaji. Usindikaji wa wingu unahitaji kuamini mchakato — kinyume na usanifu kwa mashirika yanayoshughulikia data nyeti zaidi
- //Mazingira ya hewa ya pengo (ulinzi, akili, miundombinu muhimu, maabara za utafiti) hayawezi kutumia zana zinazotegemea wingu kwa bei yoyote — kufanya kazi bila mtandao kunondoa kizuizi cha usanifu kabisa
- //Microsoft Purview hawezi skana JPEG/PNG — PII ya maandiko katika picha za skrini haionekani kabisa kwenye mfumo wa DLP wa biashara kwa muundo
- //Malware ya SparkCat (iOS/Android, Desemba 2025) ilitumia OCR kuiba maneno ya urejeleaji wa pochi za crypto kutoka kwa picha za skrini — PII ya maandiko inayotegemea picha ni lengo la shambulio hai, si hatari ya nadharia
- //Kuongezeka kwa 300% kwa uvunjaji wa data wa msingi wa wingu kati ya 2022 na 2024 — zero-knowledge inamaanisha uvunjaji wa seva zetu haufunui chochote, kwa sababu hakuna kinachohifadhiwa
- //ISO 27001:2022 imethibitishwa kwa ukaguzi wa mara kwa mara wa pentesting wa safu nzima — hali ya usalama ambayo ununuzi wa kudhibitiwa unahitaji inandikwa, kuthibitishwa, na kukaguliwa kwa uhuru
Jukwaa la PII la Wingu — Bure hadi €29/ mwezi · Kiendelezi cha Chrome · MCP Server · Office Add-in
- //8.5% ya maombi yote ya LLM yana PII — kukamata kwa wakati halisi kabla ya kuwasilisha ndiyo njia pekee inayofanya kazi; kugundua baada ya ukweli kunakosa dirisha pekee linalohusika
- //DLP za jadi huwaka baada ya data kuondoka kwenye shirika — Kiendelezi cha Chrome kinakamata wakati wa kuingiza, kabla ya mfano wowote kupokea au kushughulikia maudhui nyeti
- //Utambuzi wa AI inayozalisha si wa kisheria — hati ile ile inatoa matokeo tofauti kwenye mbio tofauti; hakuna mfumo wa kihesabu unaweza kuwa msingi wa ulinzi wa kisheria
- //Presidio pekee inakosa vitu vinavyotegemea muktadha; XLM-RoBERTa pekee inatoa matokeo ya uwongo katika lugha rasmi ya kisheria — safu ya tatu ya uainishaji wa msimamo inondoa matokeo ya uwongo ambayo yanawafanya timu za ufuatiliaji kutokuwa na imani na zana za kiotomatiki
- //Utafutaji wa kisheria, maombi ya ufikiaji wa rekodi za matibabu, ukaguzi wa kisheria — data iliyofichwa wakati mwingine inahitaji kufichuliwa na chama kilichoorodheshwa na ni lazima na wao pekee; mbinu zisizoweza kurudishwa zinafanya hii kuwa haiwezekani
- //Funguo ya kikao ya mtumiaji haitoki kwenye kifaa chao — si seva zetu, si wingu lolote, si msaidizi yeyote. Haki ya kurudisha uanonymization inamhusu mtumiaji, si sisi.
- //Mtaalamu mmoja anakabiliwa na wajibu sawa wa GDPR wa kufuta kama benki ya kimataifa — lakini bila idara ya ufuatiliaji au bajeti ya programu ya biashara ya €500K kwa mwaka
- //Mashirika 764 ya EU yanachunguzwa kwa wakati mmoja kwa kushindwa kwa haki ya kufuta — si kwa sababu walikusudia kukiuka; kwa sababu zana za kufuata ziliwekwa bei zaidi ya uwezo wao
Kwanza kwa Desktop · Usindikaji wa Ndani 100% · Aina 7 za Hati + OCR · Leseni ya Mara Moja
- //Kuongezeka kwa 300% kwa uvunjaji wa data wa msingi wa wingu kati ya 2022 na 2024 — data ambayo haitoki wingu haiwezi kufichuliwa katika uvunjaji wa wingu
- //Sheria ya CLOUD + FISA inafanya usindikaji wa makao Marekani kuwa na mashaka kisheria kwa mashirika ya EU — usindikaji wa ndani unondoa tatizo lote la uhamisho wa mipaka kwa kuhakikisha hakuna uhamisho unafanyika
- //Kugawanyika kwa muundo kunalazimisha mashirika kudumisha zana nyingi — kila zana inaunda sera tofauti ya utambuzi, rekodi tofauti za ukaguzi, njia tofauti za kushindwa
- //Faili za kumbukumbu ni uso wa PII ulioachwa nyuma — wabunifu wanazingatia hifadhidata lakini kumbukumbu zina vywambo vya API, vitambulisho vya watumiaji, anwani za IP; CSV na JSON zinasaidiwa kwa asili pamoja na hati zilizo na muundo
- //Mazingira ya uzalishaji yaliyo na pengo — sakafu za utengenezaji, vituo vya serikali vilivyo na usalama, maabara za utafiti — hayawezi kuvumilia ukaguzi wa leseni unaohitaji ufikiaji wa mtandao; kuanzishwa mara moja kisha kufanya kazi bila mtandao ni usanifu pekee unaofaa
- //Leseni za kudumu bila utegemezi wa SaaS: mtumiaji anamiliki usakinishaji wao; kufutwa kwa usajili wa muuzaji hakuwezi kuzima zana katika wakati muhimu wa usindikaji
- //Mifumo ya dbt pipeline inaharibu sera za kuficha kwenye data ya CSV/JSON — EDPB 2024 inafafanua hii inakiuka GDPR Art. 5(1)(a); hifadhi ya vault yenye historia iliyosimbwa inamaanisha kila faili iliyoshughulikiwa ina rekodi inayoweza kukaguliwa, inayoweza kurejeshwa
- //Mashirika yanayosindika maelfu ya hati za zamani kwa ufuatiliaji wa haki ya kufuta ya GDPR yanahitaji uwezo wa kundi — si kikomo cha faili 5 kwa siku cha SaaS ambacho kinaufanya kazi kuwa haiwezekani
Kiwango cha Tatizo
Hizi si kushindwa kwa nje. Ni matokeo ya mfumo wa ufuatiliaji ambao umepitiliza miundombinu yake.