הצהרת המייסד
למה יזמתי את האקוסיסטם הזה — אמונה מקצועית לאחר 28 שנים
הנתונים שלך. המפתחות שלך. הכללים שלך.
כל מוצר באקוסיסטם הזה בנוי על מחויבות ארכיטקטונית אחת: הנתונים שלך, המפתחות שלך, השליטה שלך. הסיסמה שלך לעולם לא עוזבת את המכשיר שלך. המסמכים שלך לעולם לא נשמרים. מפתח ההצפנה שלך הוא שלך בלבד. שום חוק ענן אמריקאי, שום זימון ספק, שום סוכן נתונים — לא יכול להגיע למה שמעולם לא שותף.
רקע
במשך 28 שנים עבדתי בצומת של טכנולוגיה, אבטחה וציות ארגוני. הקמתי את curta.solutions בשנת 1998. מאז שירתתי ארגונים מפוקחים ב-26 מדינות — בשירותים פיננסיים, בריאות, משפטים, ממשלה, ייצור וטכנולוגיה — כשותף שלהם בארכיטקטורת IT, אבטחה, טרנספורמציה דיגיטלית וציות.
מה שצפיתי במשך 28 שנים אינו אבולוציה איטית. זו משבר בהילוך איטי — כזה שהגיע לנקודת שבר עם הגעת ה-AI הגנרטיבי וההפצה הגלובלית של רגולציות פרטיות חופפות.
האמונה שלי
אני מאמין שלכל אדם, ארגון ומוסד יש את הזכות לשתף מידע באופן סלקטיבי — לגלות לרגולטור רק מה שהרגולטור זכאי לראות, לשתף פעולה עם שותף רק על נתונים שהוסמכו במפורש, להשתתף בחיים מסחריים וציבוריים מבלי לוותר על מה שצריך להישאר פרטי.
אני מאמין שהזכות הזו חייבת להיות ניתנת למימוש מעשי על ידי כולם — לא רק על ידי ארגונים עם מחלקות ציות ותקציבי תוכנה ארגוניים. פרטיות לא יכולה להיות זכות של גודל.
אני מאמין שבעולם שבו החוק האמריקאי יכול להגיע לכל נתון שמוחזק על ידי כל חברה אמריקאית בכל מקום על פני כדור הארץ, ובו 77% מהעובדים מזינים נתונים רגישים לכלים של AI שאינם בשליטתם, הארכיטקטורה היחידה שיכולה לספק הבטחת פרטיות משמעותית היא כזו שבה הנתונים לעולם לא עוזבים את שליטת המשתמש מלכתחילה. לא הבטחות חוזיות. לא מדיניות פרטיות. ארכיטקטורה טכנית.
אימות אפס ידע. עיבוד מקומי קודם. הצפנה הפיכה שבה המפתח שייך למשתמש. פעולה לא מקוונת. תחום שיפוט של האיחוד האירופי, ללא יוצאים מן הכלל. אלו אינן תכונות מוצר. אלו הסטנדרט המינימלי לכל כלי שטוען להגן על נתונים אישיים.
ואני מאמין ש-28 שנים של עבודה בתוך הארגונים שמטפלים במידע הרגיש ביותר בעולם — 28 שנים של צפייה בפער בין הכוונה הרגולטורית למציאות הטכנית מתרחב — נתנו לי גם את ההבנה וגם את האחריות ליוזם את מה שהאקוסיסטם עדיין חסר. להגדיר את החזון, להרכיב את הצוות הנכון, ולהבטיח שזה יבנה לפי הסטנדרט שהבעיה דורשת.
הזכות לאנונימיזציה של מידע אישי אינה תכונה טכנית. זו זכות יסוד. וזכות שאינה ניתנת למימוש מעשי אינה זכות כלל.
הבעיות שצפיתי
פיצול רגולטורי: יותר מדי כללים, אין שפה משותפת
ארגון בינוני הפועל ברחבי העולם חייב לנווט במקביל בין 48+ חוקים לאומיים ואזוריים בתחום הפרטיות — GDPR, UK GDPR, CCPA, LGPD, PDPA, PIPL, DPDPA, APPI, PIPEDA ועשרות נוספים. 24 DPAs לאומיים באיחוד האירופי בלבד מספקים הנחיות מחייבות שהן עקביות בעקרון אך שונות במעשה. מה שמספק ה-BfDI הגרמני לא מספק אוטומטית את ה-CNIL הצרפתי, ה-DPC האירי או ה-AP ההולנדי. שכבות ספציפיות לתחום — HIPAA, PCI-DSS, NIS2, חוק ה-AI — מוסיפות דרישות שלעיתים נדירות מתואמות זו עם זו.
התוצאה אינה מסגרת ציות. זהו מטרה נעה עם 48 מטרה שונות.
המפלצת של הנייר: הסכמים שאף אחד לא קורא, בקרות שאף אחד לא מאמת
ארגונים שומרים על הסכמי עיבוד נתונים עם מאות תתי-ספקים, סעיפים חוזיים סטנדרטיים המגיעים ל-30+ עמודים לכל מערכת יחסים, רישומים של פעולות עיבוד, DPIAs, TIAs, LIAs — כל אחד מהם דורש קלט טכני שרוב הצוותים המשפטיים אינם יכולים לאמת באופן עצמאי. בפועל: ארגונים חותמים על מה שהם חייבים לחתום, מגישים מה שהם חייבים להגיש, ומקווים שהמציאות הטכנית תואמת את התיאור החוזי. המפלצת של הנייר יוצרת את המראה של ציות. היא לעיתים רחוקות יוצרת את התוכן שלו.
חוסר התאמה טכנית: הכלים אינם תואמים את החובה
זיהוי PII מבוסס AI גנרטיבי הוא לא דטרמיניסטי. אותו מסמך מעובד פעמיים מייצר תוצאות שונות. באופן בסיסי אינו תואם לציות — שם עליך להדגים, באופן שחוזר על עצמו וניתן לאימות, כי נתונים ספציפיים זוהו וטופלו כראוי.
Microsoft Presidio, spaCy, Stanza — פלטפורמות הנדסה, לא כלים לציות. פריסה לייצור דורשת כתיבת מזהים מותאמים אישית לכל סוג ישות ושפה, בניית צינורות עיבוד מקדימים/מאוחרים, אינטגרציה עם פורמטי מסמכים, תחזוקה של הכל כאשר הרגולציות מתפתחות. בדרך כלל 30–80 שעות של זמן הנדסה מיוחד לפני שמסמך אחד מעובד. רוב הארגונים אינם מחזיקים במומחיות הזו בבית.
מספר אישי בשטר עבודה שוודי, Steuer-ID בטופס מס גרמני, PESEL במסמך ביטוח פולני, Codice Fiscale בחשבונית איטלקית — כל אחד מהם דורש לא רק זיהוי שפה אלא גם זיהוי ישות מודע לסוג המסמך. מודלים לשוניים שאומנו בעיקר על אנגלית מייצרים שיעור החמצה של 69% ב-PII בטקסטים שאינם באנגלית. החוק אינו עושה הבחנה לפי שפה.
Microsoft Purview, AWS Macie, Google Cloud DLP — יקרים, דורשים חיבור לענן, נועלים את הארגונים. יותר קריטי: כולם ממוקמים בארצות הברית. חוק CLOUD של 2018 מחייב אותם לחשוף נתונים בכל מקום בעולם על פי בקשה חוקית של ממשלת ארצות הברית. סעיף 702 של FISA מאפשר איסוף מודיעין ללא צווים אישיים. Schrems II פסל את מגן הפרטיות של האיחוד האירופי-ארצות הברית בדיוק מסיבה זו. חוזה שנתי של שישה ספרות עם ספק ענן אמריקאי אינו מייצר עיבוד נתונים תואם ל-GDPR.
בעיית ה-AI הבלתי נשלט: לשוק אין תשובה
77% מהעובדים משתפים מידע רגיש בעבודה עם כלים של AI לפחות אחת לשבוע. 34.8% מכלל הקלטים של כלים של AI מכילים מידע העונה על הגדרה של רגישות תחת לפחות מסגרת פרטיות אחת. עובדים משתמשים ב-ChatGPT, Copilot, Claude, Gemini כדי לנסח חוזים, לסכם הערות, לנתח גיליונות אלקטרוניים — באופן קבוע, אוטומטית, מבלי להיות מודעים למה שהם מדביקים לתוך הפקודה.
מערכות DLP מסורתיות אינן יכולות להבין את התוכן הסמנטי של פקודת שפה טבעית. הן אינן יכולות להבחין בין מפתח שמבקש מ-AI להסביר דפוס קוד לבין מפתח שמדביק מסד נתונים של 50,000 רשומות לתוך אותו חלון. מודלי ה-AI מעבדים הכל. הם לא מציעים שום הגנה, שום אזהרות, שום רישום ביקורת שעליו DPO יכול להסתמך.
מה שחסר הוא השכבה הטכנית שהופכת מדיניות לאכיפה בפועל. שכבה זו אינה קיימת בשוק בכל מחיר שארגון בינוני יכול להרשות לעצמו, בכל צורה שעובדת עם הכלים של AI שעובדים בפועל. זה אחד מהפערים שלשמו נבנה האקוסיסטם הזה.
פער הנגישות: ציות כזכות של גודל
עורך דין עצמאי, ארגון קהילתי, רשות ציבורית קטנה, מוסד מחקר — כל אחד מהם כפוף לאותו GDPR, לאותו זכות למחיקה, לאותה חובת דיווח על הפרות כמו בנק גלובלי — אך ללא צוות משפטי, משאבי הנדסה, או תקציב תוכנה ארגוני של €500K בשנה כדי ליישם אותם כראוי. האקוסיסטם של הציות שירת ארגונים גדולים באופן מספק, אם כי יקר. הוא שירת את כולם עם מנדט וללא אמצעים מעשיים לספק אותו.
תגובה של האקוסיסטם — פלטפורמה אחת, ביטויים מרובים
הפלטפורמה הגג ונקודת הגישה הראשית. זיהוי PII היברידי דו-שכבתי (260+ ישויות, 48 שפות, 121 הגדרות ציות) בכל מודלי הפריסה — SaaS, ענן פרטי מנוהל, ומנוהל עצמי. כל המוצרים הנגזרים חולקים את אותו מנוע זיהוי ואת אותו עיקרון יסוד: כוח בידיים של המשתמש.
מהדורה עסקית מנותקת. 390+ ישויות, 317 תבניות regex מותאמות אישית, עיבוד לא מקוון 100%, OCR לתמונות ב-37 שפות. אין תלות בענן — הנתונים לעולם לא עוזבים את המכשיר.
פלטפורמת PII ראשונה בענן עם הגישה הרחבה ביותר. תוסף Chrome להפרעה בזמן אמת של AI, שרת MCP, תוסף Office, הצפנה הפיכה. חינם עד €29/חודש — ציות לכל תקציב.
ראשון בשולחן העבודה, מקומי לחלוטין. צד של Presidio במכשיר, 7 פורמטי מסמך + OCR, עיבוד באצווה, כספת מוצפנת. רישיון קבוע חד פעמי — ללא מנויים, ללא ענן, לחלוטין לא מקוון לאחר הפעלה.
פלטפורמת הדגמה ציבורית מיידית. אין צורך בחשבון — הדבק טקסט, אנונימיזציה מידית, ראה את המנוע בפעולה. הדרך המהירה ביותר לחוות מה עושה האקוסיסטם.
פלטפורמת גג — SaaS · פרטי מנוהל · מנוהל עצמי · 3 מודלי פריסה
- //ארגונים מדווחים ש-67% מהמפתחים חשפו בטעות סודות בקוד — regex דטרמיניסטי תופס מה ש-NLP מפסיד ולהפך
- //זיהוי AI כללי משיג שיעור החמצה של 69% בטקסטים שאינם באנגלית — דו-שכבתי עם spaCy + XLM-RoBERTa סוגר את הפער בכל 48 השפות
- //הסרת מידע לא עקבית בין צוותים היא הממצא המוזכר ביותר בבדיקות ICO ו-DPA — הגדרות מחייבות אכיפת התנהגות זיהוי זהה בין כל משתמש, כל מפגש
- //95% מההפרות של נתונים בשנת 2024 קשורות לשגיאות אנוש — הגדרות משותפות מבטלות את החלטות הקונפיגורציה האישיות שגורמות לשונות
- //ערימות PII מרובות ספקים יוצרות פערי רישום ביקורת — 60%+ מהארגונים המשתמשים ב-3+ כלים ל-PII מדווחים על כישלונות התאמה בין הכלים
- //פיצול פורמטים: ארגונים מעבדים PDF, DOCX, XLSX, CSV, JSON במקביל — כל פורמט דרש בעבר גישה נפרדת, כלי נפרד, רישום ביקורת נפרד
- //כלים ל-PII בארגונים עולים $50,000–$500,000 בשנה — ארגונים עם מגבלות עלויות לא היו להם היסטורית שום אפשרות בכלל
- //חוק CLOUD + סעיף 702 של FISA משמעותם שעיבוד "תואם ל-GDPR" הממוקם בארצות הברית הוא פיקציה חוזית — אירוח רק באיחוד האירופי מסיר לחלוטין את החשיפה הזו
עסקי מנותק — 390+ ישויות · 317 regex מותאמות אישית · 100% לא מקוון · OCR לתמונות
- //PII ספציפי לתעשייה — קודי מתקני גרעין, מספרי שירות צבאי, מזהים פנימיים קנייניים — לא מכוסים על ידי שום כלי מסחרי; מזהים מותאמים דורשים שבועות של הנדסה מיוחדת ב-Presidio גולמי
- //חוסר שלמות הכיסוי הוא תקרת הזיהוי: שום כלי כללי אינו מכסה את כל סוגי ה-PII, את כל השפות, את כל הפורמטים — 317 תבניות שנבחרו סוגרות את הפערים ש-frameworks מוכנים לא מצליחים
- //הפרדוקס של הספק: כדי להגן על PII אתה חייב לשתף אותו עם ספק. עיבוד בענן דורש אמון במעבד — סתירה ארכיטקטונית עבור ארגונים המטפלים בנתונים הרגישים ביותר
- //סביבות מנותקות (הגנה, מודיעין, תשתיות קריטיות, מעבדות מחקר) אינן יכולות להשתמש בכלים התלויים בענן בכל מחיר — מקומי קודם מסיר לחלוטין את המחסום הארכיטקטוני
- //Microsoft Purview לא יכולה לסרוק JPEG/PNG — טקסט PII בתמונות מסך הוא לחלוטין בלתי נראה לערמת DLP של הארגון על פי העיצוב
- //נוזקת SparkCat (iOS/Android, דצמבר 2025) השתמשה ב-OCR כדי לגנוב ביטויי שחזור ארנק קריפטו מתמונות מסך — טקסט PII מבוסס תמונה הוא יעד התקפה פעיל, לא סיכון תיאורטי
- //עלייה של 300% בהפרות נתונים מבוססות ענן בין 2022 ל-2024 — אפס ידע משמעותו שהפרת השרתים שלנו אינה חושפת דבר, כי שום דבר לא נשמר
- //מאושר ISO 27001:2022 עם בדיקות חדירה מלאות סדירות — עמדת האבטחה שהרכישה המפוקחת דורשת מתועדת, מאומתת ומבוקרת באופן עצמאי
פלטפורמת PII בענן — חינם עד €29/חודש · תוסף Chrome · שרת MCP · תוסף Office
- //8.5% מכלל הפקודות של LLM מכילות PII — הפרעה בזמן אמת לפני ההגשה היא המניעה היחידה שעובדת; זיהוי לאחר מעשה מפסיד את החלון היחיד שחשוב
- //DLP מסורתית פועלת לאחר שהנתונים עזבו את הארגון — תוסף Chrome מפריע בנקודת הקלט, לפני שכל מודל מקבל או מעבד תוכן רגיש
- //זיהוי AI גנרטיבי הוא לא דטרמיניסטי — אותו מסמך מייצר תוצאות שונות בריצות שונות; שום מערכת הסתברותית לא יכולה לשמש כבסיס להגנה רגולטורית
- //Presidio לבדו מפסיד ישויות תלויות הקשר; XLM-RoBERTa לבדו מייצר חיוביות שקריות בשפה משפטית פורמלית — שכבת סיווג שלישית מסלקת את החיוביות השקריות שמביאות צוותי ציות לא לאמון בכלים אוטומטיים
- //גילוי משפטי, בקשות גישה לרשומות רפואיות, ביקורת רגולטורית — נתונים אנונימיים חייבים לעיתים להיות מפוענחים על ידי הצד המוסמך ורק על ידו; שיטות בלתי הפיכות מקשות על כך
- //מפתח המושב של המשתמש לעולם לא עוזב את המכשיר שלו — לא השרתים שלנו, לא שום ענן, לא שום תת-ספק. הזכות להפוך אנונימיזציה שייכת למשתמש, לא לנו.
- //עורך דין עצמאי מתמודד עם אותה חובת מחיקה לפי GDPR כמו בנק גלובלי — אך ללא מחלקת ציות או תקציב תוכנה ארגוני של €500K בשנה
- //764 ארגונים באיחוד האירופי נמצאים במקביל תחת חקירה על כישלונות במחיקת נתונים — לא כי הם התכוונו להפר; אלא כי הכלים לציות היו במחירים שמעבר להישג ידם
ראשון בשולחן העבודה · עיבוד מקומי 100% · 7 פורמטי מסמך + OCR · רישיון חד פעמי
- //עלייה של 300% בהפרות נתונים מבוססות ענן בין 2022 ל-2024 — נתונים שמעולם לא נכנסים לענן לא יכולים להיות חשופים בהפרת ענן
- //חוק CLOUD + FISA הופכים את העיבוד הממוקם בארצות הברית לא ברור מבחינה חוקית עבור ארגונים באיחוד האירופי — עיבוד מקומי מסיר לחלוטין את בעיית ההעברה הבין-גבול על ידי הבטחת שאין העברה מתרחשת
- //פיצול פורמטים מאלץ ארגונים לשמור על כלים מרובים — כל כלי יוצר מדיניות זיהוי נפרדת, רישום ביקורת נפרד, מצב כישלון נפרד
- //קבצי יומן הם שטח ה-PII המוזנח — מפתחים מתמקדים במסדי נתונים אך יומנים מכילים מפתחות API, מזהי משתמשים, כתובות IP; CSV ו-JSON נתמכים באופן מקורי לצד מסמכים מובנים
- //סביבות ייצור מנותקות — מפעלי ייצור, מתקני ממשלה מאובטחים, מעבדות מחקר — לא יכולות לסבול בדיקת רישיון שדורשת גישה לרשת; הפעלה חד פעמית ולאחר מכן פעולה לא מקוונת לחלוטין היא הארכיטקטורה היחידה האפשרית
- //רישיונות קבועים ללא תלות חוזית חוזרת: המשתמש מחזיק בהתקנה שלו; ביטול מנוי של ספק לא יכול להשבית כלי ברגע קריטי של עיבוד
- //שחזור צינור dbt הורס מדיניות הסתרה על נתוני CSV/JSON — EDPB 2024 מבהיר שזה מפר את GDPR Art. 5(1)(a); אחסון בכספת עם היסטוריה מוצפנת פירושו שכל קובץ מעובד יש לו רישום שניתן לבדוק, שניתן לשחזר
- //ארגונים המעבדים אלפי מסמכים ישנים לציות למחיקת נתונים לפי GDPR זקוקים ליכולת באצווה — לא מגבלה של 5 קבצים ביום של SaaS שעושה את המשימה בלתי אפשרית מבחינה תפעולית
היקף הבעיה
אלו אינן כישלונות חריגים. אלו תוצאות מערכתיות של סביבה צייתנית שעברה על פני התשתית שלה.