מניעת PII בזמן אמת: עצירת דליפות נתוני AI לפני שהן קורות
עודכן ל-2026.
במרץ 2023, מהנדס של Samsung הדביק קוד מקור ב-ChatGPT. הקוד עזב את שליטת Samsung באותו רגע. אף כלי לא תפס זאת בזמן. בקרות אבטחה שלאחר-הצידה אינן יכולות לעצור דליפות נתוני AI. אירוע יחיד זה הוכיח זאת.
כלי זיהוי מספרים לך מה קרה לאחר מעשה. בדיקות יומנים, DLP של נקודות קצה ויומני ביקורת פועלים כולם בדרך זו. עבור דליפות AI, לאחר מעשה פירושו מאוחר מדי. הנתונים כבר הגיעו למודל ה-AI.
היקף הבעיה
מחקר Cyberhaven 2025 בחן כיצד חברות משתמשות ב-AI. הממצאים היו מדאיגים.
- 11% מכל הפנקסים של ChatGPT מכילים נתונים פרטיים או רגישים.
- עובד ממוצע משתמש בכלי AI 14 פעמים ביום.
- עובדים בשימוש אינטנסיבי מתקשרים 30 עד 50 פעמים ביום.
- ב-11%, פירוש הדבר הוא 3 עד 5 שליחות רגישות לעובד ביום.
בחברה עם 500 עובדים בשימוש אינטנסיבי, זה מצטבר ליותר מ-2,000 שליחות רגישות ביום. כל אחת יכולה להיות הפרה לפי סעיף 83 ל-GDPR. הסיכון אינו רק משפטי. אמון ומוניטין נמצאים גם הם בסכנה.
סוגים נפוצים של תוכן רגיש בפנקסי AI כוללים את הבאים.
- שמות לקוחות ופרטי התקשרות.
- מספרי חשבון ורשומות תשלום.
- הערות רפואיות מעובדי בריאות.
- פרטי תיק מעורכי דין.
- הערות הערכת עובדים מצוותי משאבי אנוש.
- תחזיות הכנסה או מכירות פנימיות.
המחקר אינו מבחין בין שיתוף מכוון לבין שיתוף אקראי. שניהם יוצרים אותו סיכון משפטי. עובד ששוכח להסיר שם לקוח גורם לאותה הפרה כמו אחד שמתעלם מהכלל. הכוונה אינה משנה את התוצאה.
מדוע הזיהוי אינו מספיק
בדיקות רשת אינן יכולות לקרוא תעבורת HTTPS ללא חסימת TLS. חסימת TLS מוסיפה עומס ומעלה חששות פרטיות. דפדפנים מודרניים לעיתים קרובות דוחים אותה.
סוכני DLP של נקודות קצה צופים בקלחת הלוח ובהקלדת מקשים. אך יש להם השהיה. עד שסוכן מסמן דפוס, הפנקס עשוי כבר להישלח.
יומני ביקורת ספקים מתעדים מה שותף לאחר שכבר שותף. הם מסייעים בתגובה. הם אינם עוצרים דליפות.
הדרכת צוות היא מדיניות, לא בקרה. מחקר Cyberhaven מראה ש-11% מהפנקסים עדיין מכילים תוכן רגיש בחברות עם מדיניות ברורה. הדרכה אינה עוצרת שיתוף מקרי או מחדלים באמצע משימה.
חסימת כלי AI מסירה את יתרונות הפלט. עובדים אז משתמשים במכשירים אישיים או חשבונות. זה מציב עבודה מחוץ לכל פיקוח.
אף אחת מהשיטות הללו אינה עוצרת תוכן רגיש מלהגיע למערכות AI בזמן אמת.
מניעה בנקודת הכניסה
ההגנה הבטוחה היחידה היא מיסוך לפני שהפנקס נשלח. שם לקוח שהוחלף ב-[PERSON_1] לפני שהוא עוזב את הדפדפן לעולם אינו נראה על ידי מודל ה-AI.
כך עובד מיסוך מוטבע.
- עובד מקליד אימייל לקוח ב-Claude או ChatGPT.
- תוסף הדפדפן מזהה נתונים אישיים בזמן אמת.
- ישויות מסומנות עם תוויות סוג: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
- העובד בוחן את הפריטים המסומנים.
- לחיצה אחת מחליפה את כל הישויות באסימונים.
- הפנקס המוסווה נשלח.
ה-AI מקבל פנקס כזה: "הלקוח [PERSON_1] בכתובת [EMAIL_1] מחזיק בחשבון [ACCOUNT_1]."
ה-AI מטפל בבקשה. הוא לעולם אינו רואה שמות או מספרים אמיתיים. העובד מכיר את הלקוח בפועל מההקשר.
גישה זו מביאה יתרונות ברורים.
- נתונים אישיים נשארים מחוץ למערכות AI חיצוניות.
- פרטי לקוחות אינם מתווספים לסטים האימון של ה-AI.
- עובדים שומרים על גישה לכלי AI. הפלט נשאר גבוה.
היא אינה עוצרת שיתוף מכוון אם עובד עוקף את הכלי. העלאות קבצים צריכות תהליך עבודה נפרד. אין בקרה מושלמת. אך מיסוך מוטבע מסיר את הקבוצה המקרית. קבוצה זו מהווה את רוב האירועים. התוצאה היא ירידה גדולה בסיכון ללא שינוי בתהליך העבודה היומיומי.
מחקר מקרה: משרד עורכי דין
צוות של משרד עורכי דין השתמש ב-Claude לניסוח הערות חוזה. שיטתם: העתקת קטעי חוזה, הדבקה ב-Claude, בקשת סיכום.
לפני השימוש בתוסף Chrome — 6 חודשים ראשונים:
- 3 אירועי נתוני לקוחות שנמצאו במהלך הסקירה.
- כל אירוע: שם לקוח בנוסף למספר עניין הופיעו בפנקס.
- כל 3 היו מקריים.
לאחר השימוש בתוסף Chrome — 6 חודשים הבאים:
- אפס אירועי נתוני לקוחות.
- הצוות קיבל התראות בזמן אמת בעת הדבקת קטעים עם שמות לקוחות.
- לחיצה אחת החליפה את "Johnson Controls Matter 2024-0347" ב-"[PERSON_1] Matter [REFERENCE_1]."
- השיטה נשארה זהה.
השותף המנהל אמר: "הצוות שלנו ידע את המדיניות לפני התוסף. התוסף הפך את הציות לנתיב הקל."
ראו כיצד חברות אחרות התמודדו עם זה במחקרי מקרה שלנו. סקרו בקרות בסקירת האבטחה.
רשומות GDPR לצוותי ציות
חברות המשתמשות במיסוך AI מבוסס-דפדפן חייבות לתעד אותו כבקרה טכנית.
רשומות עיבוד (ROPA): ציינו שפנקסי AI עוברים מיסוך בצד הלקוח לפני שמגיעים לספקים. ציינו את סוגי הישויות, גרסת המנוע ויומני פריסה כהוכחה.
הסכמי מעבד נתונים: כאשר אין נתונים אישיים שמגיעים לספק ה-AI, חובות DPA פשוטות. הנתונים האישיים שאתם מחזיקים לעולם אינם עוזבים את המערכת שלכם.
יומני ביקורת: יומני התוסף לוכדים ספירת ישויות לפי הפעלה, שיעור מיסוך וסוגי ישויות לפי נפח. מדדים אלה מזינים דוחות ציות.
סקרו כללי GDPR לכלי AI במדריך הציות המשפטי ומילון המונחים שלנו. שאלות נפוצות נמצאות בשאלות נפוצות שלנו.
סיכום
אירוע Samsung הראה שדליפות AI קורות מהר יותר מכפי שכל בקרה שלאחר-הצידה יכולה לפעול. מחקר Cyberhaven כימת זאת: 11% מהפנקסים, פעמים רבות לכל עובד, כל יום.
מיסוך בזמן אמת לפני השליחה מתקן את הסיבה השורשית. כאשר נתונים אישיים לעולם אינם מגיעים ל-AI, אין מה לזהות, לרשום ביומן או לנקות. עובדים שומרים על כלי ה-AI שלהם. חברות שומרות על מעמד הציות שלהן.
זיהוי מספר לך מתי המניעה נכשלה. עבור דליפות נתוני AI, עלות הכישלון — קנסות, פגיעה במוניטין, אובדן אמון — מצדיקה מניעה ראשונה.
חקרו תמחור עבור החברה שלכם. קראו את הצהרת המייסד שלנו על הסיבה שמניעה-ראשונה היא עיקרון העיצוב המרכזי שלנו.
מקורות
- Cyberhaven: מחקר חשיפת נתוני AI 2025 — cyberhaven.com.
- הפרת נתוני Samsung ChatGPT, מרץ 2023 — Bloomberg.
- GDPR סעיפים 4 ו-32: נתונים אישיים ואמצעים טכניים — gdpr-info.eu.