By · Last updated 2026-06-05

חזרה לבלוגGDPR ועמידה

מינימיזציית נתונים GDPR: ממשק API בזמן אמת

GDPR סעיף 5(1)(ג) דורש איסוף רק של הנתונים הנחוצים. שילוב ממשק API בזמן אמת מונע איסוף-יתר בשלב הגשת הטופס — לפני שהנתונים נכנסים למסד הנתונים.

June 5, 20267 דקות קריאה
GDPR data minimizationArticle 5real-time detectionAPI integrationform validation

מינימיזציית נתונים GDPR: ממשק API בזמן אמת

עודכן ל-2026

GDPR סעיף 5(1)(ג) קובע: אספו רק מה שאתם צריכים. זהו כלל מינימיזציית הנתונים. רוב הצוותים מפרים אותו דרך עיצוב טפסים, לא מתוך כוונה רעה. שדות טקסט חופשי מושכים שמות, כתובות ומספרי זיהוי שאיש לא תכנן עליהם.

ניקוי מסד הנתונים מאוחר יותר אינו מתקן זאת. ההפרה התרחשה כאשר אספתם את הנתונים. עצירתה במקור היא התיקון האמיתי היחיד. בדיקת ממשק API בזמן אמת בעת הגשת טופס עוצרת איסוף-יתר לפני שהוא מתחיל.

ראו את סקירת הציות ושיטות האבטחה שלנו לאופן שבו אנו תומכים ב-GDPR סעיף 5.

מדוע טפסים אוספים-יתר

שדות טקסט חופשי באפליקציות אינטרנט אוספים PII שאיש לא תכנן עליו:

  • שדות "סיבה" בכרטיסי תמיכה ממולאים בהיסטוריות רפואיות ומספרי ביטוח
  • מקטעי "הערות נוספות" בסקרים מכילים שמות מלאים ומספרי טלפון
  • עמודות "הערות" ב-HR עם שנים של פרטים אישיים לא מובנים
  • שדות "הערות" בהזמנות מכילים מספרי זיהוי לקוח שהוזנו לסיוע בבעיות

כלל המינימיזציה דורש שה-PII הזה לעולם לא ייכנס למערכות שלכם. ניקוי רטרואקטיבי מטפל בתסמינים. זיהוי בזמן אמת מסיר את הסיבה.

מדוע ניקוי רטרואקטיבי אינו מספיק

צוותים המנקים PII מאוחסן עומדים בפני ארבע בעיות.

שלמות. התאמת דפוסים מוצאת PII ברור כגון כתובות אימייל ומספרי זיהוי. היא מחמיצה הפניות מבוססות-הקשר. "לאחות שלי Sophie הייתה אותה בעיה" מכיל שם שרוב הסריקות מדלגות עליו.

עיתוי משפטי. ההפרה מתרחשת באיסוף. ניקוי הנתונים חודשים מאוחר יותר אינו מתקן אותה. אם רגולטור בוחן את התקופה שבה הנתונים הוחזקו, ההפרה כבר ברשומה.

מחיקה לא מלאה. מסדי נתונים עושים גיבויים. מערכות כותבות יומנים. כלי אנליטיקה מייצאים נתונים. אפילו לאחר מחיקה ממסד הנתונים הראשי, עותקים עלולים להישאר בקבצי גיבוי ויומני ביקורת.

חשיפה להפרה. בין האיסוף לניקוי, ה-PII הנוסף יושב במערכות שלכם. הפרה בחלון זה מציבה את הנתונים שנאספו-יתר בסיכון.

עצירת האיסוף במקור פותרת את כל ארבעתן. נתונים שלא נכנסים לעולם לא יכולים להיות מופרים, אינם דורשים מחיקה, ואינם נחשבים כהפרה.

דפוסי זיהוי לאימות טפסים

יש שלוש דרכים להוסיף זיהוי PII בזמן אמת לטופס.

בצד הלקוח (תוסף Chrome). התוסף צופה באירועי הדבקה בשדות דפדפן. כאשר משתמש מדביק טקסט עם PII, הוא מדגיש את הישויות מיידית. המשתמש מסיר אותן לפני הגשה. אין צורך בקריאת API — הזיהוי פועל מקומית. ראו את מילון המונחים להגדרות סוגי ישויות.

בצד השרת (שילוב API). הטופס מוגש לשרת שלכם. לפני כתיבה למסד הנתונים, הקוד שלכם קורא לממשק API של הזיהוי. ה-API מחזיר סוגי ישויות עם ציוני ביטחון. התאמות בעלות-ביטחון-גבוה חוסמות את ההגשה עם הודעה ברורה. התאמות בעלות-ביטחון-בינוני מציגות שלב סקירה. הנתונים נקיים לפני אחסון.

היברידי (מומלץ). הדגשה בצד הלקוח נותנת למשתמשים משוב מהיר. בדיקות בצד השרת מספקות את ערובת הציות. אם משתמש מתעלם מהאזהרה של הלקוח, בדיקת השרת עדיין לוכדת את ה-PII. שום דבר לא מגיע למסד הנתונים ללא בדיקה. ראו את שאלות נפוצות שלנו לשאלות נפוצות על סף זיהוי.

דוגמה: פורטל מטופלים בבריאות

פורטל מטופלים מאפשר למטופלים לתאר את הסימפטומים שלהם בשדה טקסט חופשי לפני הזמנה. השדה מקבל באופן קבוע ערכים הכוללים שמות מטופלים אחרים, מספרי זיהוי וכתובות בית. אף אחד מאלה אינו שייך למערכת ניהול הזמנות.

לפני זיהוי בזמן אמת:

  • PII בשדה הסימפטומים: כ-12% מההגשות
  • שיטת ניקוי: תהליך אצווה שבועי
  • מצב ציות: ריאקטיבי — הפרת סעיף 5(1)(ג) התרחשה באיסוף

לאחר שילוב API בעת הגשה:

  • ה-API מזהה PII בעל-ביטחון-גבוה לפני כל כתיבה למסד הנתונים
  • המטופל רואה: "ההודעה שלך נראית מכילה מידע אישי. אנא הסר אותו לפני הגשה."
  • המטופל מתקן ומגיש מחדש
  • מסד הנתונים מקבל רק את תיאור הסימפטומים

בתרחיש זה, PII בשדה ירד מכ-12% לפחות מ-1% מהגשות. הציות מוכח כעת דרך יומני זיהוי בצד השרת ולא ריצות ניקוי רטרואקטיביות.

רשומות ביקורת בנקודת האיסוף

רגולטורים מתייחסים לצוותים ריאקטיביים בצורה שונה מאלה עם בקרות פעילות. GDPR סעיף 25 — הגנה בעיצוב ובברירת המחדל — מתגמל את האחרונים.

זיהוי בנקודת האיסוף יוצר רשומות ביקורת שימושיות:

  • יומן זיהוי. כל סריקת טופס נשמרת עם סוגי ישויות שנמצאו, ציוני ביטחון, פעולה שננקטה ותוצאה.
  • דוחות חודשיים. סיכומים מראים שיעור זיהוי לפי שדה וסוג ישות, וכיצד משתמשים מגיבים.
  • רשומות תצורה. הגדרות סף, שדות מכוסים וסוגי ישויות שנצפים — זה מראה מדיניות ברורה ומנוהלת.

רשומות אלה מסייעות בסקירות רגולטוריות. הן גם תומכות בביקורת פנימית ורשומות עיבוד. ראו את מחקרי המקרה שלנו לדוגמאות של בקרות בנקודת האיסוף בפועל.

כלי AI ומינימיזציית נתונים

סוכני תמיכה לעיתים קרובות מדביקים אימיילי לקוחות לכלי ניסוח AI. אימיילים אלה עשויים להכיל שמות, כתובות ומספרי חשבון. שליחה זו למודל AI עלולה לעלות על מה שנחוץ.

שרת MCP מוסיף שלב זיהוי לפני שהטקסט מגיע למודל. שמות לקוחות הופכים ל-[CUSTOMER]. פרטים ספציפיים מנוקים. ה-AI מנסח תשובה תוך שימוש בטקסט הנקי. הסוכן מוסיף חזרה רק מה שהתשובה צריכה.

זה עומד בכלל מינימיזציית הנתונים לשימוש ב-AI. המודל מקבל רק את הנחוץ — שבדרך כלל אין בו PII כלל. ראו ישויות לרשימה המלאה של סוגי ישויות שאנו מזהים.

מקורות

מוכן להגן על הנתונים שלך?

התחל לאנונימיזציה של PII עם 285+ סוגי ישויות ב-48 שפות.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.