Forebyggelse af PII i realtid: Stop AI-datalæk, før de sker
Opdateret til 2026.
I marts 2023 indsatte en Samsung-ingeniør kildekode i ChatGPT. Koden forlod Samsungs kontrol med det samme. Intet værktøj nåede at gribe ind. Efterfølgende sikkerhedskontroller kan ikke stoppe AI-datalæk. Denne ene hændelse beviste det.
Detektionsværktøjer fortæller dig, hvad der skete i efterhånden. Logkontroller, endpoint-DLP og revisionslogge fungerer alle på denne måde. For AI-lækager er det for sent bagefter. Data har allerede nået AI-modellen.
Problemets omfang
En Cyberhaven-undersøgelse fra 2025 så på, hvordan virksomheder bruger AI. Resultaterne var slående.
- 11 % af alle ChatGPT-prompter indeholder private eller følsomme data.
- Den gennemsnitlige medarbejder bruger AI-værktøjer 14 gange om dagen.
- Højt-brugende medarbejdere interagerer 30 til 50 gange dagligt.
- Med 11 % betyder det 3 til 5 følsomme afsendelser pr. medarbejder pr. dag.
I en virksomhed med 500 højt-brugende medarbejdere bliver dette til 2.000-plus følsomme afsendelser om dagen. Hver enkelt kan udgøre et brud på GDPR Artikel 83. Risikoen er ikke kun juridisk. Tillid og omdømme står også på spil.
Typiske typer af følsomt indhold i AI-prompter omfatter:
- Kundenavne og kontaktoplysninger.
- Kontonumre og betalingsregistreringer.
- Medicinske noter fra sundhedspersonale.
- Sagsoplysninger fra advokater.
- Personalegennemgangsnoter fra HR-teams.
- Interne omsætnings- eller salgsestimater.
Undersøgelsen skelner ikke mellem bevidst og utilsigtet deling. Begge skaber den samme juridiske risiko. En medarbejder, der glemmer at fjerne et kundenavn, forårsager det samme brud som én, der ignorerer reglen. Hensigt ændrer ikke resultatet.
Hvorfor detektion ikke er tilstrækkeligt
Netværkskontroller kan ikke læse HTTPS-trafik uden TLS-afskæring. TLS-afskæring tilføjer overhead og rejser bekymringer om privatlivets fred. Moderne browsere afviser det ofte.
Endpoint-DLP-agenter overvåger udklipsholder og tastaturinput. Men de har forsinkelse. Når en agent markerer et mønster, kan prompten allerede være afsendt.
Leverandørens revisionslogge registrerer, hvad der blev delt, efter det var delt. De hjælper med reaktion. De forhindrer ikke lækager.
Medarbejdertræning er en politik, ikke en kontrol. Cyberhaven-undersøgelsen viser, at 11 % af prompterne stadig indeholder følsomt indhold hos virksomheder med klare politikker. Træning stopper ikke utilsigtet deling eller midtvejs-fejl.
Blokering af AI-værktøjer fjerner produktivitetsgevinster. Medarbejderne bruger derefter personlige enheder eller konti. Det placerer arbejdet uden for enhver overvågning.
Ingen af disse metoder stopper følsomt indhold fra at nå AI-systemer i realtid.
Forebyggelse ved indgangsstedet
Den eneste sikre forsvar er maskering, inden prompten sendes. Et kundenavn erstattet med [PERSON_1], inden det forlader browseren, ses aldrig af AI-modellen.
Sådan fungerer inline-maskering:
- En medarbejder skriver en kundes e-mail ind i Claude eller ChatGPT.
- Browserudvidelsen registrerer persondata i realtid.
- Entiteter markeres med typeetiketter: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
- Medarbejderen gennemgår de markerede elementer.
- Et enkelt klik erstatter alle entiteter med tokens.
- Den maskerede prompt sendes.
AI modtager en prompt som denne: "Kunde [PERSON_1] på [EMAIL_1] har konto [ACCOUNT_1]."
AI håndterer anmodningen. Den ser aldrig rigtige navne eller numre. Medarbejderen kender den faktiske kunde fra kontekst.
Denne tilgang har klare fordele:
- Persondata forbliver ude af eksterne AI-systemer.
- Kundeoplysninger tilføjes ikke til AI-træningssæt.
- Medarbejderne beholder adgang til AI-værktøjer. Produktiviteten forbliver høj.
Det stopper ikke bevidst deling, hvis en medarbejder omgår værktøjet. Filuploads kræver en separat arbejdsgang. Ingen kontrol er perfekt. Men inline-maskering fjerner den utilsigtede gruppe. Den gruppe udgør de fleste hændelser. Resultatet er et stort fald i risiko uden ændringer i den daglige arbejdsgang.
Advokatfirma-casestudie
Et advokatfirmas medarbejdere brugte Claude til at udkaste kontraktnoter. Deres metode: kopier kontraktafsnit, indsæt i Claude, anmod om et resumé.
Før brug af Chrome-udvidelsen — første 6 måneder:
- 3 klientdatahændelser fundet under gennemgang.
- Hver hændelse: et klientnavn plus et sagsnummer optrådte i prompten.
- Alle 3 var utilsigtede.
Efter brug af Chrome-udvidelsen — de næste 6 måneder:
- Nul klientdatahændelser.
- Medarbejderne modtog realtidsadvarsler, når de indsatte afsnit med klientnavne.
- Et enkelt klik erstattede "Johnson Controls Sag 2024-0347" med "[PERSON_1] Sag [REFERENCE_1]."
- Metoden forblev den samme.
Den administrerende partner sagde: "Vores medarbejdere kendte politikken, inden de fik udvidelsen. Udvidelsen gjorde compliance til den nemme vej."
Se, hvordan andre firmaer håndterede dette i vores casestudier. Gennemgå kontroller i sikkerhedsoversigten.
GDPR-registre for complianceteams
Virksomheder, der bruger browserbaseret AI-maskering, skal dokumentere det som en teknisk kontrol.
Registre over behandling (ROPA): Angiv at AI-prompter passerer gennem klientsidemaskering, inden de når leverandører. Angiv entitetstyper, motorversion og deployeringslogge som bevis.
Databehandleraftaler: Når ingen persondata når AI-leverandøren, er DPA-forpligtelserne enkle. De persondata, du besidder, forlader aldrig dit system.
Revisionslogge: Udvidelseslogge registrerer antal entiteter pr. session, maskeringsrate og entitetstyper efter volumen. Disse målinger indgår i compliancerapporter.
Gennemgå GDPR-regler for AI-værktøjer i vores juridiske complianceguide og ordliste. Hyppige spørgsmål besvares i vores FAQ.
Konklusion
Samsung-hændelsen viste, at AI-lækager sker hurtigere, end nogen efterfølgende kontrol kan reagere. Cyberhaven-undersøgelsen satte tal på det: 11 % af prompter, mange gange pr. medarbejder, hver dag.
Realtidsmaskering inden afsendelse løser grundårsagen. Når persondata aldrig når AI'en, er der intet at opdage, logge eller rydde op. Medarbejderne beholder deres AI-værktøjer. Virksomheder beholder deres compliancestatus.
Detektion fortæller dig, hvornår forebyggelse slog fejl. For AI-datalækager retfærdiggør omkostningerne ved fejl — bøder, omdømmeskade, tab af tillid — forebyggelse i første omgang.
Udforskt priser for din virksomhed. Læs vores grundlæggerudtalelse om, hvorfor forebyggelse-først er vores kerneprojekteringsprincip.
Kilder
- Cyberhaven: AI Data Exposure Study 2025 — cyberhaven.com.
- Samsung ChatGPT-databrud, marts 2023 — Bloomberg.
- GDPR Artikel 4 og 32: Persondata og tekniske foranstaltninger — gdpr-info.eu.