By · Last updated 2026-06-05

Til baka á BloggÖryggi AI

AI-forritunarbúnaður lekur framleiðslu-PII

Einingaprófunarfærslu með raunverulegum skrám viðskiptavina. Kladdaskilaskrár með framleiðslugögnum til villuleitar. GitHub fann 39 milljónir lekkinna leyndarmála árið 2024.

June 5, 20268 mín lestur
AI coding assistantproduction PIIdeveloper securityMCP ServerGitHub Copilot

Af hverju AI-forritunarverkfæri leka raunverulegum skrám viðskiptavina

Flestir PII-lekar frá þróunarhópum eru ekki brot. Þeir eru aukaverkanir daglegs starfs.

Framleiðslugögn fara inn í prófunarumhverfi. Þaðan ná þær AI-forritunartækjum — og söluaðilum sem reka þær.

GitHub-rannsókn 2025 staðfesti þetta. Þróunarar lektu 39 milljónum leyndarmála í opinberum geymslunum árið 2024. API-lyklar og persónuupplýsingar birtust allt. Flestar komu úr prófunarfærslum og villuleitarkladda. Sjá öryggisöryggisyfirlit okkar til að læra hvernig hópar takast á við þessa áhættu.

Uppfært fyrir 2026: Notkun AI-forritunarverkfæra hefur vaxið hratt. Svo og útsetningaryfirborðið.

Hvernig raunverulegar skrár fara inn í þróunarumhverfi

Leiðirnar eru algengar og fyrirsjáanlegar.

Prófunarfærsluskrár: Einingaprófanir þurfa raunhæfar inntak. Skjótasta leiðin er að afrita línur úr framleiðslu. Þróunarinn ætlar að skipta þeim út "síðar." Síðar kemur sjaldan. Raunveruleg tölvupóst og reiknings-ID sitja eftir í tugum sendinga.

Villuleitarkladdi: Villa getur ekki verið endurframleidd staðbundið. Þróunarinn dregur kladda úr lifandi kerfinu. Sá kladdi hefur tölvupóst viðskiptavina, IP-tölur og lotu-tákn. Skráin lendir í rótarmöppu verkefnisins og er send inn.

Flutningsskriftur: Skemabúnar breytingar innihalda sýnilínur fyrir prófunarumhverfi. DBA afritar raunverulegar línur sem sýnishorn. Skriftan — með genuine viðskiptavinaatriðum — fer inn í útgáfustýringu.

Skjöl og README-skrár: Notkunardæmi nota "raunhæfar" inntak. Raunhæfar þýðir oft afritaðar frá raunverulegum notendum. README-skráin endar með raunverulegum pöntunarnúmerum og reikningsheimilisföngum.

Stillingarskrár: Þróunarstillingar bera sviðslykla sem ná til raunverulegra viðskiptavinagagna. Þessar skrár eru sendar inn með leyndarmálum inni.

Hvað AI-aðstoðarmenn fá í raun og veru

Þegar þróunarar nota AI-forritunartæki senda margar rásir einkagögn út.

Heildarskráarsamhengi: Tækið kann að fá heildarmyndina af skrám. Það inniheldur prófunarfærslu með raunverulegum atriðum, kladdasúður eða stillingarskrár með lifandi lyklum.

Lím í klemmuspjaldið: Þróunarar líma kóða í spjall til yfirferðar. Umhverfissamhengið hefur oft viðskiptavinaupplýsingar.

IDE-vísun: Cursor og GitHub Copilot vísun staðbundnar skrár til samhengis. Sérhver verkefnisskrá með raunverulegum línum verður hluti af þeirri vísun.

Villuboð: Þróunarar líma staflaraketsður í AI-spjall við villuleit. Staflaraketsður geta borið viðskiptavina-ID.

Sérhver rás sendir einkagögn til API söluaðila AI. Þetta skapar GDPR og HIPAA-áhættu. Sjá samræmisyfirlit okkar fyrir hvernig þessar reglur gilda um þróunarverkfæri.

GDPR og HIPAA: Lykilstaðreyndir fyrir þróunarhópa

Þessar reglur eiga við um notkun AI-forritunartækja.

GDPR-grein 28 — Vinnsluaðili: Sending persónuupplýsinga til AI-söluaðila gerir þann söluaðila að vinnsluaðila. Vinnslusamningur er nauðsynlegur. Flestir söluaðilar bjóða upp á vinnslusamninga. Þróunarar sem nota AI-verkfæri utan formlegra kaupa geta skort undirrituðum vinnslusamning.

GDPR-grein 6 — Lögleg grundvöllur: Þróunarprófun krefst löglegrar grundvallar til vinnslu persónuupplýsinga. Lögmætur hagnaður kann að gilda — en hann þarf jafnunarpróf. Að nota raunverulegar viðskiptavinalínur þegar falsar myndu duga mistekst það próf.

HIPAA — BAA: Heilbrigðisþróunarar verða að hafa samning við viðskiptatengil (BAA) við AI-söluaðila. OpenAI, Anthropic og GitHub Copilot bjóða upp á BAA fyrir fyrirtækjanotendur. Einstaklinganotkun utan fyrirtækjaáætlunar er kannski ekki þakinn.

Lágmarksupplýsingar: Raunverulegar viðskiptavinalínur í prófunarfærslum bryta lágmarksreglu. Falsar línur þjóna sama tilgangi án persónuverndarkostnaðar.

Spurðu algengar spurningar um þessar reglur.

Hagnýt skref fyrir þróunarhópa

Byrjaðu með skjóta úttekt. Flestir hópar finna vandamál innan fyrstu klukkustundarinnar.

Tafarlausar aðgerðir:

  1. Úttekt prófunarfærslna — leitaðu að tölvupósts-, síma- og ID-mynstrum.
  2. Skoðaðu framleiðslukladdaskrár í verkefnismöppum fyrir viðskiptavina-ID.
  3. Uppfærðu .gitignore til að útiloka kladdaskrár og umhverfissérstæðar gagnaskrár.
  4. Skiptu raunverulegum atriðum út með tilbúnum myndunartækjum eins og Faker eða Mimesis.

Úttektin ein og sér lætur oft í ljós áralanga safnaða útblástur. Einn hópur fann raunveruleg tölvupóstföng viðskiptavina í 14 prófunarskrám búnar til af sex mismunandi þróurum á þremur árum. Enginn þróunaranna hafði ætlað að skilja þær eftir þar.

Áður en hvaða AI-aðstoðarlota sem er:

  • Keyra PII-greiningu á skrám áður en þær eru deildar.
  • Fyrir IDE-verkfæri eins og Cursor: útiloka prófunarmöppur frá vísun.
  • Fyrir spjallbundin verkfæri: fara yfir límdan kóða með tilliti til persónuupplýsinga.

MCP Server viðbót:

anonym.legal MCP Server tengir PII-greiningu inn í Claude Desktop og Cursor. Skrefin eru einföld:

  1. Opnaðu skrá í ritli.
  2. Kallaðu á MCP Server: greina PII í skránni.
  3. Fara yfir flaggaðar atriðir.
  4. Þekkja á staðnum.
  5. Deila hreinu skránni með AI-tækinu.

Þetta bætir undir 30 sekúndum við á skrá. Það fjarlægir handvirku "athugaðu PII" byrðina. Sjá verðlagnignasíðu okkar til að bæta við MCP Server aðgangi að hópnum þínum.

Tilbúið inntak — varanleg lausn:

Nota aldrei raunverulegar línur í prófunarfærslum. Tilbúið safn framleiðir raunhæfar inntak án þess að afhjúpa raunverulega notendur. Faker (Python/Node.js), Factory Boy (Python) og Bogus (.NET) búa til gild inntak fyrir hvaða skema sem er. Hvert safn leyfir þér að setja staðbundinnar og gefa út raunhæf nöfn, tölvupóst og símanúmer — öll uppgervd.

Dæmisaga: SaaS-hópur finnur raunverulegar atriðir í Cursor

Fundurinn kom við GDPR-úttekt. SaaS-hópur sem notar Cursor fann raunveruleg tölvupóstföng viðskiptavina í einingaprófunarfærslum. Þróunarinn hafði afritað 50 viðskiptavinalínur úr framleiðslu 18 mánuðum áður. Þær línur höfðu verið sendar inn í útgáfustýringu og vísuðu af Cursor.

Á 18 mánuðum opnaði Cursor færsluskrárnar að líkindum 11.000 sinnum yfir 8 þróunar IDE-lotur. Sérhver lota gæti hafa sent innihald færslunnar til Cursor API.

Hvað hópurinn gerði:

  1. Skipt út öllum 50 raunverulegum línum fyrir uppgervð inntak með Faker.
  2. Uppfærðu .gitignore til að útiloka kladdaskrár.
  3. Bætt við MCP Server fyrir sérstaka PII-greiningu áður en kóða er deilt.
  4. Sett norm: engin framleiðsluatriðin í neinum sendri skrá.

MCP Server var lykilbreytingin. Þróunarar keyra nú greiningu áður en Cursor-lotur á kóða sem snýr að viðskiptavinum. Núll aukin vinna umfram MCP-kallið.

Lestu meira í dæmisögum okkar.

Heimildir

GitHub öryggisrannsókn 2024. STAÐFEST-UTANAÐKOMANDI.

GDPR-grein 28. STAÐFEST-UTANAÐKOMANDI.

HIPAA BAA-leiðbeiningar. STAÐFEST-UTANAÐKOMANDI.

Ertu tilbúinn að vernda gögnin þín?

Byrjaðu að anonymiza PII með 285+ gerðum í 48 tungumálum.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.