anonym.legal

By · Last updated 2026-03-03

Terug na BlogTegnies

Luggesnapte PII: Aflyn-eerste vir Verdediging

41% van ondernemingssekuriteitsbeleide verbied wolkverwerking van geklassifiseerde dokumente. Leer hoe aflyn PII-anonimisasie vir verdedigings-, gesondheids- en finansielespan werk.

March 3, 20268 min lees
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Wanneer die Netwerk Geen Uitgang Het Nie

'n Datawetenskaplike werk by 'n verdedigingsfirma. Sy het 3 000 personeelrekords. Sy moet name, sosialesekerheidsnommers en skeringselvakke verwyder. Dan kan sy die data met 'n navorsingsliggaamsgenoot deel onder 'n CUI-ooreenkoms.

Haar netwerk het geen internet nie. By ontwerp.

Sy toets elke webgebaseerde nutsmiddel wat sy kan vind. Elkeen stuur data na 'n buitenste bediener. Elke wolkplatform benodig 'n rekening en 'n lewendige koppeling. Selfs "perseel"-nutsmiddels roep dikwels 'n afgeleë lisensie-bediener.

Dit is die luggesnapte ontplooiingsprobleem. Dit tref baie meer spanne as wat die meeste mense verwag.

Wie Aflyn PII-verwydering Benodig

Verdedigingsfirmas en staatsagentskappe staan die meeste hieraan bloot. DISA se FedRAMP-program vereis dat data binne goedgekeurde netwerkgrense bly. ITAR beperk tegniese data tot VS-beheerde stelsels. Netwerke soos JWICS en SIPRNet is fisies afgesny by ontwerp.

Maar die aflyn-behoefte gaan ver buite geklassifiseerde terreine:

Hospitale met gesegmenteerde netwerke. PACS-beeldingstelsels, EHR-platforms en navorsings-databasisse sit dikwels op netwerke sonder internet by beleid.

Handelsvloere en vereffeningsentrums. Eie handelstelsels en SWIFT-gekoppelde stelsels gebruik streng netwerkafsny.

Industriele beheerstelsels. SCADA-netwerke en kritiese infrastruktuur loop met luggapings as 'n kernsekerheidsmaatreeel. Na-Stuxnet-verharding het dit die norm gemaak.

Europese datareels. Duitsland se Landesdatenschutzgesetze en soortgelyke EU-wette vereis plaaslike dataverwerking vir sensitiewe regerings- en gesondheidsrekords. Die TikTok EUR 530 miljoen GDPR-boete het in Mei 2025 aangekom. Dit het dataoordragte na China gedek. Daardie boete het meer spanne na plaaslike nutsmiddels gestoot. Sien ons nakomingsoorsig vir die GDPR-oordragsreels wat geld.

Waarom Wolknutsmiddels in Luggesnapte Netwerke Misluk

Meeste dataverwyderingsnutsmiddels volg 'n SaaS-model:

Gebruikerstoestel -> HTTPS -> Verskaffer-API -> NLP-modelle -> Antwoord -> Gebruikerstoestel

Hierdie ontwerp benodig internettoegangby die verwerkingstoestel. Dit benodig vertroue in die verskaffer se bedieners. Dit beteken dat data buitenste netwerke kruis.

Op 'n luggesnapte netwerk is stap een 'n fisiese onmoontlikheid. Vir gereguleerde omgewings kan stappe twee tot vier elk nakomingsreels breek.

Self-aangebied Presidio is die algemene terugvalopsie. Maar dit benodig Docker-vaardighede en Python-opstelling. Dit benodig ook spaCy-modelaflaaiings, wat internettoegang vereis. En dit benodig voortdurende IT-ondersteuning. Die meeste spanne het dit alles te kort.

Die gaping tussen wolkgemak en selfaangebied-kompleksiteit is presies wat plaaslike Tafelrekenaar-nutsmiddels vul.

Hoe Plaaslike PII-verwydering Werk

'n Goeie aflyn-nutsmiddel kom met alles wat dit benodig:

Saamgepakte NLP-modelle. spaCy-modelle (40-80 MB elk) en transformer-modelle vir benoemde entiteitsopsporing is deel van die installeerder. Geen aflaai is nodig tydens looptyd nie.

Plaaslike opsporingspyplyn. Regex, NLP en ML loop almal op die plaaslike SVE -- of GPU as dit beskikbaar is. Die Presidio-gebaseerde enjin binne anonym.legal maak geen netwerkoproepe tydens 'n lopie nie.

Geenkripteerde plaaslike kluis. Konfigurasies, voorafinstellings en sleutels word plaaslik gestoor. Die kluis gebruik AES-256-GCM-enkripsie en Argon2id-sleutelafleiding. Geen wolksinkronisasie nie. Geen afgeleee rugsteun nie. Die kluis bly op die toestel.

Plaaslike leer-I/O. Invoerleers kom van plaaslike stoor. Uitvoerleers gaan terug na plaaslike stoor. Geen data kruis enige netwerkkoppelvlak nie.

Klein aanvalsoppervlak. Die Tafelrekenaarprogram gebruik Tauri 2.0 (Rust-gebaseerd). Tauri het 'n baie kleiner aanvalsoppervlak as Electron (Chromium-gebaseerd) nutsmiddels. Die binere is ongeveer een-tiende die grootte. Dit roep ook minder OS-API's by verstek.

Drie Werklike Nakomingsscenario's

ITAR-dokumente -- 500 Leers

'n Verdedigingsfirma moet tegniese dokumente met 'n buitelandse vennoot deel onder 'n lisensie-uitsondering. Die leers bevat VS-persoon-name en personeeldata. Albei moet eers verwyder word.

Sleutelbehoeftes: verwerking op geskikte werkstasies slegs. Geen data gestuur buite die geskikte netwerk nie. 'n Ouditspoor wat wys dat die werk gedoen is. Bondelondersteuning vir 500+ leers.

Die Tafelrekenaarprogram hanteer alle 500+ DOCX-leers plaaslik in bondelmode. Geen netwerkoproep word tydens die lopie gemaak nie. Die ouditlogboek bly in die plaaslike kluis. Die uitvoer voldoen aan die ITAR-lisensie-uitsonderingsbehoeftes.

Duitse Federale Agentskap -- Griefrekords

'n Duitse federale agentskap moet persoonlike data van burgergriefrekords verwyder. Dan stuur dit die rekords na 'n navorsingsinstituut. BfDI-leiding belet verwerking op nie-regeringstelsels.

Die Tafelrekenaarprogram loop op agentskap-Windows 11-werkstasies. Alle verwerking is plaaslik. Die IT-sekuriteitspan bevestig dit met verkeermonitering -- nul buitenste verbindings tydens die lopie.

Hospitaal Navorsing -- EHR De-ID

'n Hospitaalnavorsings-span moet pasientrekords stroop vir 'n kliniese proef. HIPAA Safe Harbor vereis die verwydering van 18 identifiseerder-tipes. Die kliniese netwerk het geen internettoegang nie.

Die Tafelrekenaarprogram hanteer bondelverwerkingvan EHR-uitvoere in CSV- en JSON-formaat. Die Privaatheidsbeampte hersien die uitvoer teen Safe Harbor-reels voordat die datastel na navorsingsliggaamsvennote gaan.

Wat Om In 'n Aflyn-nutsmiddel Te Soek

VermoeWaarom Dit Saak Maak
Volledig aflyn na installeringGeen internetafhanklikheid tydens verwerking nie
Saamgepakte NLP-modelleGeen aflaai-stap benodig nie
BondelverwerkingHanteer groot volumes sonder handmatige werk
Plaaslike geenkripteerde kluisVeilige stoor van konfigurasies en sleutels
OuditlogboekRekords benodig vir nakomingsoorsig
Windows, macOS, Linux-ondersteuningDek geskikte werkstasie-tipes
Geen telemetrie-opsieStop data wat via telemetrie vertrek
Leerformaat-ondersteuningDOCX, PDF, TXT, CSV, JSON, Excel

Datareels Dryf Spanne na Plaaslike Nutsmiddels

Die TikTok EUR 530 miljoen-boete het 'n groter golf van boetes veroorsaak. EU-spanne wat wolknutsmiddels gebruik het, vra nou 'n nuwe vraag. Voldoen verwerking op 'n verskaffer se bedieners aan GDPR Hoofstuk V en nasionale datawette?

Die skoonste antwoord op "waar gaan jou data?" is hierdie: nêrens -- dit verlaat nooit die toestel nie. Plaaslike verwerking verwyder die GDPR-oordragsvraag volledig.

Vir Duitse spanne maak die DSGVO se streng lesing van Artikels 44-46 plaaslike verwerking 'n verstandige keuse. Dit geld selfs sonder streng netwerkrestriksies. Ons sekuriteitsoorsig verduidelik hoe plaaslike verwerking die derdepartydataketting uitskakel.

Praktiese Ontplooiingsnotas

Installeer op luggesnapte stelsels. Die installeerder -- Windows .exe of .msi, macOS .dmg, Linux .AppImage of .deb -- word via USB of veilige leer-oordrag na die luggesnapte netwerk oorgedra. Internet is nie nodig na installasie nie.

Taalondersteuning. 24 taalspesifieke modelle word saam met die program gestuur. Die volledige stel is aflyn beskikbaar sonder ekstra aflaai.

Hardeware-behoeftes. Die NLP-pyplyn loop op moderne werkstasies sonder 'n GPU. Bondelverwerking van 1 000 dokumente neem gewoonlik 5-15 minute. Spoed hang af van dokumentgrootte en SVE-spoed.

Aflyn lisensie-opstelling. Vir netwerke waar 'n lisensie-bediener buite bereik is, is aflyn lisensie-opstelling beskikbaar.

Wanneer Luggesnapte Is Nie Die Regte Pas Nie

Luggesnapte stelsels los spesifieke probleme op. Hulle voeg ook werklike laste by.

Opdaterings-wrywing. Om modelle en sagteware aktueel te hou, benodig handmatige stappe. Spanne wat agterraak, kan nuwe PII-patrone mis.

Koppeling-bokoste. Luggesnapte stelsels kan nie aan wolk-SIEM-nutsmiddels of afgeleee ouditkontroleskerms koppel nie. Pasgemaakte datadioode-oplossings is nodig. Dit verhoog koste.

Akkuraatheid-kompromisse. Wolknutsmiddels werk opleidingsdata voortdurend by. Aflyn-modelle is 'n kiekie. Hulle kan oor tyd agterraak teen nuwe taalpatrone.

Nie nodig vir elke bedreigingsmodel nie. Spanne sonder staats-, gesondheids- of regsmandate mag wolknutsmiddels meer prakties vind. Sterk enkripsie in vervoer en in rus bied voldoende beskerming vir die meeste gevalle. Voeg soliede kontraktuele beheer by en jy dek die meeste gebruiksgevalle -- sonder die bokoste van volledige luggesnapte. Sien ons FAQ vir meer oor die keuse van die regte ontplooiingsmodel.


anonym.legal se Tafelrekenaarprogram (Windows, macOS, Linux) verwerk PII volledig plaaslik met saamgepakte NLP-modelle. Geen internetverbinding word benodig na installasie nie. Bondelverwerking ondersteun 1-5 000 leers per lopie afhangende van planvlak.

Bronne

Gereed om u data te beskerm?

Begin om PII te anonimiseer met 285+ entiteitstipes in 48 tale.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.