By · Last updated 2026-03-03

Tornar al BlogTècnic

PII en Xarxes Aillades: Solucio Offline per a Defensa

El 41% de les politiques de seguretat empresarial prohibeixen el processament al nuvol de documents classificats. Aqui teniu com funciona l'anonimitzacio de PII sense connexio a internet.

March 3, 20268 min llegit
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Quan la Xarxa no Te Sortida

Una cientifica de dades treballa en una empresa de defensa. Te 3.000 registres de personal. Necessita eliminar noms, numeros de la Seguretat Social i nivells d'habilitacio de seguretat. Despres podrà compartir les dades amb un soci de recerca sota un acord CUI.

La seva xarxa no te internet. Per disseny.

Prova totes les eines basades en web que pot trobar. Cadascuna envia dades a un servidor extern. Cada plataforma al nuvol necessita un compte i un enllaç actiu. Fins i tot les eines "en local" sovint criden a un servidor de llicencies remot.

Aquest es el problema del desplegament en xarxa aïllada. Afecta molts mes equips del que la majoria de la gent espera.

Qui Necessita l'Eliminacio de PII Sense Connexio

Les empreses de defensa i les agencies governamentals son les que mes sovint s'hi troben. El programa FedRAMP de DISA requereix que les dades es mantinguin dins dels limits de xarxa aprovats. ITAR limita les dades tecniques a sistemes controlats pels EUA. Xarxes com JWICS i SIPRNet estan fisicament desconnectades per disseny.

Pero la necessitat offline va molt mes enlla dels llocs classificats:

Hospitals amb xarxes segmentades. Els sistemes d'imatge PACS, les plataformes EHR i les bases de dades de recerca sovint estan en xarxes sense internet per politica.

Sales de contractacio i cambres de compensacio. Els sistemes de contractacio propietaris i els sistemes connectats a SWIFT utilitzen tallafocs de xarxa estrictes.

Sistemes de control industrial. Les xarxes SCADA i la infraestructura critica funcionen amb aillament com a mesura de seguretat central. L'enduriment post-Stuxnet va fer d'aixo la norma.

Normativa europea de dades. Les lleis alemanyes Landesdatenschutzgesetze i similars de la UE requereixen el processament local de registres governamentals i sanitaris sensibles. La multa RGPD de 530 milions d'euros a TikTok va arribar el maig de 2025. Cobria les transferencies de dades a la Xina. Aquesta multa va impulsar mes equips cap a eines locals. Vegeu la nostra visio general de compliment per a les normes de transferencia del RGPD que s'apliquen.

Per que les Eines al Nuvol Fallen en Xarxes Aillades

La majoria d'eines d'eliminacio de dades segueixen un model SaaS:

Dispositiu de l'Usuari -> HTTPS -> API del Proveidor -> Models NLP -> Resposta -> Dispositiu de l'Usuari

Aquest disseny necessita acces a internet al dispositiu de processament. Necessita confianca en els servidors del proveidor. Significa que les dades creuen xarxes externes.

En una xarxa aïllada, el primer pas es fisicament impossible. Per als entorns regulats, els passos dos a quatre poden cadascun incomplir les normes de compliment.

Presidio auto-allotjat es el recurs habitual. Pero necessita habilitats de Docker i configuracio de Python. Tambe necessita descàrregues de models spaCy, que requereixen acces a internet. I necessita suport informatiu continuat. La majoria d'equips manquen de tot aixo.

La bretxa entre la facilitat del nuvol i la complexitat de l'auto-allotjament es exactament el que omplen les eines d'escriptori locals.

Com Funciona l'Eliminacio Local de PII

Una bona eina offline ve amb tot el que necessita:

Models NLP inclosos. Els models spaCy (40-80 MB cadascun) i els models transformer per a la deteccio d'entitats amb nom formen part de l'instal.lador. No cal cap descàrrega en temps d'execucio.

Pipeline de deteccio local. Regex, NLP i ML s'executen tots a la CPU local - o GPU si n'hi ha. El motor basat en Presidio d'anonym.legal no fa cap crida de xarxa durant una execucio.

Cartera local xifrada. Les configuracions, els presets i les claus s'emmagatzemen localment. La cartera utilitza xifratge AES-256-GCM i derivacio de claus Argon2id. Sense sincronitzacio al nuvol. Sense copia de seguretat remota. La cartera es queda al dispositiu.

E/S de fitxers local. Els fitxers d'entrada provenen de l'emmagatzematge local. Els fitxers de sortida tornen a l'emmagatzematge local. Cap dada creua cap interficie de xarxa.

Superfície d'atac petita. L'Aplicacio d'Escriptori utilitza Tauri 2.0 (basat en Rust). Tauri te una superfície d'atac molt mes petita que les eines basades en Electron (basat en Chromium). El seu binari es aproximadament un decim de la mida. Tambe crida menys API del SO per defecte.

Tres Escenaris de Compliment Reals

Documents ITAR - 500 Fitxers

Una empresa de defensa necessita compartir documents tecnics amb un soci estranyer sota una excepcio de llicencia. Els fitxers contenen noms de persones dels EUA i dades de personal. Tots dos s'han d'eliminar primer.

Necessitats clau: processament nomes en estacions de treball autoritzades. Cap dada enviada fora de la xarxa autoritzada. Un registre d'auditoria que mostri que el treball s'ha fet. Suport per lots per a 500+ fitxers.

L'Aplicacio d'Escriptori gestiona tots els 500+ fitxers DOCX localment en mode per lots. Cap crida de xarxa es fa durant l'execucio. El registre d'auditoria es queda a la cartera local. La sortida compleix les necessitats de l'excepcio de llicencia ITAR.

Agencia Federal Alemanya - Registres de Reclamacions

Una agencia federal alemanya ha d'eliminar les dades personals dels registres de reclamacions de ciutadans. Despres envia els registres a un institut de recerca. L'orientacio del BfDI prohibeix el processament en sistemes no governamentals.

L'Aplicacio d'Escriptori s'executa en estacions de treball Windows 11 de l'agencia. Tot el processament es local. L'equip de seguretat informatica ho confirma amb la monitoritzacio del trafic: zero connexions externes durant l'execucio.

Recerca Hospitalaria - Desidentificacio d'EHR

Un equip de recerca hospitalaria necessita eliminar les dades dels pacients per a un assaig clinic. HIPAA Safe Harbor requereix eliminar 18 tipus d'identificadors. La xarxa clinica no te acces a internet.

L'Aplicacio d'Escriptori gestiona el processament per lots d'exportacions d'EHR en format CSV i JSON. El Responsable de Privadesa revisa la sortida contra les normes Safe Harbor abans que el conjunt de dades arribi als socis de recerca.

Que Buscar en una Eina Offline

CapacitatPer que Importa
Totalment offline despres de la instal.lacioSense dependencia d'internet durant el processament
Models NLP inclososSense pas de descàrrega necessari
Processament per lotsGestionar grans volums sense treball manual
Cartera xifrada localEmmagatzematge segur de configuracions i claus
Registre d'auditoriaRegistres necessaris per a les revisions de compliment
Suport per a Windows, macOS, LinuxCobreix els tipus d'estacio de treball classificades
Opcio sense telemetriaAturar les dades que surten via telemetria
Suport de formats de fitxersDOCX, PDF, TXT, CSV, JSON, Excel

Les Normes de Dades Impulsen els Equips Cap a les Eines Locals

La multa de 530 milions d'euros a TikTok va desencadenar una onada mes amplia de multes. Els equips de la UE que usaven eines al nuvol ara fan una nova pregunta. El processament en els servidors d'un proveidor satisfa el Capitol V del RGPD i les lleis nacionals de dades?

La resposta mes clara a "on van les vostres dades?" es aquesta: a cap lloc - mai no deixa el dispositiu. El processament local elimina completament la questio de la transferencia del RGPD.

Per als equips alemanys, la lectura estricta del DSGVO dels Articles 44-46 fa del processament local una opcio intel.ligent. Aixo s'aplica fins i tot sense restriccions estrictes de xarxa. La nostra visio general de seguretat explica com el processament local elimina la cadena de dades de tercers.

Notes Practiques de Desplegament

Instal.leu en sistemes aillats. L'instal.lador - .exe o .msi de Windows, .dmg de macOS, .AppImage o .deb de Linux - es transfereix a la xarxa aïllada via USB o transferencia de fitxers segura. No cal internet despres de la instal.lacio.

Suport d'idiomes. 24 models especifics d'idioma es lliuren amb l'aplicacio. El conjunt complet esta disponible sense connexio sense cap descàrrega addicional.

Necessitats de maquinari. El pipeline NLP s'executa en estacions de treball modernes sense GPU. El processament per lots de 1.000 documents normalment triga entre 5 i 15 minuts. La velocitat depèn de la mida del document i la velocitat de la CPU.

Configuracio de llicencia offline. Per a xarxes on un servidor de llicencies esta fora de l'abast, la configuracio de llicencia offline esta disponible.

Quan l'Aïllament no es la Solucio Adequada

Els sistemes aillats resolen problemes especifics. Tambe afegeixen una carrega real.

Fregament d'actualitzacions. Mantenir els models i el programari actualitzats requereix passos manuals. Els equips que es queden enrere poden perdre nous patrons de PII.

Carrega d'interconnexio. Els sistemes aillats no es poden connectar a eines SIEM al nuvol o taulers d'auditoria remots. Cal solucions de diode de dades personalitzades. Aixo augmenta els costos.

Contrapartides de precisio. Les eines al nuvol actualitzen les dades d'entrenament contínuament. Els models offline son una instantania. Poden quedar-se enrere davant nous patrons de llenguatge amb el temps.

No necessari per a cada model d'amenaça. Els equips sense mandats governamentals, sanitaris o legals pot ser que trobin les eines al nuvol mes practiques. El xifratge fort, les auditories SOC 2 de Tipus II i els acords de processament de dades cobreixen la majoria dels casos. L'aillament nomes val la pena quan el model d'amenaça inclou realment el robatori de dades basat en xarxa per part d'un adversari qualificat.

Per a la majoria de les PIME i els equips empresarials estandard, el xifratge fort en transit i en repos ofereix una proteccio adequada. Afegiu controls contractuals solids i cobrireu la majoria dels casos d'us, sense la carrega de l'aillament complet. Vegeu les nostres PMF per a mes informacio sobre com triar el model de desplegament adequat.


L'Aplicacio d'Escriptori d'anonym.legal (Windows, macOS, Linux) processa la PII completament localment amb models NLP inclosos. No cal connexio a internet despres de la instal.lacio. El processament per lots admet 1-5.000 fitxers per execucio depenent del nivell del pla.

Fonts

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.