Cuando la red no tiene salida
Una científica de datos trabaja en una empresa de defensa. Tiene 3.000 registros de personal. Necesita eliminar nombres, números de seguridad social y niveles de autorización de seguridad. Solo entonces podrá compartir los datos con un socio de investigación bajo un acuerdo CUI.
Su red no tiene internet. Por diseño.
Prueba cada herramienta web que puede encontrar. Cada una envía datos a un servidor externo. Cada plataforma en la nube necesita una cuenta y una conexión activa. Incluso las herramientas «on-premises» suelen llamar a un servidor de licencias remoto.
Este es el problema del despliegue air-gapped. Afecta a muchos más equipos de lo que la mayoría espera.
Quién necesita la eliminación PII sin conexión
Las empresas de defensa y las agencias gubernamentales son las más afectadas. El programa FedRAMP de la DISA exige que los datos permanezcan dentro de los límites de red aprobados. ITAR limita los datos técnicos a sistemas controlados por EE. UU. Redes como JWICS y SIPRNet están físicamente aisladas por diseño.
Pero la necesidad sin conexión va mucho más allá de los sitios clasificados:
Hospitales con redes segmentadas. Los sistemas de imagen PACS, las plataformas EHR y las bases de datos de investigación suelen estar en redes sin internet por política.
Pisos de trading y cámaras de compensación. Los sistemas de trading propietarios y los sistemas conectados a SWIFT utilizan estricto aislamiento de red.
Sistemas de control industrial. Las redes SCADA y la infraestructura crítica operan con air gaps como medida de seguridad central. El endurecimiento post-Stuxnet lo convirtió en la norma.
Normas europeas de datos. Las Landesdatenschutzgesetze alemanas y leyes similares de la UE exigen el procesamiento local de datos sensibles gubernamentales y de salud. La multa RGPD de 530 M€ a TikTok llegó en mayo de 2025. Abarcó transferencias de datos a China. Esa multa empujó a más equipos hacia herramientas locales. Consulta nuestra descripción general de cumplimiento para las normas de transferencia del RGPD aplicables.
Por qué las herramientas en la nube fallan en redes air-gapped
La mayoría de las herramientas de eliminación de datos siguen un modelo SaaS:
Dispositivo → HTTPS → API del proveedor → Modelos NLP → Respuesta → Dispositivo
Este diseño necesita acceso a internet en el dispositivo de procesamiento. Necesita confianza en los servidores del proveedor. Significa que los datos cruzan redes externas.
En una red air-gapped, el paso uno es una imposibilidad física. En entornos regulados, los pasos dos a cuatro pueden cada uno infringir las normas de cumplimiento.
Presidio auto-alojado es el recurso habitual. Pero necesita conocimientos de Docker y configuración de Python. También necesita descargas de modelos spaCy, que requieren acceso a internet. Y necesita soporte de IT continuo. La mayoría de los equipos no tienen todo esto.
La brecha entre la facilidad de la nube y la complejidad del auto-alojamiento es exactamente lo que llenan las herramientas de escritorio locales.
Cómo funciona la eliminación PII local
Una buena herramienta sin conexión incluye todo lo que necesita:
Modelos NLP integrados. Los modelos spaCy (40–80 MB cada uno) y los modelos transformer para la detección de entidades nombradas forman parte del instalador. No se necesita ninguna descarga durante la ejecución.
Pipeline de detección local. Regex, NLP y ML se ejecutan todos en la CPU local — o GPU si está disponible. El motor basado en Presidio dentro de anonym.legal no realiza llamadas de red durante una ejecución.
Bóveda local cifrada. Las configuraciones, preajustes y claves se almacenan localmente. La bóveda usa cifrado AES-256-GCM y derivación de clave Argon2id. Sin sincronización en la nube. Sin copia de seguridad remota. La bóveda permanece en el dispositivo.
E/S de archivos local. Los archivos de entrada vienen del almacenamiento local. Los archivos de salida vuelven al almacenamiento local. Ningún dato cruza ninguna interfaz de red.
Superficie de ataque pequeña. La aplicación Desktop usa Tauri 2.0 (basado en Rust). Tauri tiene una superficie de ataque mucho menor que Electron (basado en Chromium). Su binario es aproximadamente diez veces más pequeño. También llama a menos APIs del sistema operativo por defecto.
Tres escenarios reales de cumplimiento
Documentos ITAR — 500 archivos
Una empresa de defensa necesita compartir documentos técnicos con un socio extranjero bajo una excepción de licencia. Los archivos contienen nombres de personas de EE. UU. y datos de personal. Ambos deben eliminarse primero.
Necesidades clave: procesamiento solo en estaciones de trabajo autorizadas. Ningún dato enviado fuera de la red autorizada. Un rastro de auditoría que demuestre el trabajo realizado. Soporte por lotes para 500+ archivos.
La aplicación Desktop procesa todos los archivos DOCX 500+ localmente en modo por lotes. No se realiza ninguna llamada de red durante la ejecución. El registro de auditoría permanece en la bóveda local. El resultado cumple con los requisitos de la excepción de licencia ITAR.
Agencia federal alemana — Datos de quejas
Una agencia federal alemana debe eliminar datos personales de los registros de quejas ciudadanas. Luego envía los registros a un instituto de investigación. Las directrices del BfDI prohíben el procesamiento en sistemas no gubernamentales.
La aplicación Desktop se ejecuta en estaciones de trabajo Windows 11 de la agencia. Todo el procesamiento es local. El equipo de seguridad de TI lo confirma con monitoreo de tráfico — cero conexiones externas durante la ejecución.
Investigación hospitalaria — De-identificación de EHR
Un equipo de investigación hospitalaria necesita anonimizar registros de pacientes para un ensayo clínico. HIPAA Safe Harbor requiere eliminar 18 tipos de identificadores. La red clínica no tiene acceso a internet.
La aplicación Desktop maneja el procesamiento por lotes de exportaciones de EHR en formato CSV y JSON. El oficial de privacidad revisa el resultado frente a las normas Safe Harbor antes de que el conjunto de datos vaya a los socios de investigación.
Qué buscar en una herramienta sin conexión
| Capacidad | Por qué importa |
|---|---|
| Completamente sin conexión tras la instalación | Sin dependencia de internet durante el procesamiento |
| Modelos NLP integrados | No se necesita paso de descarga |
| Procesamiento por lotes | Manejar grandes volúmenes sin trabajo manual |
| Bóveda local cifrada | Almacenamiento seguro de configuraciones y claves |
| Registro de auditoría | Registros necesarios para revisiones de cumplimiento |
| Soporte Windows, macOS, Linux | Cubre tipos de estaciones de trabajo clasificadas |
| Opción sin telemetría | Detiene que los datos salgan por telemetría |
| Soporte de formatos de archivo | DOCX, PDF, TXT, CSV, JSON, Excel |
Las normas de datos empujan a los equipos hacia herramientas locales
La multa de 530 M€ a TikTok desencadenó una oleada más amplia de multas. Los equipos de la UE que usaban herramientas en la nube ahora hacen una nueva pregunta. ¿El procesamiento en los servidores de un proveedor satisface el Capítulo V del RGPD y las leyes nacionales de datos?
La respuesta más clara a «¿adónde van sus datos?» es esta: a ningún lado — nunca salen del dispositivo. El procesamiento local elimina la pregunta de transferencia del RGPD por completo.
Para los equipos alemanes, la lectura estricta de los artículos 44–46 del DSGVO hace del procesamiento local una elección inteligente. Esto se aplica incluso sin restricciones de red estrictas. Nuestra descripción general de seguridad explica cómo el procesamiento local elimina la cadena de datos de terceros.
Notas prácticas de despliegue
Instalación en sistemas air-gapped. El instalador — Windows .exe o .msi, macOS .dmg, Linux .AppImage o .deb — se transfiere a la red air-gapped por USB o transferencia de archivos segura. No se necesita internet después de la instalación.
Soporte de idiomas. 24 modelos específicos de idioma se incluyen con la aplicación. El conjunto completo está disponible sin conexión sin descarga adicional.
Necesidades de hardware. El pipeline NLP se ejecuta en estaciones de trabajo modernas sin GPU. El procesamiento por lotes de 1.000 documentos suele tardar entre 5 y 15 minutos. La velocidad depende del tamaño del documento y la velocidad de la CPU.
Configuración de licencia sin conexión. Para redes donde un servidor de licencias no es accesible, está disponible la configuración de licencia sin conexión.
Cuándo el air-gapping no es la solución adecuada
Los sistemas air-gapped resuelven problemas específicos. También añaden una carga real.
Fricción de actualización. Mantener los modelos y el software actualizados requiere pasos manuales. Los equipos que se quedan atrás pueden perderse nuevos patrones PII.
Overhead de vinculación. Los sistemas air-gapped no pueden conectarse a herramientas SIEM en la nube ni a paneles de auditoría remotos. Se necesitan soluciones de data-diode personalizadas. Esto aumenta los costos.
Compromisos de precisión. Las herramientas en la nube actualizan los datos de entrenamiento de forma continua. Los modelos sin conexión son una instantánea. Pueden quedarse atrás frente a nuevos patrones lingüísticos con el tiempo.
No necesario para cada modelo de amenaza. Los equipos sin mandatos gubernamentales, de salud o legales pueden encontrar las herramientas en la nube más prácticas. El cifrado fuerte, las auditorías SOC 2 Tipo II y los acuerdos de procesamiento de datos cubren la mayoría de los casos. El air-gapping solo vale la pena cuando el modelo de amenaza realmente incluye el robo de datos por red por parte de un adversario cualificado.
Para la mayoría de las pymes y equipos de empresa estándar, el cifrado fuerte en tránsito y en reposo proporciona protección adecuada. Los controles contractuales sólidos cubren la mayoría de los casos — sin la carga del air-gapping completo. Consulta nuestras FAQ para más información sobre cómo elegir el modelo de despliegue adecuado.
La aplicación Desktop de anonym.legal (Windows, macOS, Linux) procesa PII completamente de forma local con modelos NLP integrados. No se requiere conexión a internet después de la instalación. El procesamiento por lotes admite 1–5.000 archivos por ejecución según el nivel del plan.
Fuentes
- DISA FedRAMP vs ITAR — Descripción general de Paramify — VERIFIED-EXTERNAL
- RGPD Capítulo V — Transferencias internacionales — VERIFIED-EXTERNAL
- Acción de aplicación de TikTok 530 M€ DPC (mayo de 2025) — VERIFIED-EXTERNAL
- Modelo de seguridad de Tauri — VERIFIED-EXTERNAL
- De-identificación HIPAA Safe Harbor — 45 CFR 164.514 — VERIFIED-EXTERNAL