Zasada izolacji sieciowej
Niektóre sieci nie mają dostępu do internetu. Nie z powodu polityki – z założenia projektowego.
SCIF (Sensitive Compartmented Information Facility) to pomieszczenie z klatką Faradaya. Żaden sygnał bezprzewodowy nie przedostaje się do środka ani na zewnątrz. ITAR (International Traffic in Arms Regulations) zabrania wysyłania objętych nim treści technicznych do nieuprawnionych podmiotów. Dostawcy chmury nie posiadają poświadczenia ITAR. Dla tych środowisk „chmurowy SaaS” to nie ryzyko do zarządzania – to opcja wykluczona z góry.
W takich lokalizacjach narzędzia chmurowe po prostu nie działają.
Narzędzie wymagające aktywnego połączenia sieciowego nie może tutaj funkcjonować. Narzędzie odwołujące się do serwera licencyjnego jest zablokowane. Narzędzie wysyłające pliki do chmurowego API w celu wykrywania nie może działać wewnątrz SCIF. To nie są przypadki brzegowe – to codzienne ograniczenia dla zespołów obronnych.
Przypadek ITAR
Naukowiec pracująca w firmie obronnej posiada rejestry kadrowe objęte ITAR. Musi usunąć imiona, nazwiska i numery identyfikacyjne przed udostępnieniem plików. Jej sieć jest izolowana.
Nie ma rozwiązania chmurowego. Jedyną ścieżką jest narzędzie działające na lokalnym urządzeniu. Musi przechowywać modele lokalnie. Musi generować czysty wynik bez żadnych zewnętrznych wywołań.
Aplikacja desktopowa oparta na Tauri 2.0 spełnia te wymagania. Po zainstalowaniu podczas przebiegu nie są wykonywane żadne wywołania sieciowe. Modele NER spaCy oraz wzorce wyrażeń regularnych działają wyłącznie na lokalnym procesorze. Wyniki pozostają na urządzeniu do momentu wyeksportowania przez użytkownika.
Dlaczego odwracalność ma znaczenie
Prace klasyfikowane często wymagają odwracalnej pseudonimizacji. Zespoły zastępują prawdziwe nazwiska kodami. Zachowują użyteczność rekordów. Chronią prawdziwe tożsamości.
Artykuł 4 ust. 5 RODO definiuje pseudonimizację jako formalny środek ochrony prywatności. Obniża ryzyko. Dane pseudonimizowane podlegają mniejszej liczbie obowiązków prawnych – pod warunkiem, że token wyszukiwania jest przechowywany oddzielnie od zbioru danych.
Badania IAPP z 2024 r. wykazały, że jedynie 23% narzędzi obsługuje prawdziwą odwracalność. Większość stosuje jednokierunkowe maskowanie lub pełne zastępowanie. Po nadpisaniu rekordu nie da się go odtworzyć.
Niektóre zespoły rządowe dzielą swoją pracę według przedziałów klasyfikacji. Jeden zespół otrzymuje pseudonimizowane pliki. Przeprowadza analizę. Drugi zespół przechowuje token wyszukiwania. Dokonuje ponownej identyfikacji rekordów wyłącznie gdy wymaga tego prawo. Taki podzielony projekt to jedyne bezpieczne podejście dla wielozespołowych przepływów pracy w środowiskach niejawnych.
Model wiedzy zerowej idzie o krok dalej. Token wyszukiwania jest tworzony na urządzeniu klienta. Nigdy nie jest wysyłany na zewnątrz. Jeśli dostawca otrzyma wezwanie sądowe, nie może przekazać tokena. Nigdy go nie miał. Spełnia to wymogi dotyczące łańcucha dowodowego w wielu środowiskach niejawnych.
Separacja tokenów wg EDPB
Wytyczne EDPB 05/2022 stanowią, że token pseudonimizacji musi być przechowywany oddzielnie. Nie może znajdować się u tego samego podmiotu, który przechowuje pseudonimizowane rekordy. Ewentualnie musi być zabezpieczony kontrolami uniemożliwiającymi temu podmiotowi jednoczesny dostęp do rekordów i tokena.
Trzy elementy łącznie spełniają ten wymóg:
- Token tworzony na urządzeniu klienta – nigdy niewychodząc na zewnątrz
- Całe przetwarzanie odbywa się lokalnie – nic nie opuszcza środowiska z izolacją sieciową
- Wynik i token są eksportowane oddzielnie – dwa osobne pliki, dwie osobne ścieżki
Ten projekt spełnia jednocześnie wymóg EDPB i ograniczenie izolacji sieciowej.
Pełny obraz znajdziesz w naszym przeglądzie bezpieczeństwa, który pokazuje, jak lokalne przetwarzanie eliminuje łańcuch podmiotów trzecich. Nasz przewodnik po zgodności omawia zasady transferu danych zgodnie z RODO. W FAQ znajdziesz pomoc dotyczącą konfiguracji.
Aplikacja desktopowa anonym.legal uruchamia całe wykrywanie danych osobowych na lokalnym urządzeniu. Po zainstalowaniu internet nie jest potrzebny. Obsługuje systemy Windows, macOS i Linux. Dołączone modele NLP obsługują 24 języki.
Zaktualizowano dla roku 2026
Źródła
- Wytyczne EDPB 05/2022: pseudonimizacja i separacja tokenów – ZWERYFIKOWANE-ZEWNĘTRZNE
- IAPP 2024: badanie odwracalności narzędzi do anonimizacji – OZNACZONE
- LocalAI Master: AI z izolacją sieciową dla środowisk wrażliwych – ZWERYFIKOWANE-ZEWNĘTRZNE