anonym.legal

By · Last updated 2026-03-03

Πίσω στο BlogΤεχνικά

Ανωνυμοποίηση PII σε Δίκτυα χωρίς Σύνδεση: Offline-First

Το 41% των εταιρικών πολιτικών ασφαλείας απαγορεύει την επεξεργασία διαβαθμισμένων εγγράφων στο νέφος. Εδώ είναι πώς λειτουργεί η τοπική ανωνυμοποίηση PII χωρίς σύνδεση στο διαδίκτυο.

March 3, 20268 λεπτά ανάγνωσης
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Όταν το Δίκτυο Δεν Έχει Έξοδο

Μια επιστήμονας δεδομένων εργάζεται σε αμυντική εταιρεία. Έχει 3.000 αρχεία προσωπικού. Πρέπει να αφαιρέσει ονόματα, αριθμούς Κοινωνικής Ασφάλισης και επίπεδα άδειας. Στη συνέχεια μπορεί να μοιραστεί τα δεδομένα με ερευνητικό εταίρο υπό συμφωνία CUI.

Το δίκτυό της δεν έχει διαδίκτυο. Από σχεδιασμό.

Δοκιμάζει κάθε διαδικτυακό εργαλείο που μπορεί να βρει. Κάθε ένα στέλνει δεδομένα σε εξωτερικό διακομιστή. Κάθε πλατφόρμα νέφους χρειάζεται λογαριασμό και ζωντανή σύνδεση. Ακόμα και εργαλεία «on-premises» συχνά καλούν απομακρυσμένο διακομιστή αδειών.

Αυτό είναι το πρόβλημα ανάπτυξης σε δίκτυα χωρίς σύνδεση. Αφορά πολύ περισσότερες ομάδες από ό,τι οι περισσότεροι περιμένουν.

Ποιος Χρειάζεται Τοπική Αφαίρεση PII

Αμυντικές εταιρείες και κυβερνητικοί φορείς το αντιμετωπίζουν πιο συχνά. Το πρόγραμμα FedRAMP της DISA απαιτεί τα δεδομένα να παραμένουν εντός εγκεκριμένων ορίων δικτύου. Το ITAR περιορίζει τα τεχνικά δεδομένα σε συστήματα ελεγχόμενα από τις ΗΠΑ. Δίκτυα όπως τα JWICS και SIPRNet είναι φυσικά αποκομμένα από σχεδιασμό.

Αλλά η ανάγκη για offline επεξεργασία εκτείνεται πολύ πέρα από διαβαθμισμένες εγκαταστάσεις:

Νοσοκομεία με τμηματοποιημένα δίκτυα. Συστήματα PACS απεικόνισης, πλατφόρμες EHR και βάσεις δεδομένων έρευνας συχνά βρίσκονται σε δίκτυα χωρίς διαδίκτυο από πολιτική.

Χώροι συναλλαγών και εκκαθαριστήρια. Συστήματα ιδιόκτητων συναλλαγών και συστήματα συνδεδεμένα με SWIFT χρησιμοποιούν αυστηρές αποκοπές δικτύου.

Βιομηχανικά συστήματα ελέγχου. Δίκτυα SCADA και κρίσιμες υποδομές λειτουργούν με κενά αέρα ως βασικό μέτρο ασφαλείας. Η σκλήρυνση μετά το Stuxnet το έκανε κανόνα.

Ευρωπαϊκοί κανόνες δεδομένων. Τα Landesdatenschutzgesetze της Γερμανίας και παρόμοιοι νόμοι ΕΕ απαιτούν τοπική επεξεργασία δεδομένων για ευαίσθητα κυβερνητικά και υγειονομικά αρχεία. Το πρόστιμο €530 εκατ. GDPR στο TikTok ήρθε τον Μάιο του 2025. Κάλυπτε μεταφορές δεδομένων στην Κίνα. Αυτό το πρόστιμο ώθησε περισσότερες ομάδες προς τοπικά εργαλεία. Δείτε την επισκόπηση συμμόρφωσης για τους κανόνες μεταφοράς GDPR που ισχύουν.

Γιατί τα Εργαλεία Νέφους Αποτυγχάνουν σε Δίκτυα χωρίς Σύνδεση

Τα περισσότερα εργαλεία αφαίρεσης δεδομένων ακολουθούν μοντέλο SaaS:

Συσκευή Χρήστη → HTTPS → API Προμηθευτή → Μοντέλα NLP → Απόκριση → Συσκευή Χρήστη

Αυτός ο σχεδιασμός χρειάζεται πρόσβαση στο διαδίκτυο στη συσκευή επεξεργασίας. Χρειάζεται εμπιστοσύνη στους διακομιστές του προμηθευτή. Σημαίνει ότι τα δεδομένα διασχίζουν εξωτερικά δίκτυα.

Σε δίκτυο χωρίς σύνδεση, το πρώτο βήμα είναι φυσικά αδύνατο. Για ρυθμιζόμενα περιβάλλοντα, τα βήματα δύο έως τέσσερα μπορεί το καθένα να παραβιάζει κανόνες συμμόρφωσης.

Το αυτόνομο Presidio είναι η συνηθισμένη εναλλακτική. Αλλά χρειάζεται γνώσεις Docker και εγκατάσταση Python. Χρειάζεται επίσης λήψη μοντέλων spaCy, που απαιτεί πρόσβαση στο διαδίκτυο. Και χρειάζεται συνεχή υποστήριξη IT. Οι περισσότερες ομάδες στερούνται όλων αυτών.

Το χάσμα μεταξύ της ευκολίας του νέφους και της πολυπλοκότητας του αυτόνομου συστήματος είναι ακριβώς αυτό που γεμίζουν τα τοπικά εργαλεία επιφάνειας εργασίας.

Πώς Λειτουργεί η Τοπική Αφαίρεση PII

Ένα καλό εργαλείο offline έρχεται με όλα όσα χρειάζεται:

Ενσωματωμένα μοντέλα NLP. Τα μοντέλα spaCy (40–80 MB το καθένα) και μοντέλα transformer για ανίχνευση ονομαστικών οντοτήτων αποτελούν μέρος του εγκατεστημένου προγράμματος. Δεν απαιτείται λήψη κατά την εκτέλεση.

Τοπική διαδικασία ανίχνευσης. Regex, NLP και ML εκτελούνται όλα στον τοπικό CPU — ή GPU εάν είναι διαθέσιμο. Η μηχανή βασισμένη στο Presidio εντός του anonym.legal δεν κάνει κλήσεις δικτύου κατά τη διάρκεια εκτέλεσης.

Κρυπτογραφημένο τοπικό θησαυροφυλάκιο. Οι διαμορφώσεις, τα προεπιλεγμένα και τα κλειδιά αποθηκεύονται τοπικά. Το θησαυροφυλάκιο χρησιμοποιεί κρυπτογράφηση AES-256-GCM και παραγωγή κλειδιού Argon2id. Χωρίς συγχρονισμό νέφους. Χωρίς απομακρυσμένο αντίγραφο ασφαλείας. Το θησαυροφυλάκιο παραμένει στη συσκευή.

Τοπικό I/O αρχείων. Τα αρχεία εισόδου προέρχονται από τοπική αποθήκευση. Τα αρχεία εξόδου επιστρέφουν στην τοπική αποθήκευση. Κανένα δεδομένο δεν διασχίζει οποιαδήποτε διεπαφή δικτύου.

Μικρή επιφάνεια επίθεσης. Η Εφαρμογή Επιφάνειας Εργασίας χρησιμοποιεί Tauri 2.0 (βασισμένο σε Rust). Το Tauri έχει πολύ μικρότερη επιφάνεια επίθεσης από εργαλεία Electron (βασισμένα σε Chromium). Το δυαδικό του είναι περίπου ένα δέκατο του μεγέθους. Καλεί επίσης λιγότερα API λειτουργικού συστήματος από προεπιλογή.

Τρία Πραγματικά Σενάρια Συμμόρφωσης

Έγγραφα ITAR — 500 Αρχεία

Μια αμυντική εταιρεία πρέπει να μοιραστεί τεχνικά έγγραφα με ξένο εταίρο υπό εξαίρεση άδειας. Τα αρχεία περιέχουν ονόματα αμερικανών πολιτών και δεδομένα προσωπικού. Και τα δύο πρέπει να αφαιρεθούν πρώτα.

Βασικές ανάγκες: επεξεργασία μόνο σε εξουσιοδοτημένους σταθμούς εργασίας. Κανένα δεδομένο δεν αποστέλλεται εκτός του εξουσιοδοτημένου δικτύου. Αρχείο ελέγχου που δείχνει ότι η εργασία έγινε. Υποστήριξη μαζικής επεξεργασίας για 500+ αρχεία.

Η Εφαρμογή Επιφάνειας Εργασίας διαχειρίζεται τοπικά όλα τα 500+ αρχεία DOCX σε λειτουργία μαζικής επεξεργασίας. Καμία κλήση δικτύου δεν γίνεται κατά την εκτέλεση. Το αρχείο ελέγχου παραμένει στο τοπικό θησαυροφυλάκιο. Η έξοδος πληροί τις ανάγκες εξαίρεσης άδειας ITAR.

Γερμανική Ομοσπονδιακή Υπηρεσία — Αρχεία Καταγγελιών

Γερμανική ομοσπονδιακή υπηρεσία πρέπει να αφαιρέσει προσωπικά δεδομένα από αρχεία καταγγελιών πολιτών. Στη συνέχεια αποστέλλει τα αρχεία σε ερευνητικό ίδρυμα. Η καθοδήγηση BfDI απαγορεύει την επεξεργασία σε μη κυβερνητικά συστήματα.

Η Εφαρμογή Επιφάνειας Εργασίας εκτελείται σε σταθμούς εργασίας Windows 11 της υπηρεσίας. Όλη η επεξεργασία είναι τοπική. Η ομάδα ασφάλειας IT επιβεβαιώνει αυτό με παρακολούθηση κυκλοφορίας — μηδέν εξωτερικές συνδέσεις κατά την εκτέλεση.

Νοσοκομειακή Έρευνα — Απαναγνωριστικοποίηση EHR

Ερευνητική ομάδα νοσοκομείου πρέπει να αφαιρέσει αρχεία ασθενών για κλινική δοκιμή. Το HIPAA Safe Harbor απαιτεί αφαίρεση 18 τύπων αναγνωριστικών. Το κλινικό δίκτυο δεν έχει πρόσβαση στο διαδίκτυο.

Η Εφαρμογή Επιφάνειας Εργασίας διαχειρίζεται μαζική επεξεργασία εξαγωγών EHR σε μορφή CSV και JSON. Ο Υπεύθυνος Απορρήτου ελέγχει την έξοδο έναντι των κανόνων Safe Harbor πριν το σύνολο δεδομένων μεταβεί σε ερευνητικούς εταίρους.

Τι να Αναζητήσετε σε Εργαλείο Offline

ΔυνατότηταΓιατί Έχει Σημασία
Πλήρως offline μετά την εγκατάστασηΧωρίς εξάρτηση από διαδίκτυο κατά την επεξεργασία
Ενσωματωμένα μοντέλα NLPΧωρίς βήμα λήψης
Μαζική επεξεργασίαΔιαχείριση μεγάλου όγκου χωρίς χειροκίνητη εργασία
Τοπικό κρυπτογραφημένο θησαυροφυλάκιοΑσφαλής αποθήκευση διαμορφώσεων και κλειδιών
Αρχείο ελέγχουΑρχεία απαραίτητα για ελέγχους συμμόρφωσης
Υποστήριξη Windows, macOS, LinuxΚαλύπτει τύπους εξουσιοδοτημένων σταθμών εργασίας
Επιλογή χωρίς τηλεμετρίαΑποτροπή εξόδου δεδομένων μέσω τηλεμετρίας
Υποστήριξη μορφής αρχείουDOCX, PDF, TXT, CSV, JSON, Excel

Οι Κανόνες Δεδομένων Ωθούν Ομάδες προς Τοπικά Εργαλεία

Το πρόστιμο €530 εκατ. στο TikTok πυροδότησε ευρύτερο κύμα προστίμων. Ομάδες ΕΕ που χρησιμοποιούσαν εργαλεία νέφους θέτουν τώρα νέο ερώτημα. Η επεξεργασία στους διακομιστές ενός προμηθευτή ικανοποιεί το Κεφάλαιο V GDPR και τους εθνικούς νόμους περί δεδομένων;

Η πιο καθαρή απάντηση στο «πού πηγαίνουν τα δεδομένα σας;» είναι αυτή: πουθενά — δεν εγκαταλείπουν ποτέ τη συσκευή. Η τοπική επεξεργασία εξαλείφει πλήρως το ερώτημα μεταφοράς GDPR.

Για γερμανικές ομάδες, η αυστηρή ερμηνεία των Άρθρων 44–46 DSGVO καθιστά την τοπική επεξεργασία έξυπνη επιλογή. Αυτό ισχύει ακόμα και χωρίς αυστηρούς περιορισμούς δικτύου. Η επισκόπηση ασφαλείας μας εξηγεί πώς η τοπική επεξεργασία εξαλείφει την αλυσίδα δεδομένων τρίτων.

Πρακτικές Σημειώσεις Ανάπτυξης

Εγκατάσταση σε συστήματα χωρίς σύνδεση. Το πρόγραμμα εγκατάστασης — Windows .exe ή .msi, macOS .dmg, Linux .AppImage ή .deb — μεταφέρεται στο δίκτυο χωρίς σύνδεση μέσω USB ή ασφαλούς μεταφοράς αρχείων. Δεν απαιτείται διαδίκτυο μετά την εγκατάσταση.

Υποστήριξη γλωσσών. 24 γλωσσικά μοντέλα αποστέλλονται με την εφαρμογή. Το πλήρες σύνολο είναι διαθέσιμο offline χωρίς επιπλέον λήψη.

Απαιτήσεις υλικού. Η διαδικασία NLP εκτελείται σε σύγχρονους σταθμούς εργασίας χωρίς GPU. Η μαζική επεξεργασία 1.000 εγγράφων χρειάζεται συνήθως 5–15 λεπτά. Η ταχύτητα εξαρτάται από το μέγεθος του εγγράφου και την ταχύτητα CPU.

Εγκατάσταση άδειας offline. Για δίκτυα όπου ο διακομιστής αδειών είναι εκτός εμβέλειας, η εγκατάσταση άδειας offline είναι διαθέσιμη.

Πότε η Απομόνωση Αέρα Δεν Είναι η Κατάλληλη Επιλογή

Τα συστήματα χωρίς σύνδεση λύνουν συγκεκριμένα προβλήματα. Προσθέτουν όμως και πραγματικό βάρος.

Τριβή ενημερώσεων. Η διατήρηση μοντέλων και λογισμικού ενημερωμένων απαιτεί χειροκίνητα βήματα. Ομάδες που υστερούν μπορεί να χάσουν νέα μοτίβα PII.

Κόστος σύνδεσης. Τα συστήματα χωρίς σύνδεση δεν μπορούν να συνδεθούν με εργαλεία SIEM νέφους ή απομακρυσμένα ταμπλό ελέγχου. Απαιτούνται προσαρμοσμένες λύσεις διόδου δεδομένων. Αυτό αυξάνει το κόστος.

Συμβιβασμοί ακρίβειας. Τα εργαλεία νέφους ενημερώνουν τα δεδομένα εκπαίδευσης συνεχώς. Τα offline μοντέλα είναι ένα στιγμιότυπο. Μπορεί να υστερούν έναντι νέων γλωσσικών μοτίβων με την πάροδο του χρόνου.

Δεν χρειάζεται για κάθε μοντέλο απειλής. Ομάδες χωρίς κυβερνητικές, υγειονομικές ή νομικές εντολές μπορεί να βρίσκουν εργαλεία νέφους πιο πρακτικά. Ισχυρή κρυπτογράφηση, έλεγχοι SOC 2 Type II και συμφωνίες επεξεργασίας δεδομένων καλύπτουν τις περισσότερες περιπτώσεις. Η πλήρης απομόνωση αποδίδει μόνο όταν το μοντέλο απειλής περιλαμβάνει πραγματικά κλοπή δεδομένων μέσω δικτύου από ικανό αντίπαλο.

Για τις περισσότερες ΜΜΕ και τυπικές εταιρικές ομάδες, η ισχυρή κρυπτογράφηση κατά τη μεταφορά και σε κατάσταση ηρεμίας παρέχει επαρκή προστασία. Προσθέστε σταθερούς συμβατικούς ελέγχους και καλύπτετε τις περισσότερες περιπτώσεις — χωρίς το κόστος πλήρους απομόνωσης. Δείτε τις Συχνές Ερωτήσεις για περισσότερα σχετικά με την επιλογή του κατάλληλου μοντέλου ανάπτυξης.


Η Εφαρμογή Επιφάνειας Εργασίας του anonym.legal (Windows, macOS, Linux) επεξεργάζεται PII εντελώς τοπικά με ενσωματωμένα μοντέλα NLP. Δεν απαιτείται σύνδεση στο διαδίκτυο μετά την εγκατάσταση. Η μαζική επεξεργασία υποστηρίζει 1–5.000 αρχεία ανά εκτέλεση ανάλογα με το επίπεδο πλάνου.

Πηγές

Έτοιμοι να προστατεύσετε τα δεδομένα σας;

Ξεκινήστε την ανωνυμοποίηση PII με 285+ τύπους οντοτήτων σε 48 γλώσσες.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.