anonym.legal

By · Last updated 2026-06-05

Πίσω στο BlogGDPR & Συμμόρφωση

ΑΠΔΠΧ Ελλάδα: Ανίχνευση ΑΦΜ & ΑΜΚΑ

Ο ελληνικός ΑΦΜ ανιχνεύεται με 52% ακρίβεια από γενικά εργαλεία. Η ΑΠΔΠΧ εξέδωσε 89 αποφάσεις το 2024 — αύξηση 162% από το 2022. Ο τουρισμός και η ναυτιλία αντιμετωπίζουν ιδιαίτερες προκλήσεις.

June 5, 20267 λεπτά ανάγνωσης
Greece HDPAAFM AMKA detectionGreek alphabet NERtourism GDPRGreek identifiers

Η Αρχή Προστασίας Δεδομένων Προσωπικού Χαρακτήρα (ΑΠΔΠΧ) εξέδωσε 89 αποφάσεις επιβολής το 2024, αύξηση 162% σε σχέση με τις 34 αποφάσεις του 2022. Η απότομη επιτάχυνση αυτή αντανακλά τόσο την αυξανόμενη ικανότητα της ΑΠΔΠΧ όσο και τις αδυναμίες συμμόρφωσης σε συγκεκριμένους τομείς — στον τουρισμό, που αντιπροσωπεύει το 38% των υποθέσεων, και στις θαλάσσιες επιχειρήσεις.

ΑΦΜ: Το Κύριο Εμπορικό Αναγνωριστικό της Ελλάδας

Ο ΑΦΜ (Αριθμός Φορολογικού Μητρώου) είναι ένας 9ψήφιος αριθμός που αποδίδεται σε όλους τους Έλληνες πολίτες, τους κατοίκους και τις επιχειρήσεις για φορολογικούς σκοπούς. Το ψηφίο ελέγχου χρησιμοποιεί αλγόριθμο σταθμισμένου αθροίσματος: τα ψηφία 1–8 πολλαπλασιάζονται με βάρη (256, 128, 64, 32, 16, 8, 4, 2), αθροίζονται και λαμβάνεται το modulo 11. Αν το αποτέλεσμα είναι 10, ο αριθμός είναι άκυρος· διαφορετικά, το ψηφίο ελέγχου ισούται με το αποτέλεσμα modulo 10.

Ο ΑΦΜ εμφανίζεται σε όλα τα ελληνικά εμπορικά έγγραφα — τιμολόγια, συμβόλαια, συμβάσεις εργασίας και κρατικά έντυπα. Αποτελεί το βασικό εμπορικό αναγνωριστικό τόσο για φυσικά όσο και για νομικά πρόσωπα στην Ελλάδα.

Ακρίβεια ανίχνευσης: Τα γενικά εργαλεία NLP ανιχνεύουν τον ΑΦΜ με 52% ακρίβεια (ανάλυση ΑΠΔΠΧ 2024). Τα κυριότερα σφάλματα:

  • Η 9ψήφια μορφή του ΑΦΜ ταιριάζει με πολλούς αριθμούς αναφοράς και στοιχεία ημερομηνίας σε ελληνικά έγγραφα
  • Ο διπλός αλγόριθμος ελέγχου modulo-11/modulo-10 δεν υλοποιείται συχνά σε γενικά εργαλεία
  • Σε ελληνικά έγγραφα, ο ΑΦΜ εμφανίζεται συχνά χωρίς ρητή ετικέτα (ενσωματωμένος σε μπλοκ διευθύνσεων, χωρίς την ένδειξη «ΑΦΜ:»)

ΑΜΚΑ: Το Αναγνωριστικό Κοινωνικής Ασφάλισης της Ελλάδας

Ο ΑΜΚΑ (Αριθμός Μητρώου Κοινωνικής Ασφάλισης) είναι ένας 11ψήφιος αριθμός που κωδικοποιεί ημερομηνία γέννησης και φύλο:

  • Ψηφία 1–6: Ημερομηνία γέννησης σε μορφή ΗΜΜΜΕΕ
  • Ψηφίο 7: Φύλο (μονό = άρρεν, ζυγό = θήλυ)
  • Ψηφία 8–11: Αύξων αριθμός με ψηφίο ελέγχου

Η κωδικοποίηση ημερομηνίας γέννησης και φύλου καθιστά τον ΑΜΚΑ δομικά παρόμοιο με το σουηδικό personnummer — και δημιουργεί το ίδιο ζήτημα ειδικής κατηγορίας δεδομένων κατά ΓΚΠΔ: ο αριθμός αποκαλύπτει το βιολογικό φύλο ως μαρτυρία αρχείου.

Ο ΑΜΚΑ εμφανίζεται σε όλα τα ελληνικά έγγραφα υγείας, τις αναφορές κοινωνικής ασφάλισης και τα αρχεία εργοδοτών. Κάθε Έλληνας πολίτης και νόμιμος κάτοικος διαθέτει ΑΜΚΑ, που ισοδυναμεί με αριθμό κοινωνικής ασφάλισης για πρόσβαση σε υπηρεσίες υγείας και κοινωνικής πρόνοιας.

Ελληνικό Αλφάβητο: Η Πρόκληση της Υποδομής NLP

Τα ελληνικά κείμενα χρησιμοποιούν το ελληνικό αλφάβητο — ένα εντελώς διαφορετικό σύστημα γραφής από τις γλώσσες με λατινικό αλφάβητο. Αυτό δημιουργεί θεμελιώδη πρόκληση για την ανίχνευση PII:

Περιοχές Unicode: Οι ελληνικοί χαρακτήρες εντοπίζονται στην περιοχή Unicode U+0370 έως U+03FF (ελληνικό και κοπτικό μπλοκ) και U+1F00 έως U+1FFF (εκτεταμένο ελληνικό για πολυτονικές μορφές). Εργαλεία που επεξεργάζονται μόνο ASCII ή Latin Extended δεν μπορούν να αναλύσουν ελληνικά κείμενα.

Μοντέλα NER για ελληνικά: Το μοντέλο el_core_news της spaCy παρέχει δυνατότητα ελληνικής NER — αλλά απαιτεί ρητή ρύθμιση ελληνικής γλώσσας. Οργανισμοί που χρησιμοποιούν διαμορφώσεις για άλλες γλώσσες (συνήθως αγγλικά) δεν θα λάβουν αποτελέσματα για ελληνόγλωσσα έγγραφα.

Έγγραφα μεικτής γραφής: Τα ελληνικά επιχειρηματικά και κρατικά έγγραφα συχνά συνδυάζουν ελληνική γραφή (κύριο περιεχόμενο) με λατινική (εμπορικές επωνυμίες, τεχνικοί όροι, αγγλικές σημειώσεις). Οι αγωγοί NLP πρέπει να χειρίζονται και τα δύο συστήματα γραφής στο ίδιο έγγραφο.

Αναγνώριση ονομάτων στα ελληνικά: Τα ελληνικά ονόματα εμφανίζονται σε ονομαστική πτώση (Γεώργιος Παπαδόπουλος) αλλά και σε γενική/αιτιατική μορφή (Γεωργίου Παπαδόπουλου σε γενική). Η πτωτικά ευαίσθητη αναγνώριση NER απαιτεί μορφολογική ανάλυση των ελληνικών.

Τουριστικός Τομέας: Εποχική Συμμόρφωση στην Επεξεργασία Δεδομένων

Ο τουρισμός αντιπροσωπεύει το 38% των υποθέσεων επιβολής της ΑΠΔΠΧ. Η πρόκληση συμμόρφωσης είναι η κλίμακα και η εποχικότητα:

Συστήματα PMS ξενοδοχείων: Τα συστήματα διαχείρισης ακινήτων επεξεργάζονται πλήρη στοιχεία επισκεπτών — αριθμούς διαβατηρίων, εθνικότητα, ημερομηνίες γέννησης, στοιχεία επικοινωνίας — για όλους τους επισκέπτες. Η ΑΠΔΠΧ διαπίστωσε ότι πολλά συστήματα PMS διατηρούσαν δεδομένα επισκεπτών για 5+ χρόνια χωρίς τεκμηριωμένο σκοπό και χωρίς μέτρα ασφαλείας ανάλογα του όγκου των δεδομένων.

IBAN και δεδομένα πληρωμής: Οι ελληνικές τουριστικές επιχειρήσεις επεξεργάζονται δεδομένα πληρωμής από επισκέπτες εντός και εκτός ΕΕ. Τα φύλλα παρακολούθησης επισκεπτών (ξενοδοχειακοί λογαριασμοί) περιέχουν μερικούς αριθμούς καρτών· τα συστήματα κρατήσεων περιέχουν πλήρη στοιχεία πληρωμής με ημερομηνίες λήξης. Η συμμόρφωση με το PCI DSS επικαλύπτεται με τις απαιτήσεις ΓΚΠΔ για δεδομένα πληρωμής.

Εναλλαγή εποχικού προσωπικού: Οι εποχικοί εργαζόμενοι στον τουρισμό συμπληρώνουν συνήθως συμβάσεις 4–6 μηνών. Η ΑΠΔΠΧ διαπίστωσε επανειλημμένες αδυναμίες ανάκλησης πρόσβασης σε συστήματα για εποχικούς υπαλλήλους που αποχώρησαν — ένα πρότυπο κοινό σε κλάδους με υψηλή εναλλαγή εργαζομένων.

Για συμμόρφωση με την ΑΠΔΠΧ σε ελληνόγλωσσα περιβάλλοντα: η ανίχνευση ΑΦΜ και ΑΜΚΑ με επικύρωση αθροίσματος ελέγχου, η υποστήριξη NER ελληνικού αλφαβήτου (spaCy el_core_news) και η ανίχνευση ελληνικών διαβατηρίων/αστυνομικών ταυτοτήτων αποτελούν τις τεχνικές απαιτήσεις. Για ειδική συμμόρφωση στον τουριστικό τομέα, η τεκμηρίωση διατήρησης δεδομένων PMS ξενοδοχείων και οι διαδικασίες ανάκλησης πρόσβασης εποχικού προσωπικού είναι οι επιπλέον οργανωτικές απαιτήσεις που αποσαφηνίζει η επιβολή από την ΑΠΔΠΧ.

Πηγές:

Έτοιμοι να προστατεύσετε τα δεδομένα σας;

Ξεκινήστε την ανωνυμοποίηση PII με 285+ τύπους οντοτήτων σε 48 γλώσσες.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.