By · Last updated 2026-06-05

Quay lại BlogGDPR & Tuân Thủ

HDPA Hy Lạp: Phát hiện AFM & AMKA

Công cụ phổ thông chỉ phát hiện AFM của Hy Lạp với độ chính xác 52%. HDPA ban hành 89 quyết định vào năm 2024 — tăng 162% so với năm 2022. Ngành du lịch và hàng hải đối mặt với rủi ro đặc thù.

June 5, 20267 phút đọc
Greece HDPAAFM AMKA detectionGreek alphabet NERtourism GDPRGreek identifiers

HDPA Hy Lạp: Phát hiện AFM và AMKA

Cập nhật năm 2026

Cơ quan bảo vệ dữ liệu của Hy Lạp (HDPA) đã ban hành 89 quyết định thực thi vào năm 2024. Đây là mức tăng 162% so với 34 quyết định vào năm 2022. Du lịch chiếm 38% số vụ HDPA. Hoạt động hàng hải cũng tạo thêm rủi ro.

Xem hướng dẫn tuân thủ GDPR để hiểu bối cảnh thực thi của các DPA quốc gia.

AFM: Mã số đăng ký thuế

ΑΦΜ là mã số thuế gồm 9 chữ số. Mọi công dân, cư dân và doanh nghiệp đều có một mã này.

Checksum: Nhân các chữ số 1–8 với trọng số 256, 128, 64, 32, 16, 8, 4, và 2. Tính tổng các tích. Lấy modulo 11. Nếu kết quả là 10, số đó không hợp lệ. Ngược lại, chữ số kiểm tra là kết quả modulo 10.

AFM xuất hiện trên hóa đơn, hợp đồng và biểu mẫu chính phủ. Đây là ID chính cho cả cá nhân và doanh nghiệp tại Hy Lạp.

Khoảng cách phát hiện: Các công cụ NLP phổ thông chỉ tìm thấy AFM với độ chính xác 52% (HDPA 2024). Có ba nguyên nhân giải thích điều này. Thứ nhất: định dạng 9 chữ số trông giống nhiều mã tham chiếu và phần ngày tháng. Thứ hai: kiểm tra checksum hai bước modulo vắng mặt trong hầu hết các công cụ phổ thông. Thứ ba: con số thường không có nhãn — nó nằm bên trong khối địa chỉ.

Để biết thêm về ID có cấu trúc, xem tài liệu thực thể.

AMKA: Số bảo hiểm xã hội

ΑΜΚΑ là một số gồm 11 chữ số. Chữ số 1–6 mã hóa ngày sinh theo định dạng DDMMYY. Chữ số 7 mã hóa giới tính: lẻ cho nam, chẵn cho nữ. Chữ số 8–11 tạo thành số serial và chữ số kiểm tra.

Thiết kế này tương tự personnummer của Thụy Điển. Cả hai đều đặt ra cùng một mối quan ngại về GDPR. Con số tiết lộ giới tính sinh học như một điểm dữ liệu.

AMKA xuất hiện trong hồ sơ y tế, hồ sơ an sinh xã hội và bảng lương. Mọi công dân và cư dân đều có một mã. Nó đóng vai trò là số chính cho chăm sóc sức khỏe và phúc lợi. Xem trang bảo mật và tuân thủ để biết GDPR áp dụng cho loại dữ liệu này như thế nào.

Khoảng cách hỗ trợ chữ viết

Văn bản Hellenic sử dụng chữ viết khác so với các ngôn ngữ Latin. Đây là thách thức cốt lõi đối với các công cụ PII.

Phạm vi Unicode: Các ký tự Hellenic nằm trong U+0370–U+03FF và U+1F00–U+1FFF. Các công cụ chỉ được xây dựng cho ASCII hoặc chữ Latin sẽ không xử lý được các ký tự này.

Mô hình NER: Mô hình el_core_news của spaCy xử lý NER Hellenic. Nhưng cần thiết lập rõ ràng. Hầu hết các pipeline mặc định chỉ dùng tiếng Anh. Chúng không cho ra kết quả gì với các tài liệu chữ Hellenic.

Tệp tin đa chữ viết: Tài liệu tại Hy Lạp thường trộn lẫn chữ Hellenic và Latin. Tên thương hiệu và thuật ngữ kỹ thuật xuất hiện bằng chữ Latin. Nội dung chính là chữ Hellenic. Pipeline phải xử lý cả hai.

Dạng biến đổi: Tên thay đổi hình thức trong các câu Hellenic. Γεώργιος Παπαδόπουλος ở dạng chủ từ trở thành Γεωργίου Παπαδόπουλου ở dạng sở hữu. Công cụ cần phân tích hình thái học để bắt cả hai dạng.

Xem FAQ để được giải đáp thắc mắc về phát hiện PII đa ngôn ngữ.

Rủi ro tuân thủ trong ngành du lịch

Du lịch chiếm 38% số vụ HDPA. Quy mô và tính thời vụ tạo ra những rủi ro chính.

Lưu giữ dữ liệu PMS: Hệ thống khách sạn thu thập số hộ chiếu, ngày sinh và thông tin liên lạc. HDPA phát hiện nhiều hệ thống lưu giữ dữ liệu này từ 5 năm trở lên. Hầu hết không nêu rõ mục đích. Hầu hết có kiểm soát bảo mật yếu.

Dữ liệu thanh toán: Khách sạn xử lý dữ liệu thẻ từ khách trong nước và quốc tế. Folio chứa số thẻ một phần. Hệ thống đặt chỗ chứa thông tin thẻ đầy đủ. Cả PCI DSS và GDPR đều áp dụng.

Nhân viên thời vụ: Nhân viên khách sạn thường làm hợp đồng 4–6 tháng. HDPA phát hiện nhiều trường hợp quyền truy cập không bị thu hồi khi nhân viên rời đi. Khoảng trống này phổ biến trong các ngành có tỷ lệ luân chuyển cao.

Danh sách kiểm tra kỹ thuật để tuân thủ HDPA

Để xử lý tài liệu bằng tiếng Hellenic, hãy sử dụng bộ công cụ tối thiểu này. Phát hiện AFM cần xác thực checksum modulo hai bước. Phát hiện AMKA cần phân tích chữ số ngày sinh và giới tính. Thêm NER chữ Hellenic qua spaCy el_core_news. Bao gồm phát hiện hộ chiếu và chứng minh nhân dân ở cả hai chữ viết.

Đối với các nhà điều hành du lịch, cần thêm hai bước tổ chức. Thứ nhất: ghi chép thời hạn lưu giữ dữ liệu PMS. Thứ hai: xóa quyền truy cập hệ thống khi nhân viên thời vụ rời đi. Những bước này giải quyết các phát hiện HDPA phổ biến nhất.

Xem giá cả cho các gói API phù hợp với quy trình làm việc nhiều tài liệu trong ngành khách sạn.


anonym.legal phát hiện AFM và AMKA với xác thực checksum đầy đủ. Hỗ trợ NER chữ Hellenic qua pipeline spaCy el_core_news.

Nguồn tham khảo

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.