By · Last updated 2026-05-31

Kembali ke BlogGDPR & Kepatuhan

Lebih dari Sekadar SSN: Anonimisasi ID Internal

Setiap organisasi memiliki pengidentifikasi internal — ID karyawan, nomor akun, ID pesanan — yang dapat mengidentifikasi seseorang dalam konteks tertentu, tetapi terlewatkan oleh alat PII standar.

May 31, 20267 menit baca
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

Lebih dari Sekadar SSN: Mengaburkan ID Internal Organisasi Anda

Alat GDPR Anda menghapus alamat email. Menghapus nomor telepon. Menghapus nama. Anda menjalankan ekspor dukungan melaluinya. Lalu Anda berbagi hasilnya dengan tim analitik Anda.

Nomor akun pelanggan Anda masih ada di setiap tiket. ID pesanan Anda masih ada. ID pengguna internal Anda pun masih ada.

ID ini terlihat tidak berbahaya jika berdiri sendiri. Tanpa tabel pencarian, ID tersebut tidak menyebutkan nama seseorang. Tetapi tim analitik Anda memiliki tabel itu. CRM Anda memilikinya. Database dukungan Anda memilikinya. Siapa pun yang memiliki akses bisa menemukan orangnya dalam hitungan detik.

Ini adalah kegagalan GDPR. Alatnya tidak rusak. Alat itu tidak pernah diberitahu untuk mencari ID Anda.

Apa yang Dideteksi Alat PII Standar

Alat PII standar mencakup format universal. Mereka menangkap apa yang digunakan setiap organisasi.

Alat standar mendeteksi:

  • Nomor jaminan sosial (US SSN, UK NINO, format ID nasional EU)
  • Alamat email
  • Nomor telepon
  • Nomor kartu kredit
  • Nama
  • Nomor paspor dan SIM

Alat standar tidak mendeteksi:

  • ID karyawan dalam format EMP-XXXXX Anda
  • Nomor akun pelanggan dalam format ACC-XXXXXXXX-XX Anda
  • ID pesanan dalam format ORD-XXXXXXX Anda
  • ID pengguna internal dalam format UUID atau kustom
  • Kode referensi khusus mitra

Alat standar menemukan pola universal. ID internal Anda bukan pola universal. Mereka membutuhkan pengaturan kustom untuk dapat ditemukan.

Risiko Re-Identifikasi

Sebuah perusahaan mengekspor tiket dukungan untuk tinjauan kualitas. Penghapusan PII standar menghilangkan nama, email, dan nomor telepon. Nomor akun dalam format ACC-XXXXXXXX-XX tidak disentuh.

Ekspor tersebut dikirim ke tim analitik. Seorang analis menggabungkan tabel tiket dengan database pelanggan berdasarkan nomor akun. Orangnya langsung ditemukan. Tidak diperlukan trik khusus. Ini adalah operasi SQL rutin.

GDPR Pasal 4(5) mendefinisikan pseudonymisasi sebagai pemrosesan di mana data "tidak dapat lagi dikaitkan dengan subjek data tertentu tanpa menggunakan informasi tambahan." Nomor akun gagal dalam uji tersebut. Informasi tambahan — database pelanggan Anda — ada tepat di dalam organisasi Anda.

Ekspor yang "dianonimkan" ternyata bukan anonim.

Membangun Pola Entitas Kustom

Pengaturan entitas kustom cepat dilakukan. Tim kepatuhan bisa melakukannya tanpa bantuan rekayasa.

Langkah 1: Daftarkan format ID Anda.

Tuliskan setiap satu. Misalnya: akun ACC-XXXXXXXX-XX, ID pesanan ORD-XXXXXXX, ID karyawan EMP-XXXXX.

Langkah 2: Deskripsikan format dalam bahasa sederhana.

"Nomor akun dimulai dengan ACC, lalu tanda hubung, lalu 8 digit, lalu tanda hubung, lalu 2 huruf kapital."

Generasi pola berbantuan AI menghasilkan: ACC-\d{8}-[A-Z]{2}

Langkah 3: Uji pada data sampel.

Unggah 20 hingga 30 dokumen. Konfirmasi semua instance ditemukan. Konfirmasi tidak ada temuan palsu.

Langkah 4: Pilih metode.

Untuk ID yang digunakan sebagai kunci join, di mana analisis perlu menghubungkan catatan:

  • Pseudonymisasi. Ganti ACC-00123456-AB dengan ACC-99876543-XY setiap kali. Input yang sama selalu menghasilkan output yang sama. Join masih berfungsi. Nilai asli tidak bisa ditemukan tanpa kunci.

Untuk ID yang tidak diperlukan dalam analisis:

  • Redaksi. Ganti dengan [REDACTED]. Sederhana. Permanen.

Langkah 5: Simpan sebagai preset bersama.

Simpan entitas kustom — atau sekumpulan entitas — ke preset bersama. Pengaturan berlaku untuk semua penggunaan: unggahan batch, panggilan API, antarmuka browser. Anggota tim baru mendapatkan konfigurasi lengkap sekaligus.

Studi Kasus: 180.000 Tiket Dukungan

Sebuah perusahaan menemukan 180.000 tiket dukungan di gudang analitik mereka. Nama dan email telah dihapus. Nomor akun belum. Setiap tiket masih menyimpan nilai ACC-XXXXXXXX-XX yang aktif.

Timeline penyelesaian:

  1. Petugas kepatuhan mendefinisikan pola ACC — 15 menit
  2. Mengujinya pada 30 tiket sampel — 20 menit
  3. Mengonfirmasi akurasi — 10 menit
  4. Memproses 180.000 tiket dalam batch semalam
  5. Mengganti tabel gudang data dengan versi yang bersih

Total waktu bagi petugas kepatuhan: 45 menit. Tanpa dukungan entitas kustom, perbaikan akan membutuhkan tiket rekayasa, tinjauan kode, dan deploy. Itu butuh berminggu-minggu, bukan berjam-jam.

Untuk melihat lebih dekat bagaimana ID kustom menciptakan risiko dalam alat dukungan AI, lihat panduan GDPR dan dukungan AI.

Di Mana ID Kustom Menyebar

ID internal muncul di lebih banyak tempat daripada yang diperkirakan kebanyakan tim.

Dokumen internal:

  • Catatan rapat dengan referensi akun atau ID pesanan
  • Thread email tentang kasus pelanggan
  • Presentasi dengan data studi kasus

Dibagikan kepada pihak ketiga:

  • Laporan kepada regulator dengan nomor referensi kasus
  • File audit dengan referensi pelanggan
  • File vendor yang membawa ID pelanggan

Penelitian dan analitik:

  • Dataset perjalanan pelanggan
  • Ekspor tinjauan kualitas dukungan
  • Data pelatihan untuk model ML internal

Setiap konteks membutuhkan pengaturan entitas kustom yang sama untuk menghasilkan output yang benar-benar anonim.

Pseudonymisasi vs. Anonimisasi

GDPR menarik garis yang jelas.

Pseudonymisasi mengganti ID dengan pengganti. Orang asli dapat ditemukan kembali jika seseorang memiliki tabel pencarian. Data ini masih merupakan data pribadi. Ini mengurangi risiko. Ini tidak menghapus kewajiban GDPR Anda.

Anonimisasi menghilangkan kemampuan untuk mengidentifikasi kembali. Data anonim bukan data pribadi. GDPR tidak berlaku untuk data tersebut.

Nomor akun dan ID pesanan bersifat pseudonim ketika tabel pencarian ada. Menggantinya dengan pengganti tetap menurunkan risiko, tetapi GDPR tetap berlaku. Menggantinya dengan token acak — dan menghapus kuncinya — menghapus kewajiban GDPR, tetapi merusak analisis berbasis join.

Untuk berbagi dengan pihak ketiga yang tidak memiliki tabel pencarian Anda: pseudonymisasi mungkin sudah cukup. Untuk analitik internal, diperlukan anonimisasi penuh atau kontrol akses yang ketat. Panduan kepatuhan hukum mencakup cara mendokumentasikan setiap pendekatan untuk ROPA Anda.

Kesimpulan

Kesenjangan ini bukan kegagalan alat. Ini adalah kesenjangan pengaturan. Tidak ada alat yang bisa mengetahui format nomor akun Anda kecuali Anda memberitahukannya.

Pengaturan entitas kustom menutup kesenjangan dalam hitungan jam. Tim kepatuhan mendefinisikan format, mengujinya pada data sampel, dan menerapkannya di semua mode penggunaan. Tidak diperlukan bantuan rekayasa.

180.000 nomor akun yang tidak diredaksi itu bukan karena alatnya gagal. Itu ada karena alat tidak pernah diberitahu untuk mencarinya.

Sumber

Siap untuk melindungi data Anda?

Mulai anonimisasi PII dengan 285+ jenis entitas dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.