Mengapa Regex, Bukan AI?

Untuk kepatuhan regulasi, Anda memerlukan hasil yang dapat Anda jelaskan dan reproduksi. Pendekatan deterministik kami memberikan tepat itu—tanpa kotak hitam, tanpa kejutan.

Perbandingan Detail

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Data Terstruktur
Pola Regex
Email, SSN, kartu kredit, IBAN, nomor telepon
Nama & Organisasi
Model ML (spaCy, Stanza)
Nama orang, nama perusahaan, lokasi
48 Bahasa
XLM-RoBERTa
Pengenalan entitas lintas bahasa
Reproduksibilitas
100% Dapat Direproduksi
Input yang sama = output yang sama, setiap saat
Deteksi Nama
Akurasi Tinggi ML
Model NLP terbukti dengan skor kepercayaan
Auditabilitas
+Sepenuhnya Dapat Diaudit
Posisi, jenis, kepercayaan untuk setiap entitas

Cara Kerja Pencocokan Pola

Setiap jenis entitas memiliki pola regex yang dirancang dengan cermat yang cocok dengan format tertentu.

Alamat Email

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Cocok dengan format email standar: local-part@domain.tld

Nomor Kartu Kredit

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Cocok dengan format Visa, Mastercard, Amex, dan format kartu lainnya dengan validasi Luhn

IBAN Jerman

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Cocok dengan format IBAN Jerman dengan spasi opsional

Dibangun untuk Kepatuhan

Ketika auditor bertanya "mengapa ini terdeteksi?" Anda memerlukan jawaban yang jelas. Pendekatan berbasis regex kami memberikan tepat itu.

  • GDPR Pasal 25: Privasi dengan desain yang dapat dijelaskan
  • ISO 27001: Proses yang terdokumentasi dan dapat diulang
  • Jejak Audit: Setiap deteksi dapat dilacak ke pola tertentu

Contoh Respon Audit

T: Mengapa "john.smith@company.com" ditandai?
J: Cocok dengan pola email di posisi 45-68 dengan kepercayaan 0.95. Pola: validasi format email standar.

Rasakan Deteksi Deterministik

Coba deteksi PII berbasis regex kami secara gratis dengan 200 token per siklus.