Bloga DönGDPR & Uyumluluk

SSN'ler ve E-posta Adreslerinin Ötesinde...

Her kuruluşun, bağlamda kişisel olarak tanınabilir olan ancak standart PII araçları tarafından gözden kaçırılan iç tanımlayıcıları vardır...

April 20, 20267 dk okuma
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

SSN'ler ve E-posta Adreslerinin Ötesinde: Kuruluşunuzun Özel Tanımlayıcılarını Anonimleştirmek

GDPR anonimleştirme aracınız e-posta adreslerini tespit eder. Telefon numaralarını tespit eder. İsimleri ve sosyal güvenlik numaralarını tespit eder. Destek biletleri ihracatlarınızı bunun üzerinden çalıştırırsınız, anonimleştirilmiş çıktıyı indirirsiniz ve bunu analiz ekibinizle paylaşırsınız.

Müşteri hesap numaralarınız (ACC-XXXXXXXX-XX formatında) hâlâ her bilette bulunmaktadır. Sipariş kimlikleriniz (ORD-XXXXXXX) hâlâ mevcuttur. İç kullanıcı kimlikleriniz hâlâ oradadır.

Bu tanımlayıcılar izole halde takma adlıdır - bir kişi doğrudan tanımlanamaz, erişim sağlanmadıkça bir arama tablosuna. Ancak analiz ekibinizin bu arama tablosuna erişimi vardır. Destek veritabanınızda mevcuttur. CRM'inizde mevcuttur. Anonimleştirilmiş ihracat, bu sistemlerden herhangi birine erişimi olan herkes tarafından saniyeler içinde yeniden tanımlanabilir.

Bu bir GDPR takma adlandırma başarısızlığıdır - çünkü araç standart PII'yi gözden kaçırmamıştır, ancak kuruluşunuza özgü tanımlayıcılar hakkında bilgi sahibi olamamıştır.

Standart PII Araçlarının Tespit Ettiği Şeyler

Standart PII tespit araçları - temel Microsoft Presidio yapılandırmaları dahil - evrensel tanımlayıcı formatları etrafında inşa edilmiştir:

Kapsananlar:

  • Sosyal güvenlik numaraları (ABD SSN'leri, Birleşik Krallık NINO'ları, AB ulusal kimlik formatları)
  • E-posta adresleri (RFC 5322 formatı)
  • Telefon numaraları (E.164 ve ulusal formatlar)
  • Kredi kartı numaraları (Luhn algoritması doğrulaması)
  • İsimler (NER model tabanlı tespit)
  • Pasaport/sürücü belgesi numaraları (ülke spesifik formatlar)

Kapsanmayanlar:

  • Çalışan kimlik formatınız (EMP-XXXXX)
  • Müşteri hesap numarası formatınız (ACC-XXXXXXXX-XX)
  • Sipariş kimlik formatınız (ORD-XXXXXXX)
  • İç kullanıcı kimliğiniz (UUID veya özel format)
  • İç referans kodlarınız
  • Ortaklara özgü tanımlayıcılar

Standart araçlar evrensel olanı tespit eder. Kuruluş spesifik tanımlayıcılar, tanım gereği, evrensel değildir. Özel yapılandırma gerektirir.

Pratikte Yeniden Tanımlama Riski

Bir finansal hizmetler firması, kalite analizi için müşteri destek biletlerini işler. Standart PII anonimleştirme iş akışı şunları kaldırır:

  • Müşteri isimleri ✓
  • E-posta adresleri ✓
  • Telefon numaraları ✓
  • Hesap numaraları (ACC-XXXXXXXX-XX formatı) ✗ — tespit edilmedi

Bilet ihracı analiz ekibine gider. Bir veri analisti, bilet tablosunu müşteri veritabanıyla hesap numarası üzerinden birleştirir. Yeniden tanımlama anında ve tamdır.

Bu, karmaşık saldırı teknikleri gerektirmez. Bu, herhangi bir analistin destek bileti analizine müşteri demografik bağlamı eklemek için gerçekleştireceği rutin bir SQL birleştirmesidir. "Anonimleştirilmiş" ihracat anonim değildi.

GDPR Madde 4(5), takma adlandırmayı "kişisel verilerin, ek bilgi kullanılmadan belirli bir veri sahibine atfedilemeyecek şekilde işlenmesi" olarak tanımlar. Hesap numaraları, ek bilgi (müşteri veritabanı) kolayca mevcut olduğunda bu testi geçemez.

Özel Varlık Desenleri Oluşturma

Özel varlık oluşturma, teknik olmayan uyum ekipleri için basit bir iş akışı izler:

Adım 1: Tanımlayıcı formatını belirleyin Kuruluşunuza özgü tanımlayıcıları ve formatlarını belgeleyin:

  • Müşteri hesabı: ACC-XXXXXXXX-XX (ACC ön eki, 8 haneli sayı, 2 karakterli son ek)
  • Sipariş ID: ORD-XXXXXXX (ORD ön eki, 7 haneli sayı)
  • Çalışan ID: EMP-XXXXX (EMP ön eki, 5 haneli sayı)
  • İç kullanıcı ID: UUID formatı (8-4-4-4-12 onaltılık)

Adım 2: Tespit desenini oluşturun Formatı sade bir dille tanımlayın: "ACC ile başlayan, ardından bir tire, ardından 8 haneli sayı, ardından bir tire, ardından 2 büyük harf içeren hesap numaraları."

AI destekli desen oluşturma şunu üretir: ACC-d{8}-[A-Z]{2}

Adım 3: Örnek verilerle doğrulayın Tanımlayıcı içeren 20-30 belge yükleyin. Doğrulayın:

  • Tüm örnekler tespit edildi (yanlış negatif yok)
  • Yanlış pozitif yok (yanlışlıkla işaretlenmiş tanımlayıcı olmayan metin)

Adım 4: Anonimleştirme yöntemini yapılandırın Birleştirme anahtarları olarak kullanılan tanımlayıcılar için (birden fazla sistemde yer alan ve analiz için tutarlı olması gereken sipariş ID'leri):

  • Takma adlandır: ACC-00123456-AB'yi tüm belgelerde tutarlı bir şekilde ACC-99876543-XY ile değiştirin. Değiştirme tutarlıdır - aynı girdi her zaman aynı çıktıyı üretir - böylece analitik birleştirmeler hâlâ çalışır. Orijinal değer, anahtar olmadan geri kazanılamaz.

Analiz için gerekli olmayan tanımlayıcılar için:

  • Kırp: [KIRMIZI] ile değiştirin. Daha basit, geri döndürülemez.

Adım 5: Ön ayar olarak kaydedin Özel varlık (veya birden fazla özel varlık) bir ekip ön ayarı olarak kaydedildiğinde, tüm işleme boyunca tutarlı bir şekilde uygulanır - toplu yüklemeler, API çağrıları, tarayıcı arayüzü. Yeni ekip üyeleri otomatik olarak tam yapılandırmayı alır.

Vaka Çalışması: 180.000 Destek Bileti

Bir finansal hizmetler firması, tarihsel destek bilet ihracatlarında (ACC-XXXXXXXX-XX formatında) müşteri hesap numaraları bulmaktadır. Standart PII araçları bunları tamamen gözden kaçırmıştır.

Belirlenen boşluk: Bir uyum incelemesinin ardından, ekip, analiz deposunda 180.000 tarihsel destek biletinin, (zaten anonimleştirilmiş) isimler ve e-postalarla birlikte kırpılmamış hesap numaraları içerdiğini fark etti.

Çözüm zaman çizelgesi:

  1. Uyum görevlisi ACC desenini tanımlar (15 dakika)
  2. 30 örnek biletle test eder (20 dakika)
  3. Desen doğruluğunu onaylar (10 dakika)
  4. 180.000 bileti gece boyunca toplu olarak işler
  5. Depo tablolarını yeniden anonimleştirilmiş versiyonlarla değiştirir

Uyum boşluğunu kapatmak için toplam süre: 45 dakika uyum görevlisi süresi + gece toplu. Özel varlık oluşturma olmadan, bu mühendislik bileti, geliştirme süresi, kod incelemesi ve dağıtım gerektirirdi - haftalar, saatler değil.

Destek Biletlerinin Ötesinde: Özel Tanımlayıcıların Göründüğü Yerler

Özel kuruluş tanımlayıcıları, çoğu uyum ekibinin fark ettiğinden daha fazla belge türünde yayılır:

İç belgeler:

  • Hesap numaraları veya sipariş ID'leri referans alan toplantı notları
  • Müşteri referansları içeren e-posta dizileri
  • Vaka çalışması verileri içeren sunumlar

Üçüncü taraflarla paylaşılan:

  • Vaka referans numaraları ile düzenleyicilere raporlar
  • Denetçilere paylaşılan veriler
  • Müşteri referansları içeren tedarikçi belgeleri

Araştırma ve analiz:

  • Müşteri yolculuğu analizi veri setleri
  • Destek kalite inceleme veri setleri
  • İç ML modelleri için eğitim verileri

Bunların her biri, gerçekten anonim bir çıktı üretmek için aynı özel varlık yapılandırmasını gerektirir.

GDPR Takma Adlandırma ve Anonimleştirme: Teknik Ayrım

GDPR, aşağıdakiler arasında ayrım yapar:

Takma adlandırma: Ek bilgiye erişim ile yeniden tanımlanabilen veriler. Takma adlandırılmış veriler, GDPR kapsamında hâlâ kişisel verilerdir. Düzenleme, takma adlandırmayı risk azaltma önlemi olarak teşvik eder, ancak GDPR yükümlülüklerini ortadan kaldırmaz.

Anonimleştirme: Makul bir şekilde yeniden tanımlanamayacak veriler. Anonim veriler kişisel veri değildir ve GDPR'ye tabi değildir.

Hesap numaraları, sipariş ID'leri ve çalışan ID'leri, arama tabloları mevcut olduğunda takma adlıdır - anonim değildir. Bunları tutarlı takma adlarla değiştirmek (takma adlandırma) riski azaltır, ancak GDPR yükümlülüklerini ortadan kaldırmaz. Bunları rastgele tokenlarla değiştirmek (anahtarın yok edilmesiyle anonimleştirme) GDPR yükümlülüklerini ortadan kaldırır, ancak birleştirmeleri bozar.

Üçüncü taraflarla paylaşım için, arama tablolarınıza erişimi olmayanlar için: takma adlandırma yeterli olabilir (anahtar olmadan yeniden tanımlayamazlar). İç analiz için: tam anonimleştirme veya anahtar üzerinde erişim kontrolleri gereklidir.

Sonuç

Standart PII tespit boşluğu, tespit algoritmalarının teknik bir sınırlaması değildir - bu bir yapılandırma boşluğudur. Hiçbir tespit aracı, kuruluşunuzun hesap numarası formatını bilmez, eğer siz ona söylemezseniz.

Özel varlık oluşturma, bu boşluğu saatler içinde kapatır, haftalar değil. Uyum ekipleri - mühendislik desteği olmadan - kuruluş spesifik desenleri tanımlayabilir, bunları örnek verilerle doğrulayabilir ve tüm işleme modlarında tutarlı bir şekilde uygulayabilir.

Vaka çalışmasında keşfedilen 180.000 kırpılmamış hesap numarası, araç hatası nedeniyle orada değildi. Orada, aracı onlara bakması için asla bilgilendirilmediği için vardı.

Kaynaklar:

Verilerinizi korumaya hazır mısınız?

48 dilde 285+ varlık türü ile PII anonimleştirmeye başlayın.