Karışık Formatlı E-Keşif: Uyumluluk Açığını Kapatmak
Bir belge üretim talebi gelir. Küme beş farklı formattan oluşur: PDF sözleşmeler, Word belgeleri, Excel tablolar, CSV dışa aktarmalar ve JSON günlükleri. Her format ayrı bir araç gerektirir. İşte sorun da tam burada.
2025 Everlaw e-keşif raporuna göre hukuk ekipleri, karışık formatlı üretimler için ortalama 3,2 araç kullanmaktadır. Operasyonel maliyet yüksek. Uyumluluk riski ise daha da yüksek.
Belge üretimlerini nasıl yönettiğimiz için hukuki uyumluluk genel bakışımıza ve güvenlik uygulamalarımıza göz atabilirsiniz.
Araç Parçalanması Neden Açık Yaratır?
Farklı araçlar farklı standartlar anlamına gelir. Üç temel güvenlik açığı bu durumdan kaynaklanır.
Varlık kapsamı araca göre değişir. Adobe Acrobat yalnızca elle girdiğiniz metin dizelerini arar; varlıkları kendiliğinden algılamaz. Bir Word makrosu isim ve e-postaları yakalayabilir, ancak büyük olasılıkla 280'den fazla varlık türünü gözden kaçırır. Excel'in bul-değiştir özelliği yalnızca yazdıklarınızı bulur. Bir PDF'teki ile bir Excel dosyasındaki aynı SSN (Sosyal Güvenlik Numarası) farklı araçlardan farklı muamele görebilir.
Denetim izleri birbirinden ayrışır. Her araç kendi eylemlerini kaydeder; ya da hiç kaydetmez. Bir Veri Koruma Otoritesi (DPO), tüm kişisel verilerin nasıl bulunduğunu ve işlendiğini sorabilir. Üç ayrı araçtan gelen üç ayrı günlük bu soruya zayıf bir yanıttır.
Ayarlar zamanla birbirinden uzaklaşır. Altı ay önce yapılandırılan PDF redaksiyon kural seti, geçen hafta güncellenen Word makrosuyla örtüşmeyebilir. Bu fark, bir üretim hatası gün yüzüne çıkana kadar gizli kalır.
Mahkemeler bu sorunu ele almıştır. E-keşif hatalarına uygulanan yaptırımlarda, tek bir üretimdeki belge türleri arasında tutarsız standartlar uygulanması önemli bir kriter olmuştur. Mahkemeler sistematik bir süreç bekler. Formata özgü araçlar ise bu beklentiyle çelişir.
VSAT Tutarlılık Gereksinimi
GDPR Veri Sahibi Erişim Talepleri'nin (VSAT) içinde yasal olarak tutarlılık kuralı bulunmaktadır.
Madde 15, veri sahibine tutulan tüm kişisel veriler hakkında bilgi verilmesini zorunlu kılar. Yalnızca PDF'lerdeki tüm veriler ya da Word belgelerindeki verilerin büyük çoğunluğu değil: tamamı.
ICO VSAT rehberi bu konuda açıktır. Kuruluşlar, tüm sistem ve formatlarda sistematik bir yaklaşım benimsemelidir. Tutarlı metodoloji zorunludur. Farklı standartlara sahip formata özgü araçlar bu çıtayı karşılamaz.
Bir DPA, VSAT şikayetini incelerken dört soruyu gündeme getirir:
- Tüm kişisel verileri hangi süreç buldu?
- Hangi araçlar hangi belge türlerini işledi?
- Her formatta hangi varlık türleri arandı?
- Eksiksizliği kanıtlayan denetim izi nerede?
Ayrı günlüklere sahip ayrı araçlar, 3. ve 4. soruları net biçimde yanıtlayamaz.
Birleşik Motor Avantajı
Birleşik bir motor, her formatta aynı algılama mantığını çalıştırır. Dört temel fayda bunu takip eder.
Tutarlı varlık kapsamı. 32 varlık türü içeren bir önayar, PDF, DOCX, XLSX ve CSV dosyalarını aynı şekilde işler. Excel'deki SSN, PDF'tekiyle aynı güven eşiğini alır.
Tek denetim izi. Tek bir günlük, bir toplu işteki tüm dosyaları kapsar. Dosya adını, türünü, tespit edilen varlıkları, güven değerlerini ve gerçekleştirilen eylemleri gösterir. Tek bir belge, tüm üretim için uyumluluğu kanıtlar.
Referans bütünlüğü. Diyelim ki "Ayşe Kaya" bir PDF sözleşmesinde, bir Word mektubunda ve bir Excel kaydında geçiyor. Aynı jeton — PERSON_0001 — onun adını her üçünde de değiştirir. Veri sahibi, kendi kaydını tüm üretim boyunca takip edebilir.
Daha basit iş akışı. Karışık formatlarda 15 dosyayı tek bir toplu işe bırakın. Tek bir önayar uygulayın. 15 anonimleştirilmiş çıktı ve tek bir denetim raporu elde edin. Üç ayrı araç iş akışı tek birine dönüşür.
Önayarların toplu işlerde nasıl uygulandığı hakkında daha fazla bilgi için ölçekte GDPR VSAT toplu işleme rehberimize bakınız.
Federal FOIA: Büyük Ölçekte Aynı Sorun
ABD federal kurumları, karışık format sorunuyla çok daha yüksek hacimlerde yüzleşmektedir.
FOIA talepleri eski anabilgisayar dışa aktarmalarını, modern Word belgelerini, taranan PDF arşivlerini, CSV ve JSON veritabanı dışa aktarmalarını kapsar. Hiçbir kurum tek bir format kullanmaz.
ABD Adalet Bakanlığı ve Sağlık Bakanlığı, otomatik redaksiyon sistemlerini pilot olarak uygulamıştır. Manuel çok formatlı işleme, talep hacimlerine ayak uydurmaz. Her pilot projede aynı temel gereksinim öne çıktı: tüm formatlarda tek bir muafiyet standardı ve belgelenmiş bir denetim izi.
Aynı ilke federal hükümetin dışında da geçerlidir. Çok formatlı uyumluluk ihtiyacı olan her kuruluşun aynı şeye ihtiyacı vardır. Tek standart. Tek denetim izi. Savunulabilir uyumluluk kayıtlarının temeli budur.
Hukuk Firması Vaka Çalışması
Orta ölçekli bir hukuk firması, kurumsal müşteriler için GDPR VSAT yanıtlarını yönetiyordu.
Birleşik sisteme geçmeden önce firma dört farklı araç kullanıyordu. Adobe Acrobat PDF'leri işliyordu. Bir Word makrosu DOCX dosyalarını ele alıyor; yalnızca adları ve e-postaları kapsıyordu. Excel'in bul-değiştir özelliği XLSX dosyalarını işliyordu. CSV dışa aktarmalar ise manuel incelemeyle geçiliyordu. Her VSAT 8-12 saat alıyordu. Yalnızca 2-3 varlık türü tüm formatlarda aynı şekilde kontrol ediliyordu.
Geçiş sonrasında birleşik motor tüm formatları tek bir toplu işte ele aldı. Önayar: "VSAT AB Bireysel." Motor, her formatta 32 varlık türünü aynı şekilde kontrol etti. Her VSAT bir saatten kısa sürdü. Tek bir denetim raporu, DPO'nun onayına sunuldu.
Firma artık bir VSAT üretimindeki her belge türünde tutarlı varlık kapsamını kanıtlayabiliyor. Her yanıtı tek bir denetim belgesi kapsıyor. Süre 8-12 saatten bir saatin altına indi. Bu, kayda değer bir operasyonel dönüşümdür. Bu değişim, VSAT uyumluluğunu firmanın müşterilere sunabileceği ölçeklenebilir bir hizmet hâline getirdi.
İlgili: belge formatı parçalanması ve KKB anonimleştirme.
Sonuç
Format parçalanması bir uyumluluk yüküdür. Farklı araçlar farklı standartlar anlamına gelir. Farklı standartlar denetim açıkları yaratır. Denetim açıkları düzenleyici kurumların dikkatini çeker.
Birleşik bir motor bu sorunu kaynağında çözer. Tek algılama standardı. Tek denetim izi. Tek iş akışı — her format için.