By · Last updated 2026-06-05

Bloga DönHukuk Teknolojisi

Karışık Formatlı E-Keşif: Uyumluluk Açığını Kapatmak

E-keşif üretimleri ve GDPR VSAT talepleri PDF, Word, Excel ve JSON formatlarını kapsar. Her format için farklı araç kullanmak tutarsızlık açıkları yaratır.

June 5, 20267 dk okuma
e-discoverymixed formatDSAR compliancelegal redactiondocument production

Karışık Formatlı E-Keşif: Uyumluluk Açığını Kapatmak

Bir belge üretim talebi gelir. Küme beş farklı formattan oluşur: PDF sözleşmeler, Word belgeleri, Excel tablolar, CSV dışa aktarmalar ve JSON günlükleri. Her format ayrı bir araç gerektirir. İşte sorun da tam burada.

2025 Everlaw e-keşif raporuna göre hukuk ekipleri, karışık formatlı üretimler için ortalama 3,2 araç kullanmaktadır. Operasyonel maliyet yüksek. Uyumluluk riski ise daha da yüksek.

Belge üretimlerini nasıl yönettiğimiz için hukuki uyumluluk genel bakışımıza ve güvenlik uygulamalarımıza göz atabilirsiniz.

Araç Parçalanması Neden Açık Yaratır?

Farklı araçlar farklı standartlar anlamına gelir. Üç temel güvenlik açığı bu durumdan kaynaklanır.

Varlık kapsamı araca göre değişir. Adobe Acrobat yalnızca elle girdiğiniz metin dizelerini arar; varlıkları kendiliğinden algılamaz. Bir Word makrosu isim ve e-postaları yakalayabilir, ancak büyük olasılıkla 280'den fazla varlık türünü gözden kaçırır. Excel'in bul-değiştir özelliği yalnızca yazdıklarınızı bulur. Bir PDF'teki ile bir Excel dosyasındaki aynı SSN (Sosyal Güvenlik Numarası) farklı araçlardan farklı muamele görebilir.

Denetim izleri birbirinden ayrışır. Her araç kendi eylemlerini kaydeder; ya da hiç kaydetmez. Bir Veri Koruma Otoritesi (DPO), tüm kişisel verilerin nasıl bulunduğunu ve işlendiğini sorabilir. Üç ayrı araçtan gelen üç ayrı günlük bu soruya zayıf bir yanıttır.

Ayarlar zamanla birbirinden uzaklaşır. Altı ay önce yapılandırılan PDF redaksiyon kural seti, geçen hafta güncellenen Word makrosuyla örtüşmeyebilir. Bu fark, bir üretim hatası gün yüzüne çıkana kadar gizli kalır.

Mahkemeler bu sorunu ele almıştır. E-keşif hatalarına uygulanan yaptırımlarda, tek bir üretimdeki belge türleri arasında tutarsız standartlar uygulanması önemli bir kriter olmuştur. Mahkemeler sistematik bir süreç bekler. Formata özgü araçlar ise bu beklentiyle çelişir.

VSAT Tutarlılık Gereksinimi

GDPR Veri Sahibi Erişim Talepleri'nin (VSAT) içinde yasal olarak tutarlılık kuralı bulunmaktadır.

Madde 15, veri sahibine tutulan tüm kişisel veriler hakkında bilgi verilmesini zorunlu kılar. Yalnızca PDF'lerdeki tüm veriler ya da Word belgelerindeki verilerin büyük çoğunluğu değil: tamamı.

ICO VSAT rehberi bu konuda açıktır. Kuruluşlar, tüm sistem ve formatlarda sistematik bir yaklaşım benimsemelidir. Tutarlı metodoloji zorunludur. Farklı standartlara sahip formata özgü araçlar bu çıtayı karşılamaz.

Bir DPA, VSAT şikayetini incelerken dört soruyu gündeme getirir:

  1. Tüm kişisel verileri hangi süreç buldu?
  2. Hangi araçlar hangi belge türlerini işledi?
  3. Her formatta hangi varlık türleri arandı?
  4. Eksiksizliği kanıtlayan denetim izi nerede?

Ayrı günlüklere sahip ayrı araçlar, 3. ve 4. soruları net biçimde yanıtlayamaz.

Birleşik Motor Avantajı

Birleşik bir motor, her formatta aynı algılama mantığını çalıştırır. Dört temel fayda bunu takip eder.

Tutarlı varlık kapsamı. 32 varlık türü içeren bir önayar, PDF, DOCX, XLSX ve CSV dosyalarını aynı şekilde işler. Excel'deki SSN, PDF'tekiyle aynı güven eşiğini alır.

Tek denetim izi. Tek bir günlük, bir toplu işteki tüm dosyaları kapsar. Dosya adını, türünü, tespit edilen varlıkları, güven değerlerini ve gerçekleştirilen eylemleri gösterir. Tek bir belge, tüm üretim için uyumluluğu kanıtlar.

Referans bütünlüğü. Diyelim ki "Ayşe Kaya" bir PDF sözleşmesinde, bir Word mektubunda ve bir Excel kaydında geçiyor. Aynı jeton — PERSON_0001 — onun adını her üçünde de değiştirir. Veri sahibi, kendi kaydını tüm üretim boyunca takip edebilir.

Daha basit iş akışı. Karışık formatlarda 15 dosyayı tek bir toplu işe bırakın. Tek bir önayar uygulayın. 15 anonimleştirilmiş çıktı ve tek bir denetim raporu elde edin. Üç ayrı araç iş akışı tek birine dönüşür.

Önayarların toplu işlerde nasıl uygulandığı hakkında daha fazla bilgi için ölçekte GDPR VSAT toplu işleme rehberimize bakınız.

Federal FOIA: Büyük Ölçekte Aynı Sorun

ABD federal kurumları, karışık format sorunuyla çok daha yüksek hacimlerde yüzleşmektedir.

FOIA talepleri eski anabilgisayar dışa aktarmalarını, modern Word belgelerini, taranan PDF arşivlerini, CSV ve JSON veritabanı dışa aktarmalarını kapsar. Hiçbir kurum tek bir format kullanmaz.

ABD Adalet Bakanlığı ve Sağlık Bakanlığı, otomatik redaksiyon sistemlerini pilot olarak uygulamıştır. Manuel çok formatlı işleme, talep hacimlerine ayak uydurmaz. Her pilot projede aynı temel gereksinim öne çıktı: tüm formatlarda tek bir muafiyet standardı ve belgelenmiş bir denetim izi.

Aynı ilke federal hükümetin dışında da geçerlidir. Çok formatlı uyumluluk ihtiyacı olan her kuruluşun aynı şeye ihtiyacı vardır. Tek standart. Tek denetim izi. Savunulabilir uyumluluk kayıtlarının temeli budur.

Hukuk Firması Vaka Çalışması

Orta ölçekli bir hukuk firması, kurumsal müşteriler için GDPR VSAT yanıtlarını yönetiyordu.

Birleşik sisteme geçmeden önce firma dört farklı araç kullanıyordu. Adobe Acrobat PDF'leri işliyordu. Bir Word makrosu DOCX dosyalarını ele alıyor; yalnızca adları ve e-postaları kapsıyordu. Excel'in bul-değiştir özelliği XLSX dosyalarını işliyordu. CSV dışa aktarmalar ise manuel incelemeyle geçiliyordu. Her VSAT 8-12 saat alıyordu. Yalnızca 2-3 varlık türü tüm formatlarda aynı şekilde kontrol ediliyordu.

Geçiş sonrasında birleşik motor tüm formatları tek bir toplu işte ele aldı. Önayar: "VSAT AB Bireysel." Motor, her formatta 32 varlık türünü aynı şekilde kontrol etti. Her VSAT bir saatten kısa sürdü. Tek bir denetim raporu, DPO'nun onayına sunuldu.

Firma artık bir VSAT üretimindeki her belge türünde tutarlı varlık kapsamını kanıtlayabiliyor. Her yanıtı tek bir denetim belgesi kapsıyor. Süre 8-12 saatten bir saatin altına indi. Bu, kayda değer bir operasyonel dönüşümdür. Bu değişim, VSAT uyumluluğunu firmanın müşterilere sunabileceği ölçeklenebilir bir hizmet hâline getirdi.

İlgili: belge formatı parçalanması ve KKB anonimleştirme.

Sonuç

Format parçalanması bir uyumluluk yüküdür. Farklı araçlar farklı standartlar anlamına gelir. Farklı standartlar denetim açıkları yaratır. Denetim açıkları düzenleyici kurumların dikkatini çeker.

Birleşik bir motor bu sorunu kaynağında çözer. Tek algılama standardı. Tek denetim izi. Tek iş akışı — her format için.

Kaynaklar

Verilerinizi korumaya hazır mısınız?

48 dilde 285+ varlık türü ile PII anonimleştirmeye başlayın.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.