मिश्रित Office की समस्या
अधिकांश कंपनियाँ एक से अधिक office suite चलाती हैं। कानूनी टीमें Word का उपयोग करती हैं। Linux पर काम करने वाले इंजीनियर LibreOffice इस्तेमाल करते हैं। विलय के बाद अलग-अलग सॉफ़्टवेयर वाली टीमें एक साथ आती हैं। सरकारी काम में ODF और OOXML फ़ाइल फ़ॉर्मेट शामिल हो जाते हैं।
यह मिश्रण एक PII जोखिम पैदा करता है। एक tool Word में नाम खोज लेता है। दूसरा tool Writer में उसे छोड़ देता है। थ्रेशोल्ड अलग-अलग होते हैं। आउटपुट फ़ॉर्मेट भिन्न होते हैं।
यह अंतर एक अनुपालन जोखिम है। GDPR अनुच्छेद 32 डेटा सुरक्षा के लिए "उचित तकनीकी उपाय" की मांग करता है। यदि दो suite एक ही फ़ाइल पर दो अलग परिणाम देते हैं, तो यह लगातार उचित नहीं है। मानक पूरा नहीं होता।
एक Engine, दो Suites
anonym.legal के पास दोनों suites के लिए extension हैं:
- Office Add-in — Word, Excel, और PowerPoint के लिए
- LibreOffice Extension — Writer, Calc, और Impress के लिए
दोनों एक ही backend से जुड़ते हैं। वे साझा करते हैं:
- 285+ entity प्रकार
- हाइब्रिड detection (regex + spaCy NLP)
- 48 भाषाएँ
- 5 अनामीकरण विधियाँ
- Confidence scoring (regex: 1.0, NLP: 0.85+)
Word या Writer में एक ही text चलाएँ। परिणाम समान होगा।
साझा Presets से Drift रुकता है
Configuration drift एक मूक जोखिम है। यह किसी के ध्यान में आए बिना होता है। टीम A, Word को 12 entity प्रकारों के साथ Replace पर सेट करती है। टीम B, LibreOffice को 8 प्रकारों के साथ Redact पर सेट करती है। एक ही फ़ाइल। अलग-अलग आउटपुट।
anonym.legal में Preset sync इसे ठीक करता है:
- किसी भी platform पर preset बनाएँ — web app, Desktop App, Office Add-in, या LibreOffice Extension
- Preset 5 मिनट के भीतर सभी platforms पर sync हो जाता है
- हर user एक ही settings लागू करता है
एक preset में शामिल होता है: कौन से entity प्रकार detect करने हैं, प्रत्येक प्रकार के लिए विधि, confidence threshold, और कस्टम परिभाषाएँ।
Encryption Key की पोर्टेबिलिटी
Encrypt विधि (AES-256-GCM) का उपयोग करने वाली टीमें मूल text को पुनर्स्थापित करने के लिए अनामीकरण को उलट सकती हैं। इसके लिए keys सभी platforms पर उपलब्ध होनी चाहिए। Word में encrypt की गई फ़ाइल web app या LibreOffice Extension में decrypt होनी चाहिए।
anonym.legal ZK-wrapped key sync का उपयोग करता है:
- Keys को आपके password से derived key के साथ XChaCha20-Poly1305 से wrap किया जाता है
- Wrapped keys server पर sync होती हैं
- आपका password कभी आपके device से नहीं जाता
- Server उल्लंघन से आपकी keys उजागर नहीं हो सकतीं
Law Firm Workflow: मिश्रित Suite, एक परिणाम
एक मध्यम आकार की law firm कई स्रोतों से फ़ाइलें लेती है:
फ़ाइल प्रकार:
- Word (.docx) में क्लाइंट अनुबंध
- PDF के रूप में court filings, text में बदली गई
- Linux desks से LibreOffice Writer (.odt) में आंतरिक मेमो
- Excel (.xlsx) और Calc (.ods) में spreadsheets
यह कैसे काम करता है:
- वरिष्ठ partner एक "Client Matter" preset बनाता है — नाम replace करें, तारीखें mask करें, SSN redact करें, email encrypt करें
- Preset सभी platforms पर sync होता है
- Associate A एक Word फ़ाइल खोलता है। Office Add-in से preset लागू करता है।
- Associate B एक Writer फ़ाइल खोलता है। LibreOffice Extension से वही preset लागू करता है।
- Paralegal एक Calc फ़ाइल पर preset चलाता है।
- तीनों एक ही detection और output settings का उपयोग करते हैं।
GDPR ऑडिट के लिए, firm दिखा सकती है:
- सभी फ़ाइल प्रकारों पर एक preset लागू किया गया
- फ़ॉर्मेट से स्वतंत्र entity detection
- पूरे कार्य में समान output विधियाँ
- Zero-knowledge security से manage की गई keys
Enterprise Deployment
| कारक | Office Add-in | LibreOffice Extension |
|---|---|---|
| Deployment | Microsoft 365 admin center | .oxt फ़ाइल वितरण |
| Updates | Manifest के माध्यम से Auto-update | Manual .oxt replacement |
| User management | Azure AD integration | anonym.legal accounts |
| Platform | Windows, Mac, Web, iPad | Windows, macOS, Linux |
| Licensing | Microsoft 365 आवश्यक | Free (LibreOffice) |
मिश्रित वातावरण के लिए, दोनों deploy करें। Office Add-in Microsoft 365 desks पर जाता है। LibreOffice Extension Linux और open-source desks पर जाता है। साझा presets और keys व्यवहार को सुसंगत रखते हैं।
नियामक एकरूपता
नियामक "हमने अलग-अलग tools का उपयोग किया" को अनामीकरण में gaps का कारण स्वीकार नहीं करते। यदि एक DSAR response Word फ़ाइल में नाम redact करता है लेकिन LibreOffice फ़ाइल में छोड़ देता है, तो यह एक gap है। यह अनुपालन विफलता है।
सभी फ़ाइल प्रकारों में एक detection engine यह जोखिम दूर करता है। Algorithm क्लाइंट app के आधार पर नहीं बदलता। यह server-side हर request के लिए समान तरीके से चलता है। विवरण के लिए सुरक्षा और अनुपालन पृष्ठ और legal conformance docs देखें।
शुरू करें
- LibreOffice Extension डाउनलोड करें — Writer, Calc, Impress के लिए
- Office Add-in इंस्टॉल करें — Word, Excel, PowerPoint के लिए
- web app में एक preset बनाएँ — यह दोनों platforms पर sync होता है
एक account। एक preset। एक परिणाम।
स्रोत
- GDPR अनुच्छेद 32 — सुसंगत डेटा सुरक्षा के लिए उचित तकनीकी उपाय
- anonym.legal cross-device sync docs — preset और key पोर्टेबिलिटी (/docs/libreoffice)
- anonym.legal PII Detection Testing — 95.5% accuracy, सभी platforms पर समान