Problem PII-ja u LibreOfficeu
LibreOffice je najšire distribuirani office paket otvorenog koda sa procijenjenih 200 milijuna korisnika (The Document Foundation) i primjenom u vladama, univerzitetima i poduzećima koja izbjegavaju troškove Microsoft licenciranja. Ipak, do sada LibreOffice korisnici nisu imali integrirani alat za detektovanje i anonimizaciju osobno identificirajućih informacija (PII) unutar svojih dokumenata.
Radna zaobilaznica — kopiranje teksta u web aplikaciju, anonimizacija, vraćanje u dokument — uništava oblikovanje, kvari strukturu dokumenta i udvostručava posao. Za Writer dokumente sa složenim stilovima, tabelama i oblikovanjem paragrafa, ovaj pristup kopiranje-lijepljenja je neupotrebljiv.
anonym.legal proširenje za LibreOffice rješava ovo donošenjem iste 285+ detektovanja tipova entiteta direktno u Writer, Calc i Impress.
Instalacija za manje od 2 minuta
Proširenje se isporučuje kao standardna .oxt datoteka — universalni oblik LibreOffice proširenja.
Brza instalacija:
- Preuzmi .oxt datoteku sa anonym.legal/api/download/libreoffice
- Dvostruko klikni preuzetu datoteku
- LibreOffice se otvara i traži od tebe da potvrdiš instalaciju
- Ponovno pokreni LibreOffice
Ručna instalacija:
- Otvori LibreOffice
- Idi na Alati, zatim Upravitelj proširenja
- Klikni Dodaj i odaberi .oxt datoteku
- Ponovno pokreni LibreOffice
Nakon ponovnog pokretanja, anonym.legal bočna traka se pojavljuje pod Prikaz, zatim Bočna traka. Prijavi se sa tvojim anonym.legal računom da počneš analizirati dokumente.
Kako funkcionira detektovanje u LibreOfficeu
Proširenje koristi isti hibridni motor detekcije kao svi anonym.legal proizvodi:
| Motor | Opseg | Pouzdanost |
|---|---|---|
| Regex obrasci | Strukturirani podaci (email-ovi, SSN-ovi, IBAN-ovi, kreditne kartice, telefonski brojevi) | 1.0 (deterministički) |
| spaCy NLP | Imena, organizacije, lokacije | 0.85+ (na osnovu ML) |
Detektovanje se izvršava na anonym.legal API-ju — tekst se šalje na ISO 27001 certificirane servere u Njemačkoj, analizira se i rezultati se vraćaju proširenju. Datoteke dokumenta se ne učitavaju; samo ekstrahirani tekst se prenosi.
Ponašanje prema aplikaciji:
- Writer: Potpuna ekstrakcija teksta sa očuvanjem granica paragrafa, ili samo odabir moda
- Calc: Ekstrakcija na osnovu ćelija kao vrijednosti odvojene tabulatorima preko svih listova
- Impress: Ekstrakcija tekstualnih objekata sa svih slajdova
5 metoda anonimizacije
Iste 5 metoda dostupne preko svih anonym.legal proizvoda:
| Metoda | Primjer | Reverzibilna | GDPR klasifikacija |
|---|---|---|---|
| Zamjena | John Smith na PERSON | Ne | Anonimizacija (Zaključak 26) |
| Maskiranje | john@example.com na j***@e***.com | Ne | Anonimizacija |
| Uredi | 555-0123 na [REDACTED] | Ne | Anonimizacija |
| Hash (SHA-256/512) | SSN na a1b2c3d4... | Ne | Pseudonimizacija (WP29) |
| Šifriranje (AES-256-GCM) | Ime na ENC:xyz... | Da | Pseudonimizacija (Članak 4(5)) |
Odabir po entitetu operatora omogućava ti primjenu različitih metoda na različite PII tipove u jednoj prolaznosti — na primjer, zamjena imena ali šifriranje email adresa.
Očuvanje oblikovanja u Writeru
Kritična prednost u odnosu na radne tokove kopiranje-lijepljenja: proširenje čuva oblikovanje dokumenta tijekom zamjene PII-ja.
7 svojstava fonta čuvanih:
- Obitelj fonta, veličina, težina (bold), stil (italic), boja, podvlaka, precrtano
4 svojstva paragrafa čuvana:
- Poravnanje, uvlaka prvog reda, lijevi margina, desni margina
Kada se "John Smith" pojavljuje u boldnom 14pt Times New Roman, zamjena "PERSON" se pojavljuje u boldnom 14pt Times New Roman. Stilovi, tabele, zaglavlja, podnožja — sve ostaje netaknuto jer proširenje funkcionira preko LibreOffice UNO API modela dokumenta umjesto izvoza/ponovnog uvoza teksta.
Napomena: Očuvanje oblikovanja je samo Writer. Calc i Impress izvode zamjenu na razini teksta bez praćenja svojstava oblikovanja.
Pregled prije primjene
Dijaloški okvir pregleda prikazuje do 50 detektovanih entiteta u tabeli:
- Tip entiteta (PERSON, EMAIL_ADDRESS, PHONE_NUMBER, itd.)
- Originalni tekst
- Predložena zamjena
- Rezultat pouzdanosti
Možeš:
- Prihvatiti ili odbiti svaki entitet pojedinačno
- Odabrati sve / deselektovati sve
- Pregledati po entitetu prije nego što se bilo koje promjene primijene
Samo prihvaćeni entiteti se anonimiziraju kada klikneš Primijeni. Ctrl+Z poništava zadnju operaciju u Writeru.
Predlošci i sinhronizacija preko uređaja
Sacuvaj konfiguracije anonimizacije kao predloške — koji tipovi entiteta za detektovanje, koje metode za primjenu, pragove pouzdanosti — i ponovna ih korišćenja u dokumentima.
Na plaćenim planovima, predlošci se automatski sinhroniziraju preko svih anonym.legal platformi:
- Postavi predložak u web aplikaciju
- Pojavljuje se u LibreOfficeu, Desktop aplikaciji i Office Add-in-u u roku od 5 minuta
- Ključevi šifriranja se sinhroniziraju sa ZK umotavanjem (XChaCha20-Poly1305) — samo tvoja lozinka može ih dešifrirati
LibreOffice vs. Microsoft Office: Isti motor, isti rezultati
| Funkcionalnost | LibreOffice proširenje | Office Add-in |
|---|---|---|
| Tipovi entiteta | 285+ | 285+ |
| Jezici | 48 | 48 |
| Metode | 5 (Zamjena, Maskiranje, Uredi, Hash, Šifriranje) | 5 (Zamjena, Maskiranje, Uredi, Hash, Šifriranje) |
| Očuvanje oblikovanja | Samo Writer | Samo Word |
| Dijaloški okvir pregleda | Do 50 entiteta | Do 50 entiteta |
| ZK autentifikacija | Da | Da |
| Sinhronizacija predloška | Da (plaćeni planovi) | Da (plaćeni planovi) |
| Platforme | Windows, macOS, Linux | Windows, Mac, Web, iPad |
Oba proširenja koriste isti motor detekcije na pozadini. Dokument anonimiziran u Wordu proizvodi iste rezultate detektovanja entiteta kao isti tekst obrađen u Writeru.
Sistemski zahtjevi
- LibreOffice 3.0 ili novije
- Python 3 (uključen sa većinom LibreOffice instalacija)
- Internetska veza (za PII detektovanje API)
- anonym.legal račun (besplatni nivo: 200 tokena/mjesec)
Početak rada
- Preuzmi proširenje (.oxt datoteka)
- Dvostruko klikni za instalaciju, ponovno pokreni LibreOffice
- Otvori Prikaz, zatim Bočna traka, zatim odaberi anonym.legal ploču
- Prijavi se sa tvojim računom
- Otvori dokument, klikni Analiza, pregledaj rezultate, klikni Primijeni
Puna dokumentacija: LibreOffice proširenje dokumentacija
Izvori: The Document Foundation — procijenjenih 200M+ LibreOffice korisnika u svijetu anonym.legal PII detektovanje testiranje — 95.5% točnost, 42/44 nezavisna testa GDPR zaključak 26 — anonimizacija uklanja podatke iz GDPR opsega; članak 4(5) — pseudonimizacija definicija