Povratak na BlogTehnički

Proširenje za anonimizaciju PII-ja u LibreOfficeu

Korak po korak vodič za anonimizaciju PII-ja u LibreOffice dokumentima pomoću anonym.legal proširenja.

March 10, 202610 min čitanja
LibreOffice extensiondocument anonymizationPII redactionopen source officeWriter anonymizationformat preservation

Problem PII-ja u LibreOfficeu

LibreOffice je najšire distribuirani office paket otvorenog koda sa procijenjenih 200 milijuna korisnika (The Document Foundation) i primjenom u vladama, univerzitetima i poduzećima koja izbjegavaju troškove Microsoft licenciranja. Ipak, do sada LibreOffice korisnici nisu imali integrirani alat za detektovanje i anonimizaciju osobno identificirajućih informacija (PII) unutar svojih dokumenata.

Radna zaobilaznica — kopiranje teksta u web aplikaciju, anonimizacija, vraćanje u dokument — uništava oblikovanje, kvari strukturu dokumenta i udvostručava posao. Za Writer dokumente sa složenim stilovima, tabelama i oblikovanjem paragrafa, ovaj pristup kopiranje-lijepljenja je neupotrebljiv.

anonym.legal proširenje za LibreOffice rješava ovo donošenjem iste 285+ detektovanja tipova entiteta direktno u Writer, Calc i Impress.

Instalacija za manje od 2 minuta

Proširenje se isporučuje kao standardna .oxt datoteka — universalni oblik LibreOffice proširenja.

Brza instalacija:

  1. Preuzmi .oxt datoteku sa anonym.legal/api/download/libreoffice
  2. Dvostruko klikni preuzetu datoteku
  3. LibreOffice se otvara i traži od tebe da potvrdiš instalaciju
  4. Ponovno pokreni LibreOffice

Ručna instalacija:

  1. Otvori LibreOffice
  2. Idi na Alati, zatim Upravitelj proširenja
  3. Klikni Dodaj i odaberi .oxt datoteku
  4. Ponovno pokreni LibreOffice

Nakon ponovnog pokretanja, anonym.legal bočna traka se pojavljuje pod Prikaz, zatim Bočna traka. Prijavi se sa tvojim anonym.legal računom da počneš analizirati dokumente.

Kako funkcionira detektovanje u LibreOfficeu

Proširenje koristi isti hibridni motor detekcije kao svi anonym.legal proizvodi:

MotorOpsegPouzdanost
Regex obrasciStrukturirani podaci (email-ovi, SSN-ovi, IBAN-ovi, kreditne kartice, telefonski brojevi)1.0 (deterministički)
spaCy NLPImena, organizacije, lokacije0.85+ (na osnovu ML)

Detektovanje se izvršava na anonym.legal API-ju — tekst se šalje na ISO 27001 certificirane servere u Njemačkoj, analizira se i rezultati se vraćaju proširenju. Datoteke dokumenta se ne učitavaju; samo ekstrahirani tekst se prenosi.

Ponašanje prema aplikaciji:

  • Writer: Potpuna ekstrakcija teksta sa očuvanjem granica paragrafa, ili samo odabir moda
  • Calc: Ekstrakcija na osnovu ćelija kao vrijednosti odvojene tabulatorima preko svih listova
  • Impress: Ekstrakcija tekstualnih objekata sa svih slajdova

5 metoda anonimizacije

Iste 5 metoda dostupne preko svih anonym.legal proizvoda:

MetodaPrimjerReverzibilnaGDPR klasifikacija
ZamjenaJohn Smith na PERSONNeAnonimizacija (Zaključak 26)
Maskiranjejohn@example.com na j***@e***.comNeAnonimizacija
Uredi555-0123 na [REDACTED]NeAnonimizacija
Hash (SHA-256/512)SSN na a1b2c3d4...NePseudonimizacija (WP29)
Šifriranje (AES-256-GCM)Ime na ENC:xyz...DaPseudonimizacija (Članak 4(5))

Odabir po entitetu operatora omogućava ti primjenu različitih metoda na različite PII tipove u jednoj prolaznosti — na primjer, zamjena imena ali šifriranje email adresa.

Očuvanje oblikovanja u Writeru

Kritična prednost u odnosu na radne tokove kopiranje-lijepljenja: proširenje čuva oblikovanje dokumenta tijekom zamjene PII-ja.

7 svojstava fonta čuvanih:

  • Obitelj fonta, veličina, težina (bold), stil (italic), boja, podvlaka, precrtano

4 svojstva paragrafa čuvana:

  • Poravnanje, uvlaka prvog reda, lijevi margina, desni margina

Kada se "John Smith" pojavljuje u boldnom 14pt Times New Roman, zamjena "PERSON" se pojavljuje u boldnom 14pt Times New Roman. Stilovi, tabele, zaglavlja, podnožja — sve ostaje netaknuto jer proširenje funkcionira preko LibreOffice UNO API modela dokumenta umjesto izvoza/ponovnog uvoza teksta.

Napomena: Očuvanje oblikovanja je samo Writer. Calc i Impress izvode zamjenu na razini teksta bez praćenja svojstava oblikovanja.

Pregled prije primjene

Dijaloški okvir pregleda prikazuje do 50 detektovanih entiteta u tabeli:

  • Tip entiteta (PERSON, EMAIL_ADDRESS, PHONE_NUMBER, itd.)
  • Originalni tekst
  • Predložena zamjena
  • Rezultat pouzdanosti

Možeš:

  • Prihvatiti ili odbiti svaki entitet pojedinačno
  • Odabrati sve / deselektovati sve
  • Pregledati po entitetu prije nego što se bilo koje promjene primijene

Samo prihvaćeni entiteti se anonimiziraju kada klikneš Primijeni. Ctrl+Z poništava zadnju operaciju u Writeru.

Predlošci i sinhronizacija preko uređaja

Sacuvaj konfiguracije anonimizacije kao predloške — koji tipovi entiteta za detektovanje, koje metode za primjenu, pragove pouzdanosti — i ponovna ih korišćenja u dokumentima.

Na plaćenim planovima, predlošci se automatski sinhroniziraju preko svih anonym.legal platformi:

  • Postavi predložak u web aplikaciju
  • Pojavljuje se u LibreOfficeu, Desktop aplikaciji i Office Add-in-u u roku od 5 minuta
  • Ključevi šifriranja se sinhroniziraju sa ZK umotavanjem (XChaCha20-Poly1305) — samo tvoja lozinka može ih dešifrirati

LibreOffice vs. Microsoft Office: Isti motor, isti rezultati

FunkcionalnostLibreOffice proširenjeOffice Add-in
Tipovi entiteta285+285+
Jezici4848
Metode5 (Zamjena, Maskiranje, Uredi, Hash, Šifriranje)5 (Zamjena, Maskiranje, Uredi, Hash, Šifriranje)
Očuvanje oblikovanjaSamo WriterSamo Word
Dijaloški okvir pregledaDo 50 entitetaDo 50 entiteta
ZK autentifikacijaDaDa
Sinhronizacija predloškaDa (plaćeni planovi)Da (plaćeni planovi)
PlatformeWindows, macOS, LinuxWindows, Mac, Web, iPad

Oba proširenja koriste isti motor detekcije na pozadini. Dokument anonimiziran u Wordu proizvodi iste rezultate detektovanja entiteta kao isti tekst obrađen u Writeru.

Sistemski zahtjevi

  • LibreOffice 3.0 ili novije
  • Python 3 (uključen sa većinom LibreOffice instalacija)
  • Internetska veza (za PII detektovanje API)
  • anonym.legal račun (besplatni nivo: 200 tokena/mjesec)

Početak rada

  1. Preuzmi proširenje (.oxt datoteka)
  2. Dvostruko klikni za instalaciju, ponovno pokreni LibreOffice
  3. Otvori Prikaz, zatim Bočna traka, zatim odaberi anonym.legal ploču
  4. Prijavi se sa tvojim računom
  5. Otvori dokument, klikni Analiza, pregledaj rezultate, klikni Primijeni

Puna dokumentacija: LibreOffice proširenje dokumentacija

Izvori: The Document Foundation — procijenjenih 200M+ LibreOffice korisnika u svijetu anonym.legal PII detektovanje testiranje — 95.5% točnost, 42/44 nezavisna testa GDPR zaključak 26 — anonimizacija uklanja podatke iz GDPR opsega; članak 4(5) — pseudonimizacija definicija

Spremni za zaštitu vaših podataka?

Započnite anonimizaciju PII-a s 285+ vrsta entiteta na 48 jezika.