Rozsirenie LibreOffice na anonymizaciu PII
LibreOffice ma odhadovanych 200 miliónov pouzivatelov po celom svete. Spolieha sa na ne vláda, skoly a firmy. Mnoge pouzivaju LibreOffice, aby sa vyhli nakladnym softverovym licenciám. Dovtedy vsak pouzivatelia nemali vbudovany nastroj na vyhladavanie a odstranovanie osobnych udajov zo svojich suborov.
Stare riesenie bolo bolestive. Skopirujte text do webovej aplikacie. Anonymizujte ho. Vlozte ho spat. To nici formatovanie. Rozbija tabulky, styly a rozlozenie. Pre zlozite dokumenty Writer to nefunguje.
Rozsirenie anonym.legal toto riesí. Funguje priamo v aplikacii. Deteguje viac ako 285 typov entit v Writer, Calc a Impress.
Nainstalovanie za menej ako dve minuty
Rozsirenie sa dodáva ako subor .oxt. Toto je standardny format pre vsetky rozsirenia.
Rychla instalacia:
- Stiahnite
.oxtz anonym.legal/api/download/libreoffice - Dvakrat kliknite na subor
- Potvrdre vyzvu
- Restartujte
Rucna instalacia:
- Otvorte aplikaciu
- Prejdite na Nastroje, potom Spravca rozsireni
- Kliknite Pridat, potom vyberte subor
.oxt - Restartujte
Po restartovani sa postranný panel anonym.legal objavuje pod Zobrazit, potom Postranný panel. Prihlaste sa na zaciatok prace.
Ako funguje detekcia
Dva motory bezat spolu na vyhladanie PII.
| Motor | Najde | Spolahlivos |
|---|---|---|
| Regex | Emaily, SSN, IBAN, kreditne karty, telefonne cisla | 1,0 |
| spaCy NLP | Mena, organizacie, lokality | 0,85+ |
Detekcia prebieha na API anonym.legal. Text ide na certifikovane servery v Nemecku. Servery maju status ISO 27001. Vysledky sa vracia do rozsirenia. Žiadne subory dokumentov sa neposielajú. Prenasa sa iba text.
Co robi kazda aplikacia:
- Writer: Extrahuje uplny text alebo iba vyber
- Calc: Cita bunky ako hodnoty oddelene tabulatorom vo vsetkych listoch
- Impress: Cita textove objekty zo vsetkych snimok
Pat metod anonymizacie
| Metoda | Priklad | Reverzibilna? | Trieda GDPR |
|---|---|---|---|
| Nahradit | Ján Novak -> PERSON | Nie | Anonymizacia (Recital 26) |
| Maskovat | jan@priklad.sk -> j***@p***.sk | Nie | Anonymizacia |
| Redaktovat | 555-0123 -> [REDACTED] | Nie | Anonymizacia |
| Hash (SHA-256/512) | SSN -> a1b2c3d4... | Nie | Pseudonymizacia (WP29) |
| Sifrovat (AES-256-GCM) | Meno -> ENC:xyz... | Ano | Pseudonymizacia (Cl. 4(5)) |
Metody môzete kombinovat v jednom prechode. Nahradte mena, ale sifrujte emaily. Kazdy typ entity ma vlastné pravidlo.
Format zostáva v poriadku vo Writeri
Toto je hlavna vyhoda oproti kopírovaní a vkladaniu. Rozsirenie zachovava vsetko formatovanie pri nahrazovani textu.
Sedem zachovanych vlastnosti fontu:
- Rodina, velkost, tucnost, kurziva, farba, podciarknutie, preskrtnutie
Styri zachovane vlastnosti odseku:
- Zarovnanie, zarucenie prvého riadku, lavy okraj, pravy okraj
"Ján Novak" v tucnej 14pt Times New Roman sa stane "PERSON" v rovnakom style. Tabulky, hlavicky a paticka zostanu neporušene. Rozsirenie pracuje vnútri modelu dokumentu. Nevyvaza a znovu neimportuje text.
Poznamka: Sledovanie formatu sa tyka iba Writera. Calc a Impress pouzivaju iba nahradenie na urovni textu.
Kontrola pred pouzitim
Nahiad zobrazuje az 50 najdenych entit. Kazdy riadok ukazuje:
- Typ entity (PERSON, EMAIL_ADDRESS, PHONE_NUMBER atd.)
- Povodny text
- Navrhované nahradenie
- Skóre spolahlivos
Prijmite alebo odmietnite kazdu entitu jeden po druhom. Vyberte vsetky alebo vymažte vsetky jednym kliknutim. Nic sa nezmeni, kym nekliknete Aplikovat. Vo Writeri Ctrl+Z zruší poslednu operaciu.
Nastavenia sa synchronizuju napriec zariadeniami
Ulozte nastavenia ako nastavenie. Vyberte typy entit, metody a prahove hodnoty. Opakujte pouzivanie napriec vsetkymi vasimi dokumentmi. Setrí cas.
Na platených planoch sa nastavenia synchronizuju napriec vsetkymi produktmi anonym.legal. Nastavte ho vo webovej aplikacii. Objavuje sa v desktopovej aplikacii a doplnku Office do piatich minut. Sifrovacie kluce pouzivaju zero-knowledge obalenie. Iba vase heslo ich môze desifrovat.
Viac o tom, ako doplnok Office zvlada rovnaky pracovny tok vo Worde, najdete v Redakcia doplnkom Word pre pravnicke firmy.
LibreOffice vs. Microsoft Office
Obidve rozsirenia zdielaju rovnaky backend. Rovnaky text dáva rovnake vysledky vo Writeri aj Worde. Motor je jeden a ten isty.
| Funkcia | Rozsirenie LibreOffice | Doplnok Office |
|---|---|---|
| Typy entit | 285+ | 285+ |
| Jazyky | 48 | 48 |
| Metody | 5 | 5 |
| Sledovanie formatu | Iba Writer | Iba Word |
| Nahliad | Az 50 entit | Az 50 entit |
| ZK auth | Ano | Ano |
| Synchronizacia nastaveni | Ano (platene plany) | Ano (platene plany) |
| Platformy | Windows, macOS, Linux | Windows, Mac, Web, iPad |
Pre sirsí pohlad na suladnost PII napriec operacnymi systemami pozrite Medziplatorova suladnost PII: Mac, Linux, Windows.
Systemove poziadavky
- LibreOffice 3.0 alebo novsi
- Python 3 (pribaleny s vacsinou instalácii)
- Internetovy pristup (pre PII detection API)
- Ucet anonym.legal (bezplatný plan: 200 tokenov/mesiac)
Zaciatok prace
- Stiahnut rozsirenie
- Dvojitym kliknutim nainštalujte, potom restartujte
- Otvorte Zobrazit -> Postranný panel -> panel anonym.legal
- Prihláste sa
- Otvorte dokument, kliknite Analyzovat, skontrolujte, kliknite Aplikovat
Uplna dokumentacia: Dokumentacia rozsirenia LibreOffice
Zdroje
- The Document Foundation - odhadovany 200 M+ pouzivatelov LibreOffice po celom svete
- Testovanie detekcie PII anonym.legal - 95,5 % presnost, 42/44 nezavislych testov
- GDPR Recital 26 - anonymizacia odstranjuje data z rozsahu GDPR; Clanok 4(5) - definicia pseudonymizacie