LibreOffice PII-anonimizálási bővítmény — anonym.legal
A LibreOffice PII-problémája
A LibreOffice a legszélesebb körben telepített nyílt forráskódú irodai csomag, becsülhetően 200 millió felhasználóval (The Document Foundation), és elterjedt a Microsoft-licencelési költségeket elkerülő kormányzati szervek, egyetemek és vállalkozások körében. Mindezidáig azonban a LibreOffice-felhasználóknak nem volt integrált eszközük személyazonosításra alkalmas adatok (PII) felismerésére és anonimizálására a dokumentumaikban.
A megkerülő megoldás — szöveg kimásolása egy webalkalmazásba, anonimizálás, majd visszaillesztés — tönkreteszi a formázást, megbontja a dokumentum szerkezetét és megduplázza a munkát. Összetett stílusokat, táblázatokat és bekezdésformázást tartalmazó Writer-dokumentumok esetén ez a másolás-beillesztés megközelítés használhatatlan.
Az anonym.legal LibreOffice-bővítménye ezt a problémát oldja meg azáltal, hogy ugyanazt a 285+ entitástípusú felismerést közvetlenül a Writerbe, Calcba és Impresbe hozza.
Telepítés 2 percen belül
A bővítmény szabványos .oxt fájlként érkezik — ez a LibreOffice univerzális bővítményformátuma.
Gyors telepítés:
- Töltse le a .oxt fájlt az anonym.legal/api/download/libreoffice oldalról
- Kattintson duplán a letöltött fájlra
- A LibreOffice megnyílik és megerősítést kér a telepítéshez
- Indítsa újra a LibreOffice-t
Manuális telepítés:
- Nyissa meg a LibreOffice-t
- Lépjen az Eszközök, majd a Bővítménykezelő menüpontra
- Kattintson a Hozzáadás gombra és válassza ki a .oxt fájlt
- Indítsa újra a LibreOffice-t
Az újraindítás után az anonym.legal oldalsáv a Nézet, majd az Oldalsáv menüben jelenik meg. Jelentkezzen be anonym.legal fiókjával a dokumentumok elemzésének megkezdéséhez.
A felismerés működése LibreOffice-ban
A bővítmény ugyanazt a hibrid felismerési motort alkalmazza, mint az összes anonym.legal termék:
| Motor | Hatókör | Megbízhatóság |
|---|---|---|
| Regex-minták | Strukturált adatok (e-mailek, TAJ-számok, IBAN-ok, hitelkártyák, telefonszámok) | 1,0 (determinisztikus) |
| spaCy NLP | Nevek, szervezetek, helyszínek | 0,85+ (ML-alapú) |
A felismerés az anonym.legal API-n fut — a szöveg ISO 27001-es tanúsítvánnyal rendelkező németországi szerverekre kerül elemzésre, az eredmények pedig visszakerülnek a bővítménybe. Dokumentumfájlok nem töltődnek fel; csak a kinyert szöveg kerül átvitelre.
Alkalmazásspecifikus viselkedés:
- Writer: Teljes szövegkinyerés bekezdéshatárok megőrzésével vagy csak kijelölés módban
- Calc: Cellalapú kinyerés tabulátorral elválasztott értékként az összes munkalapon
- Impress: Szövegobjektum-kinyerés az összes diáról
5 anonimizálási módszer
Ugyanaz az 5 módszer érhető el, mint az összes anonym.legal terméken:
| Módszer | Példa | Visszafordítható | GDPR-besorolás |
|---|---|---|---|
| Csere | Kovács János → SZEMÉLY | Nem | Anonimizálás (26. preambulumbekezdés) |
| Maszkolás | john@example.com → j***@e***.com | Nem | Anonimizálás |
| Kitakarás | 555-0123 → [KITAKARVA] | Nem | Anonimizálás |
| Hash (SHA-256/512) | TAJ-szám → a1b2c3d4... | Nem | Pszeudonimizálás (WP29) |
| Titkosítás (AES-256-GCM) | Név → TITKOSÍTVA:xyz... | Igen | Pszeudonimizálás (4. cikk (5) bek.) |
Entitásonkénti operátorválasztás lehetővé teszi különböző módszerek alkalmazását különböző PII-típusokra egyetlen menetben — például nevek cseréje, de e-mail-címek titkosítása.
Formázásmegőrzés a Writerben
A másolás-beillesztés munkafolyamatokhoz képest döntő előny: a bővítmény megőrzi a dokumentum formázását az anonimizálás során.
7 megőrzött betűtípus-tulajdonság:
- Betűcsalád, méret, vastagság (félkövér), stílus (dőlt), szín, aláhúzás, áthúzás
4 megőrzött bekezdéstulajdonság:
- Igazítás, első sor behúzása, bal margó, jobb margó
Ha „Kovács János” félkövér 14 pontos Times New Roman betűvel szerepel, a csere eredménye „SZEMÉLY” is félkövér 14 pontos Times New Roman lesz. Stílusok, táblázatok, fejlécek, láblécek — mind érintetlen marad, mert a bővítmény a LibreOffice UNO API dokumentummodelljén keresztül működik, nem szövegexport/reimporton.
Megjegyzés: A formázásmegőrzés csak a Writerre vonatkozik. A Calc és az Impress szövegszintű cserét végez formátumtulajdonság-nyomon követés nélkül.
Előnézet alkalmazás előtt
Az előnézeti párbeszédablak legfeljebb 50 észlelt entitást jelenít meg táblázatban:
- Entitástípus (SZEMÉLY, E_MAIL_CÍM, TELEFONSZÁM stb.)
- Eredeti szöveg
- Javasolt csere
- Megbízhatósági pontszám
Lehetőségek:
- Minden entitást egyenként elfogadhat vagy elutasíthat
- Mindet kijelöl / mindet megszüntet
- Entitásonként áttekinthet bármilyen változás alkalmazása előtt
Csak az elfogadott entitások kerülnek anonimizálásra az Alkalmaz gombra kattintáskor. A Ctrl+Z visszavonja az utolsó műveletet a Writerben.
Előbeállítások és eszközök közötti szinkronizálás
Mentse az anonimizálási konfigurációkat előbeállításként — milyen entitástípusokat kell felismerni, milyen módszereket kell alkalmazni, milyen megbízhatósági küszöbök legyenek — és használja fel azokat újra más dokumentumokon.
Fizetős csomagokban az előbeállítások automatikusan szinkronizálnak az összes anonym.legal platformon:
- Állítson be egy előbeállítást a webalkalmazásban
- 5 percen belül megjelenik a LibreOffice-ban, az asztali alkalmazásban és az Office-bővítményben
- A titkosítási kulcsok ZK-burkolással szinkronizálnak (XChaCha20-Poly1305) — csak a jelszava képes visszafejteni azokat
LibreOffice vs. Microsoft Office: ugyanaz a motor, ugyanazok az eredmények
| Funkció | LibreOffice-bővítmény | Office-bővítmény |
|---|---|---|
| Entitástípusok | 285+ | 285+ |
| Nyelvek | 48 | 48 |
| Módszerek | 5 (Csere, Maszk, Kitakarás, Hash, Titkosítás) | 5 (Csere, Maszk, Kitakarás, Hash, Titkosítás) |
| Formázásmegőrzés | Csak Writer | Csak Word |
| Előnézeti párbeszédablak | Legfeljebb 50 entitás | Legfeljebb 50 entitás |
| ZK hitelesítés | Igen | Igen |
| Előbeállítás-szinkronizálás | Igen (fizetős csomagok) | Igen (fizetős csomagok) |
| Platformok | Windows, macOS, Linux | Windows, Mac, Web, iPad |
Mindkét bővítmény ugyanazt a háttér-felismerési motort használja. A Wordban anonimizált dokumentum ugyanolyan entitáselismerési eredményt ad, mint ugyanaz a szöveg a Writerben feldolgozva.
Rendszerkövetelmények
- LibreOffice 3.0 vagy újabb
- Python 3 (a legtöbb LibreOffice telepítéssel együtt szállítva)
- Internetkapcsolat (PII-felismerési API-hoz)
- anonym.legal fiók (ingyenes csomag: havi 200 token)
Első lépések
- Töltse le a bővítményt (.oxt fájl)
- Kattintson duplán a telepítéshez, indítsa újra a LibreOffice-t
- Nyissa meg a Nézet, majd az Oldalsáv menüt, és válassza ki az anonym.legal panelt
- Jelentkezzen be fiókjával
- Nyisson meg egy dokumentumot, kattintson az Elemzés gombra, tekintse át az eredményeket, majd kattintson az Alkalmaz gombra
Teljes dokumentáció: LibreOffice bővítmény dokumentáció
Források
- The Document Foundation — becsülhetően 200 millió+ LibreOffice-felhasználó világszerte
- anonym.legal PII-felismerési teszt — 95,5% pontosság, 42/44 független teszten
- GDPR 26. preambulumbekezdés — az anonimizálás kiveszi az adatot a GDPR hatálya alól; 4. cikk (5) bekezdés — pszeudonimizálás meghatározása