Διατήρηση Μορφοποίησης Word: Νομικές Απαιτήσεις Αναφοράς (2025)
Αναφορά Νομικού και Μορφοποίηση
Στις νομικές αναφορές, η ακριβής διάταξη και μορφοποίηση δεν είναι απλά διακοσμητική — είναι μέρος της αποδείξης. Ένα έγγραφο που δημιουργήθηκε με:
- Έντονο κείμενο = τονίστηκε κατά τη δημιουργία
- Χρώμα κειμένου = ταξινόμηση προτεραιότητας ή κατηγορίας
- Υπογράμμιση = κατάσταση σημασίας για νομικές πρακτορείες
Word Redaction Standards
Σύμφωνα με το Federal Judicial Center (FJC) και τα προτυπά του NISO, η αναφορά του Word πρέπει:
- Μαύρα κείμενο διαγραφείσα, όχι αποδυναμωμένη (≥100% αδιαφάνεια)
- Διατήρηση αριθμών σελίδας (δικαστήρια περιμένουν τις ίδιες σελίδες)
- Διατήρηση επικεφαλίδων/υποσέλιδων (αναγνώριση εγγράφου)
- Δεν επεξεργασία ή αντιγραφή κειμένου στην ίδια σελίδα (αντίθετα δίνει αντίθεση κάποιο κείμενο που δεν είναι αναφορά)
Πρόβλημα: Αναφορά σε Ανοιχτό Λογισμικό
Το Presidio δεν αποδίδει τη μορφοποίηση Word. Παράδειγμα:
Αρχικό Word έγγραφο:
Grant Agreement #12345
Grantor: **[REDACTED]**
Grantee: John Smith
Amount: €50,000
Presidio Output (απλό κείμενο):
Grant Agreement #12345
Grantor: [PERSON]
Grantee: [PERSON]
Amount: [MONEY]
Πρόβλημα: Πάει χαμένη από έντονα στο Grantor — δικαστήρια δεν μπορούν να δουν ότι το Grantor ήταν έντονο στο αρχικό.
Λύση: Ρήγμα Office Open XML
Τα αρχεία Word (.docx) είναι πακέτα XML. Η ρήγμα διατηρεί τη μορφοποίηση με:
- Αφαιρέστε το .docx ως .zip
- Ανάγνωση document.xml (κύριο περιεχόμενο)
- Βρείτε κόμβους κειμένου (w:t) με ευαίσθητο κείμενο
- Αντικαταστήστε κείμενο με [REDACTED]
- Διατήρηση γονικός w:r (τρέξιμο) μορφοποίησης κόμβου (bold, italics, κλπ)
- Επανατοποθέτηση .zip ως .docx
Παράδειγμα XML:
<!-- Before redaction -->
<w:p>
<w:r>
<w:rPr>
<w:b/> <!-- bold -->
</w:rPr>
<w:t>John Doe</w:t> <!-- person name -->
</w:r>
</w:p>
<!-- After redaction (preserves bold) -->
<w:p>
<w:r>
<w:rPr>
<w:b/> <!-- bold preserved -->
</w:rPr>
<w:t>[REDACTED]</w:t>
</w:r>
</w:p>
anonym.legal Word Redaction
Το anonym.legal υποστηρίζει:
POST /api/redact-document
Content-Type: multipart/form-data
{
"file": <docx_file>,
"format": "docx",
"preserve_formatting": true
}
Το API:
- Δέχεται .docx
- Εξάγει document.xml
- Τρέχει Presidio ανίχνευση στο κείμενο
- Αναφορά με διατήρηση w:rPr (τρέξιμο ιδιοτήτων)
- Επανατοποθέτηση .zip
- Επιστροφή αναφορά .docx με ταυτοδύναμη σελίδα αριθμοί