Zurück zum BlogLegal Tech

GDPR und Ihre Excel-Dateien: Warum die Anonymisierung...

Excel-Formeln verweisen auf Zellen mit Kundennamen. Pivot-Tabellen speichern sensible Daten.

April 10, 20268 min Lesezeit
Excel anonymizationspreadsheet GDPRpivot table redactioncell-level PII detectionformula preservation

Warum Tabellenkalkulationen keine Dokumente sind

Ein Word-Dokument ist ein sequenzieller Textstrom mit Formatierungsmetadaten. Eine Excel-Tabelle ist eine relationale Datenstruktur: Zellen verweisen auf andere Zellen, Formeln arbeiten mit Zellbereichen, Pivot-Tabellen aggregieren benannte Datenbereiche und Makros durchlaufen das Objektmodell der Tabelle. Eine Excel-Datei als Textdokument zu behandeln, das auf PII-Muster verarbeitet werden soll — was die meisten Werkzeuge zur Schwärzung von Dokumenten bei Tabellenkalkulationen tun — verpasst die Datenbeziehungen, die den tatsächlichen Inhalt der Tabelle definieren.

Betrachten Sie eine Kundenanalyse-Tabellenkalkulation. Spalte A enthält Kundennamen. Spalte D enthält eine Formel: =VLOOKUP(A2, CustomerTable, 5, FALSE) — ein Lookup, das den Kontostand des Kunden basierend auf seinem Namen zurückgibt. Wenn das Anonymisierungstool den Namen in Spalte A ersetzt, aber die Formelreferenz oder die Lookup-Tabelle nicht aktualisiert, gibt die Formel weiterhin den tatsächlichen Kontostand für den ursprünglichen Namen zurück. Das "anonymisierte" Dokument offenbart weiterhin die ursprüngliche Kundenidentität durch die Datenbeziehung.

Dies ist kein hypothetischer Grenzfall. Unternehmens-Excel-Dateien sind um Datenbeziehungen herum aufgebaut. Anonymes Ersetzen einzelner Zellwerte ohne Verständnis der relationalen Struktur erzeugt Dokumente, die anonymisiert erscheinen, aber die ursprünglichen Daten durch Formelreferenzen, Pivot-Tabellen-Caches und bereichsübergreifende Suchen beibehalten.

Die GDPR-Anforderung zur Weitergabe an Dritte

Artikel 28 der GDPR regelt die Datenweitergabe an Auftragsverarbeiter: Organisationen, die personenbezogene Daten mit externen Parteien (Beratern, Analyseanbietern, Prüfern) teilen, müssen angemessene technische Schutzmaßnahmen gewährleisten. Die praktische Frage: Was ist eine angemessene Schutzmaßnahme, wenn ein Excel-Datensatz mit 50.000 Kundenaufzeichnungen an einen externen Analyseanbieter weitergegeben wird?

Der PDF-Export entfernt Formeln und erzeugt einen Snapshot — aber PDF-Exporte großer Excel-Dateien beschädigen häufig komplexe Formatierungen und sind nicht für analytische Zwecke geeignet. Die Umwandlung in CSV entfernt Formeln, Pivot-Tabellen und die meisten analytischen Strukturen. Keine der Optionen bietet dem externen Anbieter einen nutzbaren Datensatz für seine analytischen Zwecke.

Die Anonymisierung auf Zellenebene im nativen Excel-Format — das Ersetzen identifizierbarer Werte bei gleichzeitiger Beibehaltung der analytischen Struktur — ist der einzige Ansatz, der sowohl die Anforderung an den GDPR-Schutz als auch die Anforderung an den geschäftlichen Nutzen gleichzeitig erfüllt.

Luftdicht abgeschottete Verarbeitung für Verteidigungstabellen

67 % der Beschaffung RFPs von Regierung und Verteidigung geben Anforderungen an luftdicht abgeschottete Umgebungen an (DISA 2024). Verteidigungsauftragnehmer, die mit Personaldaten, Logistikinformationen oder Beschaffungsunterlagen im Excel-Format arbeiten, können aus den gleichen Gründen, die die cloudbasierte Dokumentenverarbeitung verbieten, keine cloudbasierten Anonymisierungstools verwenden: Die Daten dürfen das kontrollierte Netzwerk nicht verlassen.

Die Kombination aus Excel-spezifischer Anonymisierungsfähigkeit und lokalem Verarbeiten schafft das technische Profil, das für die Einhaltung von Regierungsverträgen erforderlich ist. Die Desktop-App verarbeitet Excel-Dateien lokal ohne Netzwerkaufrufe während der Verarbeitung; die Anonymisierungsergebnisse verlassen niemals die luftdicht abgeschottete Umgebung; die verarbeiteten Dateien sind für den internen Austausch innerhalb des kontrollierten Netzwerks verfügbar.

Zellenbasierte Intelligenz

Effektive Excel-Anonymisierung funktioniert gleichzeitig auf drei Ebenen:

Wert-Ebene: Erkennung und Ersetzung von PII-Werten in einzelnen Zellen. Kundennamen, E-Mail-Adressen, Telefonnummern und nationale ID-Nummern werden durch dieselbe hybride Erkennungsengine identifiziert, die auch für die Dokumentenverarbeitung verwendet wird.

Formel-Ebene: Identifizierung von Zellen, deren Formeln auf PII-haltige Zellen verweisen, und Aktualisierung dieser Referenzen, um auf die anonymisierten Werte zu verweisen oder die Formel durch ihr berechnetes Ergebnis zu ersetzen, um eine PII-Exposition durch Formeln zu verhindern.

Struktur-Ebene: Löschen von Pivot-Tabellendaten-Caches, Verarbeiten von versteckten Zeilen und Spalten sowie Handhabung von VBA-Makrocode, der auf bestimmte Zelladressen oder Werte verweist.

Quellen:

Bereit, Ihre Daten zu schützen?

Beginnen Sie mit der Anonymisierung von PII mit über 285 Entitätstypen in 48 Sprachen.