Bijgewerkt voor 2026
Het Precisieprobleem van 22,7%
Een 2024-studie testte Microsoft Presidio op zakelijke bestanden. Presidio is een open-source PII-tool die juridische teams en zorginstellingen veel gebruiken.
De studie mat hoe vaak Presidio gelijk had. Van alle items die het als persoonsnamen markeerde, waren er maar 22,7% werkelijk persoonsnamen. De studie telde 13.536 valse vlaggen over 4.434 voorbeeldbestanden.
De fouten waren niet willekeurig. Ze volgden duidelijke patronen:
- Voornaamwoorden gemarkeerd als personen ("I" aan het begin van een zin)
- Scheepsnamen gemarkeerd als personen ("ASL Scorpio")
- Bedrijfsnamen gemarkeerd als personen ("Deloitte & Touche")
- Landtermen gemarkeerd als personen ("Argentinië", "Singapore")
Geen van deze zijn zeldzame randgevallen. Ze komen voor wanneer een algemeen NLP-model domeinspecifieke tekst verwerkt.
Wat Valse Vlaggen Kosten
In juridisch en medisch werk vereist elke vlag een reactie. Teams staan voor drie opties:
Optie 1: Een mens controleert elke vlag. Advocaat- en experttijd loopt van $200 tot $800 per uur. Bij 22,7% nauwkeurigheid is het volume enorm.
Optie 2: Review overslaan en de uitvoer vertrouwen. Wanneer 77% van de "geredigeerde" items niet gevoelig zijn, creëert u juridisch risico. Rechtbanken hebben advocaten gesanctioneerd voor over-redactie.
Optie 3: De scoredrempel verhogen. Presidio laat gebruikers een score_threshold instellen. Een 2024 DICOM-studie testte dit op 0,7 — een vrij hoge lat. Het resultaat: 38 van de 39 DICOM-afbeeldingen hadden nog steeds valse vlaggen.
Hoe Hybride Detectie Dit Oplost
Het valse-vlag-probleem heeft een duidelijke oplossing. Verdeel het werk op gegevenstype.
Patroonregels voor gestructureerde gegevens. Burgerservicenummers, telefoonnummers, e-mailadressen en ID-formaten volgen vaste regels. Een string past ofwel het patroon en haalt een checksum-test, of niet.
Taalmodellen voor vrije tekst. Voor- en achternamen, bedrijfsnamen en locaties in proza missen rigide structuur. NLP vindt ze wanneer regels dat niet kunnen.
Per-type score-instellingen voor fijne controle. Juridische teams die over-redactie niet kunnen riskeren stellen hoge drempels in voor fuzzy matches.
Bekijk de beveiligingspagina.