Van zes weken DevOps-pijn naar een 3-daagse integratie
Bijgewerkt voor 2026.
Zes weken. Twee engineers. Vier mislukte implementatiepogingen. Eén healthcare SaaS-team besteedde dit allemaal aan een zelf-gehoste Presidio-setup. Daarna schakelden ze over op een beheerde API. De overstap duurde 3 dagen.
Het "gratis" label op open-source software is verleidelijk. De belofte van volledige controle ook. Maar de werkelijke kosten blijken in engineeringtijd.
Wat de zes weken omvatten
Week 1–2: Omgevingsinstallatie
Docker-conflicten. Python-versie-incompatibiliteiten. spaCy-model download-fouten. De engineers gingen GitHub Issues door. Elke oplossing introduceerde een nieuwe afhankelijkheidsconflict.
Week 3–4: Entiteitsconfiguratie
Presidio's standaard entiteiten detecteerden geen ziekenhuisspecifieke MRN-formaten. De engineers schreven aangepaste recognizers. De custom recognizers produceerden te veel valse positieven. Tuning kostte extra tijd.
Week 5–6: Productietest en debug
Het systeem werkte in staging. In productie was de latency te hoog. Documenten die te groot waren voor de batch-instellingen mislukten. Meer tuning.
Na zes weken: nog niet productie-klaar.
De beheerde API-integratie
Dag 1: API-sleutel instellen, documentatie lezen Dag 2: SDK integreren in de bestaande pijplijn Dag 3: testen, valideren, in productie zetten
Code voor de integratie:
from anonym_legal import AnonymClient
client = AnonymClient(api_key=os.environ["ANONYM_API_KEY"])
def process_clinical_note(note_text):
result = client.anonymize(
text=note_text,
preset="hipaa-safe-harbor"
)
return result.anonymized_text, result.audit_log
Geen Docker. Geen spaCy-modellen. Geen aangepaste recognizers. De beheerde API behandelt de HIPAA Safe Harbor-entiteiten inclusief ziekenhuisspecifieke configuratie via het preset-systeem.
Wanneer zelf-hosten zinvol is
Zelf-hosten heeft zijn plaats voor teams die:
- Volledige controle over het detectiemodel vereisen
- Geen gegevens extern kunnen sturen
- Een dedicated ML-team hebben voor onderhoud
Voor teams die compliance vandaag nodig hebben, niet na zes weken implementatiewerk, is de beheerde API de juiste keuze.