Масштаб проблеми
Дослідницький центр академічної медицини потребує де-ідентифікувати 50 000 клінічних нотаток для:
- Затвердженого IRB дослідження
- FDA-поданого набору даних
- Академічного публічного репозиторію даних
Опції:
- Хмарний API — але CISO не схвалює PHI в хмарі
- Ручний огляд — 50 000 нотаток × 5 хвилин = 4 167 годин
- Desktop App від anonym.legal — локальна обробка, нуль зовнішніх запитів
Технічні налаштування для пакетної обробки
Крок 1: Підготуйте ваші нотатки
notes/
note_001.txt
note_002.txt
...
note_50000.txt
Крок 2: Налаштуйте параметри де-ідентифікації
- Виберіть пресет HIPAA Safe Harbor
- Визначте будь-які спеціалізовані MRN шаблони вашого закладу
- Встановіть вивід: замінення токенами або [REDACTED]
Крок 3: Запустіть пакет
- Desktop App обробляє локально
- Журнали аудиту для кожного файлу
- PHI ніколи не залишає вашу мережу
Крок 4: Перевірка
- Вибіркова перевірка виводу
- Огляд журналу аудиту на аномалії
- Документуйте для звіту IRB
Продуктивність
Типова пропускна здатність:
-
Короткі нотатки (100-500 слів): 500-1 000/хвилина
-
Довгі нотатки (1 000-5 000 слів): 100-300/хвилина
-
50 000 коротких нотаток ≈ 50-100 хвилин
Джерела: