By · Last updated 2026-03-07

Itzuli BlogeraOsasuna

CISO-ek Hodei PHI Prozesatzea Ukatzean

2024ko osasun-datuen 725 hausteak 275 milioi erregistro esposatu zituen. 10,22 milioi dolako batez besteko hauste-kostuarekin - edozein industrietako handiena - osasuneko CISO-ek...

March 7, 20269 min irakurri
HIPAA compliancehealthcare data breachPHI de-identificationlocal processing

Osasun-Sektorearen Hauste Arazoa

2026rako eguneratua: 2024ko 725 osasun-datuen haustek 275 milioi erregistro esposatu zituen (HHS OCR). Zenbaki horrek AEBetako biztanleria osoa gainditzen du.

Kostua handia da. Osasun-hausteen batez bestekoa 10,22 milioi dolarrekoa da. Hori edozein industrietako kostu altuena da - hamabost urte jarraian (IBM Cost of Data Breach 2025). Osasun-hauste guztien erdia baino gehiago saltzaile edo negozio-bazkide batean hasten dira (HHS OCR 2024). Mehatxua ez da barne bakarrik.

Zenbaki horiek ospitale-buruen jokabidea aldatu du. Sistema handiko osasun-sistemetan, CISO-ak ez du hodei-tresnak PHI lanetarako onartzen. Arrisku handia da.

Honek gatazka erreala sortzen du kliniko-taldeen artean. Oharpetatik paziente-datuak kendu behar dituzte. Lana ikerketa, kalitate-txostenak eta prestakuntza-datu-multzoentzat behar da. Eskala handian ondo funtzionatzen duten tresnak behar dituzte. Hodei-tresnak blokeatuta daude. Eta hutsunea hazten ari da.

Zergatik Hodei PHI Tresnak Blokeatzen Diren

HHS Zibil Eskubideek betearazpena bizkortu dute. 2024ko HIPAA Segurtasun Arauaren eguneraketa 2013az geroztik lehena izan zen. Eskaera berri argiak gehitu zituen:

  • Enkriptatzea transitan eta atsedenerako PHI elektroniko guztientzat
  • Business Associate Agreements (BAA) hirugarren saltzaile guztiekin
  • Saltzaile-hautasun bakoitzerako arrisku-analisi erregistroak
  • Intzidente-erantzun planak

Ospitale batek hodei de-identifikazio tresna bat berrikusten duenean, segurtasun-taldeak hiru gauza erakutsi behar ditu. Bat: saltzaileak ezin du PHI ikusi. Bi: BAA-k erabilera-kasu zehatza betetzen du. Hiru: saltzailearen hauste batek ez ditu paziente-erregistroak agerian utziko.

Osasun-haustearen erdia saltzaileekin hasten da jada. Beraz, arrisku-taldeek askotan ezin dituzte hodei PHI tresnak onartu. Hau hala da saltzailearen segurtasun-aldarrikapenak zein sendoak diren arren.

BAA sinatu baten ondoren ere, CISO-aren ikuspegia askotan berdina da: BAA erruduntasuna esleitzen du hauste baten ondoren. Ez du haustea eragozten. Ez dugu kate-saltzaile gehiago behar. Gure segurtasun-ikuspenak azaltzen du nola tokiko prozesatzeak kate hori kentzen duen.

Zehaztasun-Arazoa

Hodei-blokoa garrantzi gutxiago izango luke tresna sinpleagoak lana egin balezakete. Ikerketek erakusten dute ezin dutela.

2025eko ikerketa batek ikusi zuen erabilera orokorrerako LLM tresnek testu libreko oharretan kliniko PHI-aren erdina baino gehiago galtzen duela (arXiv:2509.14464). HIPAA Safe Harbor-ek 18 identifikatzaile-mota kentzen eskatzen du. Kliniko-oharrek identifikatzaile horiek ezkutatzen dituzte laburduretan, tokiko terminoetan eta beste hizkuntzetako hitzetan.

Tresna estandarrek kasu hauek galtzen dituzte:

  • "Pte. J.D., DOB 4/12/67" - laburdurako izena eta data-formatua
  • "Dx: HCC f/u, hitzordua UCSF MC-n" - ospitale-izena kliniko laburduran
  • "Dr. Smith-ek ikusia ED #3, Gela 12B-n" - hornitzaile-izena gela-zenbakiarekin
  • MRN formatuak (7-8 zifra, gunearen arabera aldakorra) beste zenbakiekin nahastuak

%50 baino gehiagoko galera-tasekin oharren gainean eraikitako ikerketa-datu-multzo batek HIPAA arauak betetzen ez ditu. IRB arazoak sortzen ditu. Aplikatzeko arrisku bat sortzen du hutsunea paper bat argitaratu ondoren agertzen bada. Gure betetze-orriak Safe Harbor eta Aditu Zehaztapena estandarrak biak biltzen ditu.

Tresna Hutsunea

Kliniko-informatika-taldeek benetako hutsune bati aurre egiten diote. Aukera guztiek muga serioteak dituzte.

Merkataritza-hodei-zerbitzuak ondo funtzionatzen dute. Baina kanpoko saltzaile bati osasun-datu babestuak bidaltzea eskatzen dute. Sistema handietako ospitale gehienek hau blokeatzen dute.

Kode irekiko tresnek (Presidio eta MIST bezalakoek) in situ funtzionatzen dute. Baina konfigurazio astuna eta etengabeko arreta behar dituzte. Askotan HIPAA zehaztasun-maila lortzen ez dute lan-pertsonalizazio gehigarririk gabe. Ikusi gure glosarioa termino nagusien definizio arruntetan.

Eskuzko de-identifikazioak Aditu Zehaztapena metodoan trebatutako estatistikari bat behar du. Estatistikak erakutsi behar du berreidentifikazio-arriskua oso txikia dela. Hau erregistro-multzo txikientzat funtzionatzen du. Ez du funtzionatzen 50.000+ erregistroekin.

Metodo hibridoek tresna automatizatuak eskuzko berrikuspenarekin markaturiko elementuekin nahasten dituzte. Honek bolumenarekin laguntzen du. Baina ez du zehaztasun-arazoa konpontzen zati automatizatuan.

Beharrizan argia dago. Kliniko-taldeek hodei-mailako zehaztasuna behar dute. Horrek NLP, regex eta transformatzaile-modeloak esan nahi ditu. Eta guztia tokiko hardwarean exekutatu behar da. Kanpoko deialdirik gabe. Saltzaile-sarbiderik paziente-datuetara gabe.

2024ko Arauzko Erantzuna

2024ko 725 hausteek erantzun arauzko sendoa ekarri zuten.

HHS Zibil Eskubideek 120 baino gehiago HIPAA betearazpen-ekintza atera zituzten urte hartan. Isunak errekordeak apurtu zituen. 2025eko martxoaren HIPAA Segurtasun Arauaren eguneratzeak eskaera berriak gehitzen ditu:

  • Urteko enkriptatze-auditoriak
  • PHI elektronikoa kudeatzen duten sistema guztientzat faktore anitzeko sarbidea
  • Zibersegurtasun-informazio-betebeharrak
  • Saltzaile-ikuskapen-arau zorrotzagoak

Entitate orotarako, betetze-kostuak gora egiten jarraitzen dute. Isunak gora egiten dute. Baita erregistroen bidez betetza frogatzeko lana ere. Gure FAQ-ek arau horiei buruzko ohizko galderak biltzen ditu.

HIPAA-k de-identifikaziorako estandar argiak ezartzen ditu. Safe Harbor 18 identifikatzaile-mota guztiak kentzen ditu. Aditu Zehaztapenak berreidentifikazio-arriskua baxua dela frogatzen du. PHI-aren erdia baino gehiago galtzen duen tresna batek ez du estandar bat betetzen.

Tokiko De-Identifikazioak Zer Behar Duen

Tokiko tresna batek hodei-zerbitzuen detekzio-kalitatea lortu behar du. Horrek lau geruza behar ditu.

1. Geruza - Regex kliniko patroekin. Identifikatzaile egituratuak - MRN-ak, SSN-ak, NPI-ak, DEA zenbakiak - regex-erako egokiak dira. Liburutegi kliniko on batek sistema sanitarioen MRN formatuak biltzen ditu. Gune batetik bestera asko aldatzen dira.

2. Geruza - Erakundeen izenen ezagutzea. Kliniko-oharrek PHI testu arruntetan ezkutatzen dute. Sendagile-izenak kontatutako esaldietan agertzen dira. Paziente-izenak hainbat formatutan agertzen dira. Kokapena historia medikoan agertzen da. Testu kliniko gainean prestatutako NLP modeloek horiek guztiak aurkitu ditzakete.

3. Geruza - Hizkuntza anitzak. AEBetako osasun-zerbitzuak hainbat hizkuntza hitz egiten dituzten pazienteei zerbitzatzen die. PHI pazientearen hizkuntza naturalean ager daiteke itzulitako ohar batean. Gaztelania, Txinera, Arabiera, Vietnamera eta Tagaloga AEBetako paziente-erregistroetan agertzen dira. Detekzioak horiek guztiak estaliz.

4. Geruza - Testuinguru-puntuazioa. Zazpi zifrako zenbakia MRN bat da ohar batean eta dosi bat beste batean. Testuinguru-puntuazioak positibo faltsuak murrizten ditu. Horrek berrikuste-marka gutxiago eta ikuskaritza-emaitza garbiago esan nahi du.

Eskala Handirako Batch Prozesatzea

Ikerketa-datu-multzoak handiak dira. Unibertsitate-mediku-zentro batean bost urteko proiektu batek 500.000 testu libre-ko ohar eduki ditzake. Bolumen hori kudeatzeko, tresna batek behar du:

  • Aldi berean hainbat dokumentu prozesatzeko exekuzio paraleloak
  • DOCX, PDF, testu arrunta eta EHR esportazioetarako laguntza
  • Hutsegiteko elementuen aurrerapen-jarraipena eta errore-erregistroak
  • Zer prozesatu zen eta noiz erakusten duen ikuskaritza-arrastoa
  • ZIP irteera ikerketa-bazkideetara erraza transferitzeko

Eskuzko berrikuspenak ez du eskala horretan funtzionatzen. Hodei-tresnak blokeatuta daude. Aurrerako bidea bakarra da batch laguntza sendoarekin zehaztasun-tokiko prozesatzea.

Benetako Lan-Fluxua

Eskualdeko ospitale batek unibertsitateko bazkide batekin baterako ikerketa baterako EHR datu-multzo de-identifikatua nahi du. CISO-ak paziente-datuak hodei-prozesatzea blokeatu du 2024ko hauste-zenbakien ondoren.

Hau da tokiko-lehena tresna batekin lan-fluxua:

  1. Esportatu. EHR sistemak 50.000 kliniko-ohar DOCX dokumentu gisa esportatzen ditu tokiko karpeta segurura.
  2. Prozesatu. Desktop appak 5.000 dokumentuko 10 batch exekutatzen ditu gauez tokiko lan-postuetan.
  3. Berrikusi. Kliniko-informatika-taldeak lagin bat egiaztatzen du HIPAA Safe Harbor arauaren arabera.
  4. Dokumentatu. Prozesatze-erregistroak kudeatutako elementu guztiak, erabilitako detekzio-metodoa eta denbora-marka biltzen ditu. Hau IRB ikuskaritza-arrastoa da.
  5. Transferitu. De-identifikatutako irteera paketatu eta unibertsitatera bide segurua bidaltzen zaio.

CISO-ak onartzen du ospitaleko sarean paziente-daturik atera ez delako. IRB-ak onartzen du metodoak Safe Harbor dokumentazio-arauak betetzen dituelako. Unibertsitateak beren datu-erabilera-hitzarmenera egokitzen den datuak jasotzen ditu. Ikusi gure kasu-ikasgaiak adibide erreal gehiagorako.


anonym.legal-ren Desktop App-ek hodei-kalitatea PHI de-identifikazioa ematen du. Hiru mailako detekzioa erabiltzen du: Presidio NLP, regex eta XLM-RoBERTa transformatzaileak. Lokalean instalatzen da eta konfiguratu ondoren ez du interneta behar. 18 HIPAA Safe Harbor identifikatzaile guztiak onartzen dira. Batch exekuzioak aldi berean 1-5.000 dokumentu kudeatzen ditu.

Iturriak

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.