By · Last updated 2026-04-28

Itzuli BlogeraOsasuna

Zure Tresnak Galtzen Dituen 18 HIPAA Identifikatzaileak

HIPAAk 18 PHI identifikatzaile zerrendatzen ditu. Anonimizazio-tresna gehienek agian 6 detektatzen dituzte. Erregistro Medikoen Zenbakiak instituzioen arabera aldatzen dira AEBetan estandar formaturik gabe.

April 28, 20269 min irakurri
HIPAA 18 identifiersPHI complete detectionMRN detectionNPI DEA numbersHIPAA Safe Harbor compliance

Zure Tresnak Galtzen Dituen 18 HIPAA Identifikatzaileak

2026rako eguneratua.

HIPAAk 18 PHI identifikatzaile kategoria zerrendatzen ditu. Anonimizazio-tresna gehienek agian sei detektatzen dituzte. Gainerako hamabiak iragazten dira -- eta bakoitza betematze-hutsune bat da.

Safe Harbor Araua

HIPAAren Pribatutasun Arauak (45 CFR SS 164.514) Safe Harbor de-identifikazioa definitzen du. 18 identifikatzaile kategoria guztiak joan behar dira. Guztiak kendu eta datuak legearen arabera de-identifikatuta daude. Horregatik da Safe Harbor ezaguna: gainditu edo huts egitea da, ez iritzi-gaia.

18 kategoriak hauek dira:

  1. Izenak
  2. Estatua baino txikiagoa den datu geografikoak -- helbide postala, hiria, konderria, posta-kodea
  3. Urtea ez diren datak -- jaiotza, sarrera, irteera, heriotza
  4. Telefono-zenbakiak
  5. Fax-zenbakiak
  6. Helbide elektronikoak
  7. Gizarte Segurantza-kodeak
  8. Erregistro medikoen identifikatzaileak (EMZak)
  9. Osasun-planaren onuradun-kodeak
  10. Kontu-identifikatzaileak
  11. Ziurtagiri eta lizentzia-kodeak
  12. Ibilgailu-identifikatzaileak eta serie-kodeak
  13. Gailu-identifikatzaileak eta serie-kodeak
  14. Web URLak
  15. IP helbideak
  16. Identifikatzaile biometrikoak -- hatz-markak, ahotsa
  17. Aurpegi-argazki osoak eta antzeko irudiak
  18. Beste edozein identifikatzaile kode edo balio berezi

Tresna gehienek 1, 4, 6 eta 7 kategoriak ondo betetzen dituzte. 8, 9, 10, 11, 13 eta 18 ohikoki galtzen dituzte.

EMZ Hutsunea

Erregistro medikoen identifikatzaileak 8. kategorian daude. EMZ formatuak ospitale bakoitzak ezartzen ditu. AEBetan ez dago estandar nazionalik.

A ospitaleak 7 digitako zenbaki osoa erabiltzen du. B ospitaleak "PT-YYYYNNNN" erabiltzen du. C ospitaleak 8 karaktereko alfazenbakizko katea erabiltzen du. D ospitaleak "MRN: " idazten du 9 digitako kode baten aurretik.

Tresna generiko batek ez du "PT-2024-8847" PHI gisa markatuko. Dokumentua de-identifikazio-egiaztapenetatik igarotzen da. Baina ez dago de-identifikatuta. Ez da alertarik ematen. Taldeak lana eginda dagoela uste du. Ez dago.

Hau da hutsune mota txarrena: ixila.

Konpontzeko Hiru Modu

Presidion kodetu. Python trebezia eta etengabeko mantentze-lana behar da. Funtzionatzen du baina denbora kostatu egiten du.

Eskuzko berrikuspena gehitu. Pertsona batek dokumente bakoitza EMZengatik egiaztatu egiten du. Hau ez da eskalagarria.

Erabili AI-lagundutako entitate pertsonalizatuen sorrera. Koderik gabe. Taldeak lagin-balioak ematen ditu. AIak eredua eraiki egiten du.

Hona hemen nola funtzionatzen duen. Taldeak bost EMZ lagin-balio ematen ditu: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. AIak `SVHS-\d{7}` itzultzen du eta laginetan egiaztatzen du. Taldeak HIPAA aurrezarpenean gordetzen du. Etorkizuneko saio guztiek formatua detektatzen dute. Ikuspegi bera onuradun-kodeei eta gailu-serie-kodeei egiten zaie.

Ikusi aurrezarpenek nola funtzionatzen duten HIPAA EMZ detekzio gidan. Ikasi AI eredu lan-fluxuari buruz.

Barne-Suposizio Ezkutua

Team askok lagin-dokumentu batean probak egiten dituzte izen eta telefono-zenbaki batekin. Tresnak gainditzen du. Estaldura osoa dagoela suposatzen dute. Baina laginak instituzio-espezifikoko identifikatzaileak gutxitan biltzen dituzte. EMZak eta onuradun-kodeak ausazko kate bezala agertzen dira tresna generiko batentzat. Alertarik gabe igarotzen dira.

Safe Harbor ikuskaritza egiazkoak 18 kategoria guztiak detekzio-metodo batekin lotzen ditu. 8. kategoriarekin, egiaztatu zure ospitaleko benetako EMZ laginak erabiliz. Ez suposatu tresnak zure formatua ezagutzen duenik.

Errevisatu osoko esparrua gure HIPAA betematze ikuspegi orokorrean.

Ondorioa

Safe Harborak 18 identifikatzaile kategoria guztiak kentzea eskatzen du. Tresna generikoek askoz gutxiago biltzen dituzte. Hutsuneak -- EMZak, onuradun-kodeak, gailu-seriak -- estandar formaturik ez dute, beraz tresna generikoek galtzen dituzte. AI-lagundutako entitate pertsonalizatuek hutsunea ixten dute kode edo eskuzko berrikuspenik gabe.

Iturriak

  • HHS: HIPAA Safe Harbor, 45 CFR SS 164.514 -- hhs.gov. EGIAZTATURIK.
  • Shaip: PHI identifikatzaile motak osasun-zainketaren de-identifikazioan -- shaip.com. EGIAZTATURIK-KANPOKOA.
  • HHS OCR: De-identifikazio jarraibideak 2024an eguneratua -- hhs.gov. EGIAZTATURIK.

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.