By · Last updated 2026-06-05

Itzuli BlogeraGDPR & Betetze

Japoniako PPC eta APPI: AI Prestakuntza Datuen Betetzea

Japoniako PPCak APPI 2022 aldaketak ezartzen ditu 2,4 milioi enpresari aplikatuz. My Number 12 zifrako IDak Verhoeff egiaztapena behar du.

June 5, 202610 min irakurri
Japan PPCAPPI complianceMy Number detectionJapanese privacy lawAsia Pacific

Japoniako PPC eta APPI: AI Prestakuntza Datuen Betetzea

Japoniako PPCak APPI ezartzen du. 2022ko aldaketek aurretiko edozein eguneratzek baino gehiago aldatu zuten legea. Erregistro pseudonimizatuentzako, mugaz gaindiko transferentzietarako eta AI prestakuntza multzoetarako arauak gehitu zituzten. PPCak 45 ebazpen eman zituen 2024an. Urte berean Japan-espezifikoa den lehen AI pribatutasun gida ere argitaratu zuen.

Zure enpresak japoniar testuan ereduak prestatzen baditu edo japoniar erabiltzaileen erregistroak biltzen baditu, arau hauek orain aplikatzen dira.

2022ko Aldaketek Zer Aldatu Zuten

2,4 milioi japoniar enpresak pribatutasun arauak eguneratu eta kudeaketa urratsak berritu behar izan zituzten.

Informazio pseudonimizatua (仮名加工情報): Klase ertaineko berria. Identifikatzaile zuzenak kendutako erregistro pertsonalak biltzen ditu. Berreidentifikazioa oraindik posible da giltza bat badaukazu. Erregistro hauek erakunde barnean bidal daitezke baimenik gabe. Ezin dira hirugarrenei bidali. GDPRk ez du halako klaserik.

Informazio anonimizatua (匿名加工情報): Berreidentifikazioa teknikoki ezinezkoa izan behar da. Hirugarren kalifikatu batek hori baieztatu behar du. Japoniak GDPR baino barra altuagoa du puntu honetan. GDPRk berrikuspen hori hautazkoa egiten du. APPIk beharrezkoa egiten du.

Mugaz gaindiko transferentziak: Beste nazioetatara egindako transferentziek Japoniak ezarritako babes maila bete behar dute. PPCak onartutako herrialdeen zerrenda gordetzen du. EBa zerrendan dago.

AI prestakuntza multzoak: PPCaren 2024ko gidak zuzenean jorratu zuen hau.

  • Prestakuntza multzoak guztiz anonimizatuta egon behar dira edo oinarri juridiko balioduna eduki behar dute — normalean baimena.
  • Prozesatze salbuespena soilik aplikatzen da ereduak bere irteeretatik pertsonak identifikatu ezin baditu.
  • Webguneetan bildutako japoniar erregistroekin prestatzen ari diren LLM garatzaileek bilketa oinarri baliodunak erakutsi behar dituzte.

Mugaz gaindiko lerrokatze betebeharren ikuspegi osoa lortzeko, ikusi /legal/compliance.

My Number: Japoniako Nazio Identifikazioa

My Number (マイナンバー) 12 zifrako nazio ID bat da. Japoniak biztanle guztiei ematen die. Atzerriko nazionalek ere jasotzen dute. Sistema 2016tik dago martxan. Zerga, gizarte segurantza eta hondamendi erantzuna hartzen ditu barne.

Egiaztapen digitua nola funtzionatzen duen: My Numberrek Verhoeff metodoa erabiltzen du. Matematikan oinarritutako errore egiaztapen eskema da. Luhn baino eraikitzeko zailago da — Suediako personnummer eta Kanadako SINerako erabiltzen den metodoa. Europar ID gehienek matematika modular sinpleagoa erabiltzen dute.

Zergatik den detekzio zaila: 12 zifrako kateen bilaketa soil batek ez du nahikoa egiten. Datak, posta kodeak eta faktura kodeak berdinak dirudite. Verhoeff logika osoa behar duzu bereizteko. Regex sinplea ez da nahikoa.

PPCaren 2024ko berrikuspenak aurkikuntza ikusgarria izan zuen. NLP tresna generikoen %63k My Number japoniar erregistroetan detektatzeko huts egiten du.

Ikusi nola kudeatzen duen anonym.legal-ek My Number /entities-en.

Hiru Idazketa Sistema Aldi Berean

Japonierak Hiragana, Katakana eta Kanji erabiltzen ditu aldi berean. Erromatar gidoia testuinguru batzuetan ere agertzen da. Izen bera erregistroen arabera desberdin itxuradun izan daiteke. Latin-gidoirako eraikitako tresnak japonieran huts egiten dute euskarri gabe.

Izen detekziorako zer esan nahi duen:

  • Japoniar NERak japoniar testuan trebatutatko ereduak behar ditu. Erabili spaCy ja_core_news.
  • Japonierak ez ditu zuriuneak hitzen artean. Hitz zatiketa urrats berezia da. Japan-jakitun tresnak behar ditu.
  • Pertsona izenak Kanjiatan agertzen dira Hiragana edo Katakanako irakurketa gidoekin. Tresnek bi formak harrapatu behar dituzte.
  • Enpresa izenak (会社名, 株式会社) Japan-espezifikoa arauak behar dituzte.

APAC hizkuntzetako NERrako, ikusi /docs/faq.

Beste Japoniar ID Formatuak

Gidabaimena: 12 zifra jaulkipen eskualdeko aurrizki kodea dutenak. Kodeak finkatuta daude — Tokioa 10 da, Osaka 62. Eskualde zatia egiaztagarria da.

Pasaportea: ICAO formatu estandarra Japan-espezifikoa jaulkipen arauekin.

Osasun Aseguru Txartela (健康保険証): Ikurra (記号) zenbakiarekin. Formatua aseguratzailearen arabera aldatzen da.

Egoitza Txartela (在留カード): Atzerriko egoiliarrentzat. Formatua: bi letra, zortzi zifra, bi letra. Justizia Ministerioak hauek jaulkitzen ditu.

Japonia-EB Datu Transferentzia Egoera

Japoniak eta EBak elkarrekiko egokitasuna dute 2019tik. Erregistro pertsonalak EBaren eta Japoniaren artean urrats gehigarririk gabe ibiltzen dira. Japonia EB egokitasun osoa duten Europaz kanpoko nazio gutxietako bat da.

Akordioak erregistro pertsonal estandarrak biltzen ditu. Osasun eta zigor historia erregistro sentikorrek egokitasunaren azpian ere babes gehigarriak behar dituzte. Erregistro hauek mugitzen dituzten enpresek erabiltzen dituzten urrats gehigarriak erregistratu behar dituzte.

Berrikusi zure transferentzia betebeharrak /security-compliance-n.

Zure Japoniako Betetzea Zerrenda

Hasiera hemen japoniar erregistro pertsonalak kudeatzen badituzu:

  • My Number detekzioa Verhoeff egiaztapen-digitu logikaarekin.
  • Japoniar NER japoniar-gidoitako testuan trebatutatko ereduekin — ez Latin-gidoi ereduak.
  • Kanji, Hiragana eta Katakanako izen formuentzako eta irakurketa gido aldaeren laguntza.
  • Gidabaimenen detekzioa eskualde kode egiaztapenekin.
  • Egoitza Txartelaren detekzioa MOJ formatu logikaarekin.
  • Osasun Aseguru Txartelaren detekzioa aseguratzaile aldaeren artean.
  • Erregistro pertsonal pertsonalak dituen AI prestakuntza multzo bakoitzerako oinarri juridiko baliodunak.
  • APPIren azpian anonimizatuta sailkatutako edozein erregistroren hirugarrenen berrikuspena.
  • Erregistro sentikorrak EU-Japonia egokitasun akordioaren azpian mugitzeko babes gehigarriak.

Ikusi /docs/glossary gida honetan erabilitako APPI terminoen definizioentzat.

Iturriak

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.