anonym.legal

By · Last updated 2026-06-05

Povratak na blogGDPR i usklađenost

Japan PPC APPI: Uskladjenost podataka za AI obuku

Japanska PPC primenjuje APPI amandmane iz 2022. koji pokrivaju 2,4 miliona japanskih preduzeca. My Number 12-cifreni ID zahteva Verhoeff validaciju.

June 5, 202610 min čitanja
Japan PPCAPPI complianceMy Number detectionJapanese privacy lawAsia Pacific

Japan PPC i APPI: Uskladjenost podataka za AI obuku

Japanska PPC primenjuje APPI. Amandmani iz 2022. promenili su zakon vise nego ikad pre. Dodali su pravila za pseudonimizovane podatke, prekogranicne prenose i skupove podataka za obuku AI. PPC je izdao 45 odluka u 2024. godini. Te godine objavio je i prvi japanski AI vodic za zastitu privatnosti.

Ako vasa kompanija trenira modele na japanskim tekstovima ili cuva japanske korisnicke podatke, ova pravila se primenjuju odmah.

Sta su amandmani iz 2022. promenili

2,4 miliona japanskih kompanija moralo je da azurira pravila o privatnosti i preradi postupke obrade.

Pseudonimizovani podaci (仮名加工情報): Nova srednja kategorija. Pokriva licne podatke sa uklonjenim direktnim identifikatorima. Ponovna identifikacija je jos uvek moguca uz odgovarajuci kljuc. Ovi podaci mogu se prenositi unutar organizacije bez punog pristanka. Ne mogu ici trecim stranama. GDPR nema takvu kategoriju.

Anonimizovani podaci (匿名加工情報): Ponovna identifikacija mora biti tehnicki nemoguca. To mora potvrditi kvalifikovana treca strana. Japanski standard je visi od GDPR-a u ovom pogledu. GDPR cini takav pregled opcionalnim. APPI ga cini obaveznim.

Prekogranicni prenosi: Prenosi u druge drzave moraju ispuniti japanski standard zastite. PPC vodi listu odobrenih zemalja. EU je na toj listi.

Skupovi podataka za AI obuku: PPC smernice iz 2024. direktno su se bavile ovim pitanjem.

  • Skupovi podataka za obuku moraju biti potpuno anonimizovani ili zasnovani na valjanoj pravnoj osnovi - obicno pristanku.
  • Izuzetak za obradu primenjuje se samo ako model ne moze da identifikuje ljude iz svojih rezultata.
  • LLM programeri koji treniraju na japanskim podacima preuzetim sa sajtova moraju pokazati valjanu osnovu za prikupljanje.

Za potpun pregled obaveza uskladjenosti prekogranicnih prenosa, pogledajte /legal/compliance.

My Number: japanski nacionalni ID

My Number (マイナンバー) je 12-cifreni nacionalni ID. Japan ga dodeljuje svim rezidentima. Strani drzavljani ga takodje dobijaju. Sistem funkcionise od 2016. godine. Pokriva porez, socijalnu zastitu i reagovanje na katastrofe.

Kako funkcionise kontrolna cifra: My Number koristi Verhoeff metodu. To je matematicka sema provere gresaka. Teze je izgraditi nego Luhn - metodu koja se koristi za svedski personnummer i kanadski SIN. Vecina evropskih ID-jeva koristi jednostavniju modularnu matematiku.

Zasto je detekcija teska: Skeniranje 12-cifrenih nizova promasis cilj. Datumi, postanski kodovi i sifre faktura izgledaju isto. Potrebna vam je kompletna Verhoeff logika da ih razlikujete. Jednostavni regex nije dovoljan.

PPC pregled iz 2024. imao je jasan nalaz. 63% generickh NLP alata ne uspeva da detektuje My Number u japanskim zapisima.

Pogledjte kako anonym.legal rukuje My Number na /entities.

Tri sistema pisanja istovremeno

Japanski koristi Hiraganu, Katakanu i Kanji istovremeno. Rimsko pismo pojavljuje se u nekim kontekstima. Isto ime moze izgledati razlicito u razlicitim zapisima. Alati napravljeni za tekst latinskog pisma ne rade na japanskom bez dodatne podrske.

Sta ovo znaci za detekciju imena:

  • Japanski NER zahteva modele trenirane na japanskim tekstovima. Koristite spaCy ja_core_news.
  • Japanski nema razmake izmedju reci. Razdvajanje reci je poseban korak koji zahteva alate svesne japanskog.
  • Licna imena pojavljuju se u Kanjiju sa vodicima za citanje u Hiragani ili Katakani. Alati moraju uhvatiti oba oblika.
  • Nazivi kompanija (会社名, 株式会社) zahtevaju pravila specificna za Japan.

Za NER kroz APAC jezike, pogledajte /docs/faq.

Drugi japanski ID formati

Vozacka dozvola: 12 cifara sa prefiksnim kodom za region izdavanja. Kodovi su fiksni - Tokio je 10, Osaka je 62. Deo regiona je proverljiv.

Pasose: Standardni ICAO format sa japanskim pravilima izdavanja.

Kartica zdravstvenog osiguranja (健康保険証): Simbol (記号) plus broj. Format varira u zavisnosti od osiguravaca.

Kartica boravka (在留カード): Za strane rezidente. Format: dva slova, osam cifara, dva slova. Ministarstvo pravde ih izdaje.

Status prenosa podataka Japan-EU

Japan i EU imaju uzajamnu adekvatnost od 2019. Licni podaci mogu se prenositi izmedju EU i Japana bez dodatnih koraka. Japan je jedna od retkih neevropskih drzava sa punom EU adekvatnoscu.

Sporazum pokriva standardne licne podatke. Osjetljivi zdravstveni i krivicni podaci zahtevaju dodatne zastite cak i pod adekvatnoscu. Kompanije koje prenose ove podatke moraju evidentirati dodatne korake koje koriste.

Preispitajte svoje obaveze prenosa na /security-compliance.

Vas japanski checklist uskladjenosti

Pocnite ovde ako rukujete japanskim licnim podacima:

  • Detekcija My Number sa Verhoeff logikom kontrolne cifre.
  • Japanski NER sa modelima treniranim na tekstu japanskog pisma - ne latinskim modelima.
  • Podrska za Kanji, Hiragana i Katakana forme imena plus varijante vodica za citanje.
  • Detekcija vozacke dozvole sa proverama koda regiona.
  • Detekcija kartice boravka sa MOJ logikom formata.
  • Detekcija kartice zdravstvenog osiguranja kroz varijante osiguravaca.
  • Valjana pravna osnova za svaki skup podataka za AI obuku koji sadrzi licne podatke.
  • Pregled trece strane za sve podatke klasifikovane kao anonimizovane pod APPI.
  • Dodatne zastite za osjetljive podatke koji se prenose pod EU-Japan sporazumom o adekvatnosti.

Pogledjte /docs/glossary za definicije APPI termina koji se koriste u ovom vodicu.

Izvori

Spremni da zaštitite svoje podatke?

Počnite sa anonimizacijom PII sa 285+ tipova entiteta na 48 jezika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.