Docs/Glossary

Glossaire Vie Privée & Technologie

Définitions de tous les termes, acronymes et concepts utilisés dans l'anonymisation des PII et la protection des données.

Retour à la documentation

94 termes

2

2FA

Authentification à deux facteurs

Chiffrement & Sécurité

Authentification nécessitant deux facteurs de vérification distincts : quelque chose que l'utilisateur connaît (mot de passe) et quelque chose qu'il possède (application TOTP, clé matérielle) ou qu'il est (biométrie). Pris en charge dans anonym.legal comme couche supplémentaire au-dessus de ZK Auth.

#twofa

A

AES-256-GCM

Advanced Encryption Standard 256 bits Galois/Counter Mode

Chiffrement & Sécurité

Un algorithme de chiffrement authentifié combinant AES-256 (clé de 256 bits) avec le mode Galois/Counter pour assurer confidentialité et intégrité. Utilisé dans l'anonymisation réversible d'anonym.legal pour chiffrer les entités remplacées. Garantit à la fois le secret et la détection de falsification.

#aes256gcm

Altération de preuve

Altération de preuve

Juridique & Audit

La destruction, la modification ou le défaut de conservation de preuves pertinentes pour un litige. Un caviardage excessif rendant les documents illisibles peut constituer une altération de preuve. Le calibrage de la précision de l'anonymisation (seuils de confiance, sélection des entités) est essentiel pour un caviardage juridiquement défendable.

#spoliation

Anonymisation

Anonymisation des données

Vie privée & PII

Processus irréversible de suppression ou de transformation des informations identifiantes afin que les individus ne puissent plus être identifiés, directement ou indirectement. Selon le RGPD, les données véritablement anonymisées sortent du champ d’application du règlement.

#anonymization

Application de bureau

Application de bureau anonym.legal

Plateforme & Produits

Application multiplateforme (Windows, macOS, Linux) développée avec Tauri 2.0 et React 18. Offre le traitement local de fichiers, un coffre-fort BIP39 pour ZK Auth hors ligne, l’exportation par lots et la synchronisation API. Prend en charge les déploiements isolés sans accès Internet.

#desktopapp

Application Web

Application Web anonym.legal

Plateforme & Produits

Interface basée sur navigateur sur anonym.legal pour l’analyse, l’anonymisation et le déchiffrement de PII. Prend en charge la saisie de texte, le téléversement de fichiers (PDF, DOCX, TXT), le traitement par lots, ZK Auth, 48 langues et plus de 285 types d’entités. Aucune installation requise.

#webapp

Argon2id

Fonction de dérivation de clé Argon2id

Chiffrement & Sécurité

Lauréat du Password Hashing Competition 2015. Argon2id combine la résistance aux canaux auxiliaires d'Argon2i et la résistance GPU d'Argon2d. Utilisé dans anonym.legal et le coffre-fort de l'application de bureau pour dériver les clés de chiffrement à partir des phrases secrètes des utilisateurs.

#argon2id

B

BIP39

Bitcoin Improvement Proposal 39 — Phrases mnémoniques

Chiffrement & Sécurité

Un standard pour générer des phrases mnémoniques lisibles par l'humain (12 à 24 mots) à partir d'une graine cryptographique. Utilisé dans le coffre-fort de l'application de bureau anonym.legal comme sauvegarde conviviale de la clé de chiffrement dérivée via Argon2id.

#bip39

C

CCPA

Loi californienne sur la protection de la vie privée des consommateurs

Conformité & Réglementations

Loi californienne sur la vie privée accordant aux résidents le droit de savoir, de supprimer et de refuser la vente de leurs informations personnelles. S'applique aux entreprises atteignant certains seuils de chiffre d'affaires, de volume de données ou de vente de données. Significativement modifiée par la CPRA (adoptée en novembre 2020, entrée en vigueur en janvier 2023).

#ccpa

CLOUD Act

Clarifying Lawful Overseas Use of Data Act

Conformité & Réglementations

Loi fédérale américaine (2018) permettant aux autorités américaines d'exiger des fournisseurs cloud basés aux États-Unis la remise de données stockées à l'étranger. En conflit avec les règles de transfert de données du GDPR pour les résidents de l'UE. L'anonymisation des données avant l'envoi dans le cloud est une mesure d'atténuation courante.

#cloudact

Code-Switching

Alternance de Langues Multilingue

Technologie de détection

Le phénomène de mélange de deux langues ou plus dans un même texte ou une même conversation. Fréquent dans les documents multilingues (par exemple, documents juridiques allemands avec des termes techniques anglais). La détection hybride d'anonym.legal gère l'alternance de langues en appliquant simultanément plusieurs modèles linguistiques.

#codeswitching

Coffre-fort

Coffre-fort de clés de chiffrement

Plateforme & Produits

Stockage local sécurisé pour les clés de chiffrement dans l’application de bureau, protégé par dérivation de clé Argon2id à partir d’une phrase secrète principale. Les clés sont stockées chiffrées avec AES-256-GCM et sauvegardées via des phrases mnémoniques BIP39.

#vault

Confidence Scoring

Score de Confiance de Détection d'Entité

Technologie de détection

Un score de 0 à 1 indiquant le niveau de certitude du modèle de détection qu'un segment de texte est une entité PII. anonym.legal propose des seuils de confiance configurables permettant aux utilisateurs d'ajuster le compromis entre précision et rappel selon leur cas d'usage.

#confidencescoring

Confidentialité différentielle

Confidentialité différentielle (DP)

Vie privée & PII

Cadre mathématique permettant de publier des informations statistiques sur des jeux de données tout en garantissant de manière prouvée qu’aucune donnée individuelle ne peut être distinguée. Utilisé dans l’analytique agrégée pour empêcher la réidentification même lors de requêtes sur des résultats agrégés.

#differentialprivacy

CSP

Content Security Policy

Chiffrement & Sécurité

Un mécanisme d'en-tête de réponse HTTP et de balise meta qui restreint les ressources (scripts, styles, images) qu'un navigateur peut charger. La CSP d'anonym.legal inclut object-src 'none', script-src avec nonces, et upgrade-insecure-requests pour prévenir les attaques XSS.

#csp

D

Data Residency

Exigences de résidence des données

Conformité & Réglementations

Exigences légales ou contractuelles spécifiant dans quel lieu géographique les données doivent être stockées et traitées. Pertinent pour le GDPR (transferts de données hors EEE), la BDSG allemande et les réglementations sectorielles en santé et finance.

#dataresidency

Data Sovereignty

Souveraineté numérique des données

Conformité & Réglementations

Principe selon lequel les données sont soumises aux lois et structures de gouvernance du pays où elles sont collectées. Plus large que la résidence des données, il englobe le contrôle sur l'accès aux données et le cadre juridique applicable.

#datasovereignty

Défendabilité

Anonymisation juridiquement défendable

Juridique & Audit

La capacité de démontrer aux régulateurs, tribunaux ou auditeurs que l'anonymisation a été réalisée selon une méthodologie documentée, cohérente et techniquement solide. Les journaux d'audit, scores de confiance et paramètres opérateurs d'anonym.legal soutiennent des workflows d'anonymisation défendables.

#defensibility

Désanonymisation

Attaque de réidentification

Vie privée & PII

Processus consistant à réidentifier des individus à partir de jeux de données supposés anonymisés en les croisant avec des informations auxiliaires. Un risque majeur lors du partage de données insuffisamment anonymisées.

#deanonymization

DLP

Prévention de la perte de données

Plateforme & Produits

Discipline de sécurité et catégorie de logiciels permettant de détecter et de prévenir la transmission non autorisée de données sensibles en dehors d’une organisation. anonym.legal fonctionne comme solution DLP au niveau du navigateur et de l’IA pour les PII.

#dlp

DPA

Contrat de traitement des données

Conformité & Réglementations

Contrat juridiquement contraignant entre un responsable de traitement et un sous-traitant, requis par l'article 28 du GDPR. Précise l'objet, la durée, la nature, la finalité et le type de traitement des données personnelles, ainsi que les droits et obligations des deux parties.

#dpa

DPIA

Analyse d'impact relative à la protection des données

Conformité & Réglementations

Processus d'évaluation des risques requis par l'article 35 du GDPR pour les traitements susceptibles d'entraîner des risques élevés pour les droits et libertés des personnes. Obligatoire pour le profilage systématique, le traitement à grande échelle de PHI et la surveillance des espaces publics.

#dpia

E

e-Discovery

Découverte électronique

Juridique & Audit

Le processus d'identification, de collecte et de production d'informations électroniques dans le cadre de procédures judiciaires. Nécessite la rédaction des PII et des informations privilégiées dans les documents produits. Un cas d'utilisation principal pour les services juridiques utilisant anonym.legal.

#ediscovery

E2EE

Chiffrement de bout en bout

Chiffrement & Sécurité

Chiffrement dans lequel seules les parties communicantes peuvent lire les messages ; le fournisseur de service n'a aucun accès aux données en clair. En mode ZK Auth d'anonym.legal, les clés de chiffrement ne quittent jamais l'appareil client, assurant un E2EE pour le stockage des sorties anonymisées.

#e2ee

Entités de santé

Types d'entités PII de santé

Types d'entités

Types d'entités pour les 18 identifiants Safe Harbor de HIPAA et d'autres PII liés à la santé : US_MRN (numéros de dossier médical), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY, ainsi que des entités de contexte de diagnostic/traitement.

#healthcareentities

Entités financières

Types d'entités PII financières

Types d'entités

Types d'entités couvrant les identifiants financiers : CREDIT_CARD (somme de contrôle Luhn), IBAN_CODE (somme de contrôle ISO 13616), SWIFT_CODE (format BIC), US_BANK_NUMBER, NRP (identifiant fiscal espagnol). Détectés avec validation de somme de contrôle pour minimiser les faux positifs.

#financialentities

Entités personnalisées

Reconnaisseurs d’entités personnalisées

Plateforme & Produits

Modèles PII définis par l’utilisateur, ajoutés en complément des plus de 285 types d’entités intégrés d’anonym.legal. Prend en charge les expressions régulières, listes de mots et listes de refus. Utile pour les identifiants propres à l’organisation tels que les numéros d’employés, codes projets internes ou noms de produits propriétaires.

#customentities

Entités universelles

Types d'entités universels linguistiquement

Types d'entités

Types d'entités détectés indépendamment de la langue du texte, généralement via des expressions régulières basées sur le format avec validation de somme de contrôle. Exemples : CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, adresse CRYPTO.

#universalentities

Extension Chrome

Extension Chrome anonym.legal

Plateforme & Produits

Extension de navigateur (Manifest V3) qui intercepte le texte avant qu’il ne soit envoyé à des chatbots IA (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonymise à la volée et peut déchiffrer les réponses IA à l’aide de clés de chiffrement enregistrées.

#chromeextension

F

FOIA

Loi sur la liberté d'information

Conformité & Réglementations

Loi fédérale américaine (et équivalents dans d'autres juridictions) garantissant l'accès du public aux documents gouvernementaux. Nécessite la rédaction des PII et autres informations exemptées avant divulgation — un cas d'usage principal pour les flux d'anonymisation juridiques et gouvernementaux.

#foia

G

GDPR

Règlement Général sur la Protection des Données

Conformité & Réglementations

Règlement européen 2016/679, le principal cadre de protection des données pour l'Union européenne. S'applique à toute organisation traitant des données personnelles de résidents de l'UE. Amendes jusqu'à 20 M€ ou 4 % du chiffre d'affaires annuel mondial. Droits clés : accès, effacement, portabilité, limitation, opposition.

#gdpr

GDPR Article 25

GDPR Article 25 — Protection des données dès la conception et par défaut

Conformité & Réglementations

Exige que les responsables de traitement mettent en œuvre des mesures techniques et organisationnelles appropriées (telles que la pseudonymisation et la minimisation des données) tant lors de la conception des systèmes que par défaut lors du traitement.

#gdprarticle25

GDPR Article 32

GDPR Article 32 — Sécurité du traitement

Conformité & Réglementations

Exige que les responsables de traitement et les sous-traitants mettent en œuvre des mesures techniques et organisationnelles appropriées pour garantir un niveau de sécurité adapté au risque, incluant chiffrement, pseudonymisation, confidentialité, intégrité, disponibilité et résilience des systèmes de traitement.

#gdprarticle32

GenAI DLP

Prévention de la perte de données pour l’IA générative

Plateforme & Produits

Catégorie DLP spécialisée visant à empêcher l’inclusion de PII et de données confidentielles dans les invites envoyées aux modèles d’IA générative (ChatGPT, Claude, Gemini). L’extension Chrome et le serveur MCP d’anonym.legal traitent ce risque au point de saisie.

#genaidlp

H

Hachage

Hachage cryptographique

Vie privée & PII

Transformation à sens unique de données en un condensé de longueur fixe à l’aide d’algorithmes tels que SHA-256. Utilisé pour la pseudonymisation cohérente, la déduplication et la vérification d’intégrité. Les valeurs de hachage sont irréversibles mais peuvent être vulnérables aux attaques par table arc-en-ciel si elles ne sont pas salées.

#hashing

Hetzner

Hetzner Online GmbH

Infrastructure

Fournisseur allemand de cloud et d'hébergement où l'infrastructure de production d'anonym.legal est hébergée. Situé à Falkenstein, Saxe (datacenter fsn1) avec certification ISO 27001. Choisi pour la résidence des données dans l'UE, la conformité et une juridiction favorable au RGPD selon le droit allemand.

#hetzner

HIPAA

Loi sur la portabilité et la responsabilité de l'assurance maladie

Conformité & Réglementations

Loi fédérale américaine établissant des normes pour la protection des informations de santé sensibles des patients. La Privacy Rule régit l'utilisation des PHI ; la Security Rule impose des mesures administratives, physiques et techniques pour la protection des PHI électroniques (ePHI). Les violations entraînent des amendes pouvant aller jusqu'à 1,9 M$ par catégorie et par an.

#hipaa

HIPAA Safe Harbor

Méthode de désidentification Safe Harbor selon HIPAA

Conformité & Réglementations

L'une des deux méthodes de désidentification approuvées par HIPAA, exigeant la suppression des 18 identifiants spécifiques du patient (nom, adresse, dates, numéros de téléphone, SSN, email, adresse IP, biométrie, etc.) afin de rendre les données de santé non identifiables individuellement.

#hipaasafeharbor

HSTS

HTTP Strict Transport Security

Chiffrement & Sécurité

Un mécanisme de politique de sécurité web qui oblige les navigateurs à n'utiliser que des connexions HTTPS. anonym.legal définit Strict-Transport-Security : max-age=31536000 ; includeSubDomains pour prévenir les attaques de rétrogradation de protocole et le détournement de cookies.

#hsts

Hybrid Detection

Détection Hybride NLP + Regex + ML

Technologie de détection

L'approche en trois couches d'anonym.legal : motifs regex pour la PII structurée (numéros de téléphone, IBAN, cartes de crédit), modèles NLP/NER pour les entités contextuelles (noms, organisations, lieux), et classificateurs ML pour les cas ambigus. Réduit à la fois les faux positifs et les faux négatifs.

#hybriddetection

I

Identifiant gouvernemental

Types d'entités identifiants gouvernementaux

Types d'entités

Types d'entités pour les identifiants nationaux et délivrés par les gouvernements : US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE, et plus de 50 autres formats d'identifiants spécifiques à un pays. Détectés à l'aide de regex et de motifs de somme de contrôle propres à chaque pays.

#governmentid

Identifiants d'assurance

Types d'entités d'assurance

Types d'entités

Types d'entités pour les identifiants liés à l'assurance : US_NPI (identifiant national des prestataires de santé), HEALTHCARE_PLAN_BENEFICIARY, et numéros d'assurance maladie spécifiques à chaque pays (par exemple, DE_HEALTH_INSURANCE_NUMBER).

#insuranceidentifiers

Identifiants de véhicule

Types d'entités de véhicule

Types d'entités

Types d'entités pour les identifiants liés aux véhicules : US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (numéro d'identification du véhicule), et formats de plaques d'immatriculation spécifiques à chaque pays.

#vehicleidentifiers

Identifiants numériques

Types d'entités d'identité numérique

Types d'entités

Types d'entités pour les identifiants en ligne et numériques : EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 et IPv6), URL, DOMAIN_NAME, CRYPTO (adresses Bitcoin/Ethereum), et identifiants spécifiques à des plateformes.

#digitalidentifiers

ISO 27001

Gestion de la sécurité de l'information ISO/IEC 27001

Conformité & Réglementations

Norme internationale pour les systèmes de gestion de la sécurité de l'information (ISMS). La certification requiert des politiques documentées, des analyses de risques et des contrôles. Les serveurs UE de anonym.legal sont certifiés ISO 27001, garantissant une gouvernance structurée de la sécurité.

#iso27001

ISO 27001 SoA

Déclaration d'applicabilité

Conformité & Réglementations

Document obligatoire ISO 27001 listant tous les contrôles de l'annexe A, indiquant ceux applicables à l'organisation et justifiant les inclusions et exclusions. Requis pour la certification et les audits.

#iso27001soa

J

JWT

JSON Web Token

Chiffrement & Sécurité

Un format de jeton compact et sûr pour les URL, utilisé pour transmettre des revendications entre parties. anonym.legal utilise des JWT signés avec HS256 pour l'authentification interne entre services (par exemple, frontend → Presidio API). Les jetons sont de courte durée et validés côté serveur.

#jwt

K

KEK

Key Encryption Key

Chiffrement & Sécurité

Une clé utilisée pour chiffrer d'autres clés plutôt que des données directement. Dans l'architecture ZK d'anonym.legal, la clé dérivée de la phrase secrète de l'utilisateur agit comme KEK pour protéger les clés de chiffrement par document stockées dans le coffre-fort chiffré.

#kek

L

Language Detection

Détection Automatique de la Langue

Technologie de détection

L'identification automatique de la langue du texte d'entrée avant l'analyse PII. anonym.legal détecte la langue au niveau de la requête et oriente vers le pipeline de modèle NER approprié, avec l'anglais comme solution de repli pour les langues non prises en charge.

#languagedetection

Limitation de débit

Limitation de débit API

Infrastructure

Contrôles sur le nombre de requêtes API qu'un client peut effectuer dans une fenêtre temporelle. Prévient les abus et assure une allocation équitable des ressources. anonym.legal applique des limites de débit par utilisateur selon le niveau d'abonnement, avec une stratégie de backoff exponentiel recommandée pour la gestion des réessais.

#ratelimiting

M

Masquage

Masquage de données

Vie privée & PII

Remplacement de valeurs sensibles par des données fictives mais réalistes qui conservent le format et la structure. Utilisé pour les environnements de test, l’analytique et le partage de jeux de données sans exposer de véritables PII.

#masking

MCP

Model Context Protocol

Plateforme & Produits

Protocole ouvert développé par Anthropic permettant aux modèles IA d’interagir avec des outils externes et des sources de données de manière standardisée. anonym.legal implémente un serveur MCP pour que les outils de codage IA puissent invoquer l’anonymisation sans quitter leur flux de travail.

#mcp

Minimisation des données

Principe de minimisation des données du RGPD

Vie privée & PII

Principe de l’article 5(1)(c) du RGPD exigeant que seules les données adéquates, pertinentes et nécessaires à la finalité spécifiée soient collectées et traitées. Une contrainte de conception essentielle pour les systèmes conformes à la protection de la vie privée.

#dataminimization

ML Models

Modèles d'Apprentissage Automatique pour la Détection de PII

Technologie de détection

Modèles statistiques entraînés sur des corpus de textes annotés pour reconnaître la PII en contexte. anonym.legal utilise à la fois des pipelines transformer spaCy et des modèles XLM-RoBERTa ajustés pour la reconnaissance d'entités multilingues à grande échelle.

#mlmodels

Module Office

Module complémentaire Microsoft Office anonym.legal

Plateforme & Produits

Extension Microsoft Office intégrant l’anonymisation de PII directement dans Word, Excel et PowerPoint. Prend en charge la rédaction dans le document, la gestion des préréglages, ZK Auth et la synchronisation entre appareils. Disponible sur Microsoft AppSource.

#officeaddin

N

NER

Reconnaissance d'Entités Nommées

Technologie de détection

Une tâche de traitement du langage naturel qui identifie et classe les entités nommées dans un texte selon des catégories prédéfinies telles que personnes, organisations, lieux, dates et identifiants médicaux. La technique d'apprentissage automatique centrale qui alimente la détection de PII dans anonym.legal.

#ner

NIS2

Directive 2 sur la sécurité des réseaux et de l'information

Conformité & Réglementations

Directive européenne 2022/2555 élargissant la directive NIS initiale à davantage de secteurs (santé, énergie, transport, infrastructures numériques) et renforçant les exigences en cybersécurité. La date limite de transposition était le 17 octobre 2024 ; la plupart des États membres de l'UE ne l'ont pas respectée et la Commission européenne a engagé des procédures d'infraction contre les États non conformes.

#nis2

NLP

Traitement Automatique du Langage Naturel

Technologie de détection

Une branche de l'intelligence artificielle qui s'intéresse à l'interaction entre les ordinateurs et le langage humain. Dans la détection de PII, les modèles NLP comprennent le contexte, la grammaire et la sémantique afin d'identifier des entités que les motifs regex seuls ne pourraient pas détecter.

#nlp

O

Opérateurs

Opérateurs d’anonymisation

Plateforme & Produits

Stratégie de remplacement appliquée aux PII détectées. anonym.legal prend en charge REPLACE (texte de remplacement), REDACT (chaîne vide), MASK (astérisques), HASH (empreinte SHA-256), ENCRYPT (AES-256-GCM réversible) et CUSTOM (remplacement défini par l’utilisateur).

#operators

P

PCI DSS

Norme de sécurité des données de l'industrie des cartes de paiement

Conformité & Réglementations

Norme de sécurité pour les organisations traitant des données de cartes de paiement, maintenue par le PCI Security Standards Council. Exige chiffrement, contrôles d'accès, journalisation et tests réguliers. La non-conformité peut entraîner des amendes et la perte de l'autorisation de traitement des cartes.

#pcidss

PHI

Informations de santé protégées

Vie privée & PII

Toute information relative à la santé liée à une personne identifiable, réglementée par HIPAA aux États-Unis. Inclut les diagnostics, dossiers de traitement, données d’assurance et l’un des 18 identifiants Safe Harbor définis par HIPAA.

#phi

PII

Informations personnellement identifiables

Vie privée & PII

Toute donnée permettant d’identifier une personne spécifique, directement ou en combinaison avec d’autres données. Exemples : noms, adresses email, numéros de sécurité sociale, adresses IP, données biométriques.

#pii

Piste d'audit

Piste d'audit immuable

Juridique & Audit

Un journal séquentiel et infalsifiable enregistrant qui a accédé, modifié ou traité des données et à quel moment. Exigé par ISO 27001 (A.8.15), HIPAA Security Rule (§164.312(b)), et les règles d'e-discovery. anonym.legal journalise toutes les opérations d'anonymisation avec horodatages, décomptes d'entités et identifiants d'opérateurs.

#audittrail

Préréglages

Préréglages d’anonymisation

Plateforme & Produits

Configurations enregistrées de types d’entités sélectionnés, seuils de confiance et options de sortie, applicables en un clic. Les préréglages sont synchronisés entre l’application web, le module Office et l’application de bureau via un stockage cloud chiffré.

#presets

Presidio

Microsoft Presidio

Technologie de détection

Un SDK open-source de protection et d'anonymisation des données développé par Microsoft. Le moteur de détection d'anonym.legal est construit sur les services d'analyseur et d'anonymiseur de Presidio, enrichi de plus de 285 reconnaisseurs d'entités personnalisés couvrant 48 langues.

#presidio

Presidio Analyzer

Service Microsoft Presidio Analyzer

Infrastructure

Le composant de détection du backend d'anonym.legal (port 8011). Accepte du texte et retourne une liste d'entités PII détectées avec leurs positions, types et scores de confiance. Étendu avec plus de 285 reconnaisseurs personnalisés dans 48 langues.

#presidioanalyzer

Presidio Anonymizer

Service Microsoft Presidio Anonymizer

Infrastructure

Le composant de transformation du backend d'anonym.legal (port 8012). Prend en entrée du texte et les résultats de l'analyseur, applique l'opérateur sélectionné (REPLACE, REDACT, MASK, HASH, ENCRYPT) à chaque entité détectée, et retourne le texte anonymisé.

#presidioanonymizer

Protection DDoS

Protection contre les attaques par déni de service distribué

Infrastructure

Défenses au niveau de l'infrastructure contre les attaques par déni de service distribué. L'infrastructure serveur d'anonym.legal inclut des règles de pare-feu (UFW), des limites de connexion nginx et des protections amont équivalentes à Cloudflare pour maintenir la disponibilité.

#ddosprotection

Protection de la vie privée dès la conception

Protection de la vie privée dès la conception et par défaut

Vie privée & PII

Principe imposé par l’article 25 du RGPD selon lequel les mesures de protection des données doivent être intégrées aux systèmes dès leur conception, et non ajoutées a posteriori. Englobe la minimisation des données, les contrôles d’accès, le chiffrement et la pseudonymisation au niveau de l’architecture.

#privacybydesign

Pseudonymisation

Pseudonymisation des données

Vie privée & PII

Remplacement des identifiants directs par des valeurs artificielles (pseudonymes) tout en conservant la possibilité de réidentifier les individus à l’aide d’une clé séparée. L’article 4(5) du RGPD la reconnaît comme une technique renforçant la confidentialité, mais les données pseudonymisées restent soumises au règlement.

#pseudonymization

R

Rédacteur d'images

Service Presidio Image Redactor

Infrastructure

Un service backend spécialisé (port 8013) qui détecte et caviarde les PII dans les fichiers image (PNG, JPEG) à l'aide de l'OCR et de l'analyse Presidio. Applique un bandeau noir sur les zones PII détectées dans l'image d'origine.

#presidioimageredactor

Rédaction

Rédaction de données

Vie privée & PII

Suppression ou masquage permanent d’informations sensibles dans des documents, remplacées par un marqueur visuel tel que [REDACTED] ou une barre noire. Contrairement au chiffrement, la rédaction est irréversible et les données originales ne peuvent pas être récupérées.

#redaction

Regex

Correspondance de Motifs par Expressions Régulières

Technologie de détection

Correspondance textuelle basée sur des motifs utilisant une syntaxe de langage formel. Dans la détection de PII, les regex traitent les identifiants structurellement prévisibles (numéros de téléphone, cartes de crédit, IBAN, adresses email) avec validation de somme de contrôle. Complète la NER pour une détection hybride.

#regex

Résidence des données UE

Résidence des données dans l'Union européenne

Infrastructure

La garantie que les données sont stockées et traitées exclusivement sur le territoire de l'UE/EEE. Les serveurs de production d'anonym.legal sont situés en Allemagne (Hetzner Francfort), garantissant que tout traitement a lieu sous juridiction RGPD sans implication de transfert transfrontalier.

#eudataresidency

REST API

API RESTful

Infrastructure

anonym.legal expose une API HTTP RESTful pour l'intégration programmatique. Les endpoints incluent /api/analyze, /api/anonymize, /api/image et /api/structured. Authentification via jetons JWT bearer. Documentation OpenAPI complète disponible dans la référence API.

#restapi

Rule 26

Federal Rules of Civil Procedure Rule 26

Juridique & Audit

Règle de procédure civile américaine régissant les obligations de découverte. Rule 26(g) exige que les avocats certifient que les demandes et divulgations de discovery ne sont pas faites à des fins inappropriées — y compris le fait de ne pas correctement caviarder les PII dans les documents produits.

#rule26

S

SCCs

Clauses contractuelles types

Conformité & Réglementations

Clauses contractuelles pré-approuvées, conformes au GDPR, pour le transfert de données personnelles de l'UE/EEE vers des pays tiers. Mises à jour par la Commission européenne en 2021 (2021/914/UE) pour répondre aux exigences de Schrems II, incluant une analyse d'impact sur le transfert.

#sccs

Schrems II

Arrêt Schrems II (C-311/18)

Conformité & Réglementations

Arrêt de 2020 de la Cour de justice de l'UE invalidant le cadre Privacy Shield UE-États-Unis pour les transferts transatlantiques de données, en raison d'une protection insuffisante contre la surveillance américaine. Nécessite des mesures supplémentaires (chiffrement, anonymisation) lors de l'utilisation des clauses contractuelles types.

#schremsii

Secret professionnel avocat-client

Protection du secret professionnel avocat-client

Juridique & Audit

Protection juridique des communications confidentielles entre avocats et clients. Lors de la revue documentaire et de l'e-discovery, le contenu privilégié doit être identifié et retenu ou caviardé. Les types d'entités personnalisés dans anonym.legal peuvent être configurés pour signaler les marqueurs de contenu privilégié.

#attorneyclientprivilege

Serveur MCP

Serveur Model Context Protocol

Plateforme & Produits

L’intégration du serveur MCP d’anonym.legal permet aux assistants de codage IA (Claude Desktop, Cursor, VS Code Copilot) d’appeler directement l’API d’anonymisation comme un outil. Les PII sont supprimées du code, des invites et du contexte avant d’être envoyées au modèle IA.

#mcpserver

SHA-256

Algorithme de hachage sécurisé 256 bits

Chiffrement & Sécurité

Une fonction de hachage cryptographique produisant un condensat de 256 bits. Utilisée dans anonym.legal pour l'authentification HMAC des requêtes API, les preuves ZK Auth, et la pseudonymisation cohérente des entités (le hachage avec sel produit le même remplacement pour une même valeur d'origine).

#sha256

Sous-caviardage

Sous-caviardage (faux négatifs)

Juridique & Audit

Omission de supprimer toutes les PII, exposant ainsi des individus dans des documents partagés. Risque de conformité le plus courant. Provoqué par des seuils de confiance trop élevés, des types d'entités manquants ou des formats PII nouveaux. Atténué par la détection hybride et le support d'entités personnalisées d'anonym.legal.

#underredaction

spaCy

Bibliothèque NLP spaCy

Technologie de détection

Bibliothèque NLP open-source de niveau industriel en Python. anonym.legal utilise les modèles basés sur transformer de spaCy pour 24 langues (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko, et d'autres) pour la reconnaissance d'entités nommées dans le pipeline Presidio.

#spacy

Stanza

Bibliothèque NLP Stanza (Stanford NLP)

Technologie de détection

Boîte à outils NLP Python du Stanford NLP Group prenant en charge plus de 70 langues avec des modèles neuronaux de pointe. Utilisée comme moteur NER complémentaire dans anonym.legal pour les langues non couvertes par les modèles spaCy.

#stanza

Sur-caviardage

Sur-caviardage (faux positifs)

Juridique & Audit

Suppression d'informations au-delà du nécessaire, réduisant l'utilité du document et pouvant constituer une altération de preuve lors de procédures judiciaires. Provoqué par des seuils de confiance trop bas ou une sélection d'entités trop large. Ajustable via les contrôles de seuil et d'entités d'anonym.legal.

#overredaction

Système de jetons

Système de jetons anonym.legal

Plateforme & Produits

Facturation à l’usage où les appels API consomment des jetons calculés selon la longueur du texte, le nombre d’entités et le mode de traitement (analyse vs anonymisation). Les coûts en jetons sont configurables dans la base de données et affichés en temps réel avant traitement.

#tokensystem

T

TLS

Transport Layer Security

Chiffrement & Sécurité

Le protocole cryptographique sécurisant les données en transit. anonym.legal impose au minimum TLS 1.2 avec préférence pour TLS 1.3, HSTS avec une durée maximale d'un an, et HTTP/2. Tout le trafic entre les clients et le serveur est chiffré lors du transit.

#tls

Tokenisation

Tokenisation des données

Vie privée & PII

Remplacement de données sensibles par un jeton non sensible qui correspond à l’original dans un coffre-fort sécurisé. Contrairement au chiffrement, le jeton n’a aucune relation mathématique avec la donnée d’origine.

#tokenization

Traitement par lots

Anonymisation de fichiers par lots

Plateforme & Produits

Traitement simultané de plusieurs fichiers en une seule opération. Le mode par lots d’anonym.legal prend en charge les fichiers PDF, DOCX et TXT avec configuration des entités par fichier, seuils de confiance et sélection du format de sortie.

#batchprocessing

Type d'entité

Type d'entité PII

Types d'entités

Une catégorie d'informations personnelles que le moteur de détection reconnaît et peut anonymiser. Exemples : PERSON, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. anonym.legal prend en charge plus de 285 types d'entités dans 48 langues.

#entitytype

X

XChaCha20

XChaCha20-Poly1305

Chiffrement & Sécurité

Un algorithme de chiffrement authentifié offrant de hautes performances sur les systèmes sans accélération matérielle AES. Utilise un nonce de 192 bits (extension du nonce de 96 bits du standard IETF ChaCha20 selon la RFC 8439), éliminant les risques de collision de nonce. Utilisé comme algorithme de chiffrement alternatif dans la couche de chiffrement d'anonym.legal.

#xchacha20

XLM-RoBERTa

RoBERTa Multilingue

Technologie de détection

Un modèle de langage transformer multilingue entraîné sur 100 langues, développé par Meta AI. Utilisé dans anonym.legal pour les tâches NER multilingues, en particulier pour les types d'entités et langues où les modèles monolingues ne sont pas disponibles.

#xlmroberta

Z

Zero-Knowledge

Architecture Zero-Knowledge

Chiffrement & Sécurité

Une conception de système où le fournisseur de service n'a aucun accès aux données en clair des utilisateurs ni aux clés de chiffrement. Tout le chiffrement/déchiffrement s'effectue côté client ; le serveur ne voit jamais le contenu original. Prévient les menaces internes et la divulgation forcée.

#zeroknowledge

ZK Auth

Authentification Zero-Knowledge

Chiffrement & Sécurité

Le système d'authentification d'anonym.legal où les clés de chiffrement sont dérivées côté client à partir de la phrase secrète de l'utilisateur via Argon2id, sans jamais être transmises ou stockées sur le serveur. Le serveur ne conserve qu'une preuve cryptographique, jamais la clé ni la phrase secrète.

#zkauth