Tagasi BlogisseTehniline

Presidio on Võimas. See on Samuti 3-Nädalaline...

Microsoft Presidio-l on tuhandeid GitHub tähti ja sadu avatud probleeme. Seadistuse keerukus...

April 21, 20266 min lugemist
Presidio setupPySpark integrationmanaged PresidioPython dependenciesPII setup complexity

Presidio on Võimas. See on Samuti 3-Nädalaline Seadistusprojekt. Siin on Hallatav Alternatiiv.

Microsoft Presidio on hästi kujundatud, võimas raamistik PII tuvastamiseks ja anonüümseerimiseks. See on ka ühisuse kokkulepe, oluline tehisosa investeeringud tootmises.

GitHub probleem #237 ("Süntaksi Vead kasutades analüsaatorit Python paketina") esindab probleemide kategooriat, mille ees seisavad isegi kogenud Python arendajad: keskkonna konfliktid, mudeli laadimise ebaõnnestumised ja API konfiguratsiooni probleemid, mis nõuavad päevi silumine enne esimese edukat anonüümseerimist.

Ühisuse Tõendused

Presidio GitHub repositorium omab tuhandeid tähti - tugev signaal huvi ja kasutamise kohta. Avatud probleemide nimekiri räägib teist lugust tootmise pingutest:

Keskkonna konfiguratsiooni probleemid: Python versioonide ühildumatus, spaCy mudeli versioonide konfliktid, ONNX käitusaja vead ja platvormi-spetsiifilised paigaldamise ebaõnnestumised. Need probleemid mõjutavad kogenud arendajaid, kes järgivad dokumentatsiooni täpselt.

Mudeli laadimise ebaõnnestumised: spaCy mudelid laadisid edukalt, kuid ei saa koormata teatud keskkondades (konteineriga keskkond, piiritletud mälu konfiguratsiooni, mõned pilvepakkujad). Silumine nõuab spaCy mudeli haldustoimingute sisemaiste mõistmist.

Tootmise API ebaõnnestumised: Presidio API töötab arenduses, kuid ebaõnnestub tootmise koormuse all threading probleemide, mälu surve kaudu NLP mudeleid või konfiguratsiooni erinevused arendusega...

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.