Presidio on Võimas. See on Samuti 3-Nädalaline Seadistusprojekt. Siin on Hallatav Alternatiiv.
Microsoft Presidio on hästi kujundatud, võimas raamistik PII tuvastamiseks ja anonüümseerimiseks. See on ka ühisuse kokkulepe, oluline tehisosa investeeringud tootmises.
GitHub probleem #237 ("Süntaksi Vead kasutades analüsaatorit Python paketina") esindab probleemide kategooriat, mille ees seisavad isegi kogenud Python arendajad: keskkonna konfliktid, mudeli laadimise ebaõnnestumised ja API konfiguratsiooni probleemid, mis nõuavad päevi silumine enne esimese edukat anonüümseerimist.
Ühisuse Tõendused
Presidio GitHub repositorium omab tuhandeid tähti - tugev signaal huvi ja kasutamise kohta. Avatud probleemide nimekiri räägib teist lugust tootmise pingutest:
Keskkonna konfiguratsiooni probleemid: Python versioonide ühildumatus, spaCy mudeli versioonide konfliktid, ONNX käitusaja vead ja platvormi-spetsiifilised paigaldamise ebaõnnestumised. Need probleemid mõjutavad kogenud arendajaid, kes järgivad dokumentatsiooni täpselt.
Mudeli laadimise ebaõnnestumised: spaCy mudelid laadisid edukalt, kuid ei saa koormata teatud keskkondades (konteineriga keskkond, piiritletud mälu konfiguratsiooni, mõned pilvepakkujad). Silumine nõuab spaCy mudeli haldustoimingute sisemaiste mõistmist.
Tootmise API ebaõnnestumised: Presidio API töötab arenduses, kuid ebaõnnestub tootmise koormuse all threading probleemide, mälu surve kaudu NLP mudeleid või konfiguratsiooni erinevused arendusega...