Friday, October 18, 2024
INICIATIVES

El traductor de Softcatalà incorpora l’occità llenguadocià, el gallec i el japonès

L’entitat afegeix cinquanta millores l català-castellà, basat en la tecnologia Apertium

Softcatalà, l’associació sense afany de lucre que treballa per la normalització de la llengua catalana en les noves tecnologies, ha desenvolupat una primera versió d’un traductor japonès – català i ha incorporat al seu web la traducció als parells de llengües gallec – català i occità llenguadocià – català.

La incorporació s’ha produït gràcies a la transferència de coneixements dels models publicats per Meta com a part del projecte No Language Left Behind. L’entitat ha posat, a més, a disposició de tothom els corpus i els models neuronals de traducció sota llicència lliure que utilitzen perquè qualsevol els pugui fer servir, segons ha explicat l’entitat en un comunicat.

Softcatalà ha millorat també el traductor català-castellà, basat en tecnologia Apertium. Per fer-ho, s’ha recopilat un conjunt de textos d’avaluació de 12.000 frases pel castellà – català i 12.000 més de castellà al català, que s’han traduït amb Apertium i revisat manualment per avaluar les traduccions i identificar les millores. Gràcies a aquest procés es van identificar més de 80 millores i se n’han afegit cinquanta. També s’ha doblat la mida dels fitxers que els usuaris poden enviar per traduir fins a 8 MB.

L’entitat està organitzant, a més, tallers sobre traducció neuronal on expliquen el funcionament i el procés d’entrenament d’un motor de traducció neuronal per anar vertebrant una comunitat que conegui aquesta tecnologia.

Inicialment, Softcatalà utilitzava el traductor Internostrum, desenvolupat per la Universitat d’Alacant (UA), al seu web per tal d’oferir un servei de traducció automàtica català-castellà de qualitat. L’any 2004 va sorgir la plataforma Apertium, hereva de la filosofia dels traductors Internostrum i Universia, però programat des de zero per a aconseguir millors resultats. L’any 2010, Softcatalà va presentar el traductor basat en el projecte de programari lliure Apertium, i amb els anys ha anat ampliant-se i millorant-se considerablement.

Leave a Reply

Your email address will not be published. Required fields are marked *

Verified by ExactMetrics