Meta presenta un sistema de reconeixement de veu per a 1.100 idiomes
La intel·ligència artificial de l’empresa, basada en textos religiosos, pot identificar 4.000 llengües
Meta acaba de presentar uns nous models d’intel·ligència artificial capaços de transformar de text a veu i de veu a text més de 1.100 idiomes, deu vegades més que les tecnologies actuals, i d’identificar 4.000 llengües, quaranta cops més que les que es podien identificar abans.
Segons ha explicat l’empresa de Mark Zuckerberg, matriu de Facebook, Instagram i Whatsapp, en un comunicat, el propòsit de Meta és ajudar la gran quantitat de “llengües del món en risc d’extinció” amenaçades per “les limitacions de l’actual tecnologia de reconeixement i generació de la parla, que accelerarà aquesta tendència”. “La tecnologia de veu té molts usos, des de la tecnologia de realitat virtual i augmentada fins a serveis de missatgeria que es poden utilitzar en la llengua preferida de cada persona perquè pugui entendre totes les veus”, afegeix l’empresa, que ha posat els seus codis en obert perquè estiguin a disposició de tothom.
Meta explica que, com que la base de dades de veu que tenien només abastava un centenar d’idiomes, van haver de recórrer a textos religiosos com la Bíblia, traduïda a un gran nombre de llengües. Hi ha enregistraments de veu de persones llegint aquests textos en diferents llengües a l’abast de tothom. L’empresa ha creat una base de dades de lectures del Nou Testament en més de 1.100 idiomes, amb una mitjana de 32 hores de dades per llengua.
Per arribar a reconèixer més de 4.000 idiomes, també es van fer servir gravacions no etiquetades d’altres religions cristianes. Tot i que la majoria de textos són llegits per homes, l’empresa assegura que els models funcionen igual de bé per a veus masculines que femenines. Tampoc han detectat que el fet que la base siguin textos religiosos faci que les transcripcions tinguin un biaix religiós.
Meta està treballant per ampliar el nombre de llengües que abasta el seu model Massively Multilingual Speech (MMS) i incloure nous dialectes. L’empresa ha comparat els seus models amb altres, com OpenAI Whisper, i asseguren que la taxa d’error del seu és la meitat que la de la competència.
Molt interessant aquet article. Que la empresa META, tingui l’alabast als seus codis en obert per tothom que els necessiti es fantàstic.