Spotify ofereix pòdcasts doblats amb intel·ligència artificial
El doblatge de les proves pilot imita la veu i l’entonació de la versió original
Fa uns dies van circular tot de vídeos de personatges famosos parlant en llengües que no dominen. El miracle de veure, per exemple, Leo Messi parlant, de forma fluïda l’anglès és obra de la intel·ligència artificial (IA), que ja ha aconseguit fer sentir amb la seva veu i entonació (o una de molt semblant) el futbolista argentí i altres celebritats en qualsevol idioma.
La plataforma de reproducció en continu de mùsica i pòdcasts Spotify ja ja començat a treure profit de la intel·ligència artificial, en aquest cas l’eina Whisper d’Open AI, per oferir el doblatge de pòdcasts, també amb la veu i l’entonació dels seus autors, a la llengua dels seus usuaris. Per començar s’han triat alguns dels pòdcasts més coneguts, enregistrats originalment en anglès, com els de Lex Fridman, Bill Simmons, Dax Shepard, Monica Padman i Steven Bartlett, que ja es poden sentir en castellà i pròximament, també en francès i alemany. L’empresa té previst ampliar l’oferta de doblatges amb IA els propers dies i setmanes.
Les noves eines d’intel·ligència artificial obren un ventall de possibilitats molt ampli que tenen avantatges i riscos. En el cas d’una llengua minoritzada com el català, l’ús del doblatge a altres llengües podria ser un estímul perquè els creadors de continguts per a xarxes que renuncien a fer servir el català amb l’argument que volen arribar al màxim nombre de persones possibles s’animessin a utiltizar la seva llengua. En la banda dels perills hi ha els de possibles suplantacions d’identitat i els anomenats deepfakes.
Les proves fetes fins ara a Spotify mostren una semblança notable entre la veu i l’entonació original i la doblada. Els autors dels pòdcasts mantenen l’accent de la seva llengua materna i no sonen del tot naturals, fet que fa encara imprescindible la feina dels dobladors professionals, especialment per a productes audiovisuals com les pel·lícules i les sèries o els pòdcasts de llarga durada, difícils d’aguantar amb la veu, encara imperfecta, de la intel·ligència artificial.