“Hem d’estar sempre vigilant que no se’ns espatlli res del català en el món digital”
Entrevista a Albert Cuesta, coordinador de l’Aliança per la presència digital del català

@raulgia
Deu entitats d’arreu dels Països Catalans van constituir el mes passat l’Aliança per la presència digital del català, una iniciativa que pretén sumar esforços i talent i coordinar-se per garantir la presència de la llengua pròpia en el món de la tecnologia. L’Aliança, coordinada per Albert Cuesta, ha fet ja un informe sobre la pèrdua alarmant de les entrades en català als cercadors.
En quina situació està ara el problema dels cercadors, que marginen el català?
La situació a hores d’ara és que tant Google com altres cercadors han donat per rebut l’informe que va fer la Fundació .cat en nom de l’Aliança. En algun dels casos han comprovat les nostres troballes, han admès que tenim raó, i en d’altres, ens han demanat unes dades molt concretes per continuar avançant en la resolució d’aquest problema i estem en la fase de donar-los aquestes dades. Els dos grans cercadors són Google, que té el 95% del mercat estatal de cerces, i Microsoft, a qui els hi ha arribat l’informe directament a Enginyeria, que són els qui poden remenar i resoldre el problema i estan treballant-hi. Microsoft és important perquè el seu cercador és Bing, que es preveu que tingui una pujada implícita de trànsit per la intel·ligència artificial. La tendència és xatejar amb el ChatGpt, que fa servir Bing.
Cal estar ben posicionat en el camp de la intel·ligència artificial.
Sí, per això és molt important resoldre el problema del posicionament del català. El ChatGpt serà una manera habitual d’interactuar amb les dades. A més, l’índex de Bing també el fan servir altres cercadors minoritaris com Duckduckgo. Per tant, si Microsoft ho arregla, també ho s’arreglarà en altres cercadors.
Sembla que s’hi han posat bé.
Sí. Amb aquesta intervenció hem comprovat que, malgrat que hi havia un cert rebombori i es pensava que aquests cercadors eren conscients que les queixes a Twitter i que havien fet forat, en la pràctica no havien arribat als departaments adients dins de l’empresa. Per tant, nosaltres ens donem per satisfets, valorem positivament que aquestes empreses hagin rebut l’informe, l’hagin vist i que ens considerin interlocutors vàlids.
Teniu alguna hipòtesi de per què hi va haver aquest canvi de cop i volta?
En l’informe es van valorar diverses opcions i es va descartar la mà negra política, tot i que en altres casos no s’ha descartat. Es van descartar hipòtesis tècniques d’etiquetatge de pàgines. Hem arribat a la conclusió provisional que els grans cercadors estan remenant els seus algoritmes. Cada quatre mesos hi ha una gran actualització, però van fent coses. De fet, la caiguda de trànsit del català es va produir poc després de l’actualització de l’algoritme de Google del maig del 2022. Creiem que aquests cercadors estan tocant paràmetres dels seus cercadors i en algunes d’aquestes reformes se’ls va descol·locar alguna cosa en els idiomes no majoritaris. Jo crec que ni ells saben què deu passar. A més a més, això no passa només amb el català, passa amb moltes altres llengües i, de fet, la intervenció de l’Aliança amb aquest informe, fet en col·laboració amb el govern de la Generalitat, ha fet que molts altres idiomes s’hagin adonat que tenen un problema.
És molt curiós que els cotxes fets a Califòrnia, a Berlín, i a Xangai tinguin el menú en català i, en canvi, els fets a Martorell, no
No se n’havien adonat?
No. Hi ha un cas, que no està exactament relacionat amb els cercadors. Els noruecs, gràcies a nosaltres, s’han adonat que la meitat dels dominis .no no tenen contingut en noruec, per exemple. Això està generant fins i tot interès entre els eurodiputats que són sensibles als temes de llengua. Hi ha un intergrup que es dedica a això i ens diuen que no només hi ha problemes amb el català, sinó amb l’italià, el francès…
També estan afectats pel problema dels cercadors?
No és que hi estiguin afectats, és que pateixen per com els pot arribar a afectar el domini de l’anglès. El ChatGPT, que és una empresa que es diu OpenAI, participada per Microsoft en 13.000 milions de dòlars, ha reconegut que els seus GPTs estan entrenats amb el contingut de la xarxa oberta i que més de la meitat del contingut és en anglès i això representa una amenaça, un biaix absolut per a qualsevol altre idioma que no sigui l’anglès. La meitat del contingut de la web oberta és en anglès, però em sembla que menys del 6% dels humans parlen anglès.
Estan fent res per corregir-ho?
Han iniciat un pla pilot per rectificar això dins del seu xatbot amb l’islandès, que és una llengua clarament amenaçada perquè la parlen 300.000 persones. En el cas del català estem explicant la nostra metodologia a altres idiomes. Per exemple, la setmana que ve anem a Sant Sebastià a explicar als bascos com hem fet el nostre informe.
Perquè ho repliquin?
Ho volen replicar perquè diuen que això que passa és molt greu i volen comprovar fins a quin punt els afecta.
Dèieu que no sembla que hi hagi una mà negra en aquest cas. De fet el Google Maps ja ha incorporat les ordres de veu en català.
Exacte. Hi ha molt pocs serveis de Google que no estiguin en català perquè Google té vocació d’universalitat i vol oferir tants idiomes com sigui possible. La gent desconeix com és aquesta indústria. Aquestes grans companyies són gairebé com Estats. A Google hi ha equips que fan coses i avancen a diferents velocitats. Encara que tu volguessis fer la guitza al català des d’algun lloc determinat a tots els serveis de Google, no podries perquè hi ha moltes finestretes diferents.

En quines altres qüestions està treballant l’Aliança?
Tenim molts fronts oberts. Vam constituir l’Aliança el mes de març i ens vam fixar el que en diem vuit verticals, que són sectors diferents en els quals ens sembla que el català no té la presència que es mereix. Ens hem proposat mesurar quina és la situació en cada sector, mirar quins són els interlocutors per millorar-la i, en funció d’això, fer accions que poden ser col·laboracions tècniques o campanyes de mobilització perquè dins de l’Aliança tenim entitats amb una capacitat de mobilització demostrada.
Com ho fareu?
La nostra aproximació a les empreses que ens sembla que poden ajudar a millorar la situació del català és de col·laboració i, en principi, estem tenint la resposta.
Quin és el tema prioritari?
Hi ha dos àmbits en els quals creiem que ens hem de centrar molt, que són els electrodomèstics -concretament els televisors- i l’automoció, els cotxes. Amb els televisors, n’hi ha que ja tenien vocació proactiva d’incorporar el català, com és el cas de Sony, que històricament ha tingut televisors amb els menús en català, o bé les marques que han incorporat sistemes operatius que ja porten al català, com Android. Phillips i Xiaomi no han de fer res amb el sistema operatiu perquè els hi dona Android. En canvi, les dues de les marques més venudes a l’Estat i al món, que són coreanes, Samsung i LG, encara no tenen els menús en català. Hi estem treballant.
I en el cas dels cotxes?
L’única marca de cotxes que té els menús en català són uns cotxes fets a Califòrnia, que són els Tesla. És molt curiós que els cotxes fets a Califòrnia, a Berlín, i a Xangai tinguin el menú en català perquè algú va decidir que hi havia d’haver-hi el català, igual que molts altres idiomes. En canvi, els cotxes fets a Martorell, Almussafes, i ja no dic els que estan fets a Valladolid, a Vigo, no tenen el català incorporat. És especialment flagrant que no el tingui Volkswagen Seat perquè té 14.000 empleats a Catalunya o bé entre Martorell i Landaben, a Navarra. El que hem fet és abordar-los i dir-los que Tesla ho té, que es pot fer. Ens sembla que és un moment favorable perquè les empreses d’automoció ho facin perquè la indústria d’automoció està fent la transformació digital. Fins ara els cotxes eren màquines i ara són software amb rodes. El cas paradigmàtic és Tesla, que ja va néixer digital, i per això es pot permetre incorporar idiomes amb una gran facilitat.
A veure com responen.
En el seu moment, SEAT va fer un estudi per valorar el que costava afegir al català als cotxes, que és important perquè, en realitat, l’electrònica dels cotxes SEAT és la mateixa que la de Volkswagen, o sigui, que incorporar el català a una marca facilitaria molt que totes les altres del grup el tinguessin. En el seu moment es va fer un estudi i es va comprovar que era rendible afegir el català per la quantitat de cotxes que SEAT venia a Catalunya, però, en canvi, per motius polítics, s’havia d’afegir també l’eusquera i el gallec i la quantitat de vehicles que SEAT venia a Galícia i Euskadi no justificava l’afegiment d’aquests idiomes. Ara estem intentant dir-los que potser en aquell moment traduir o incorporar un idioma era molt més car del que és ara.
A vegades som nosaltres que ens entestem a fer servir una plataforma que discrimina el català quan hi ha una alternativa
Darrerament algunes aplicacions com TikTok i Spotify han incorporat el català. És una mostra d’una sensibilitat més gran amb les llengües minoritzades?
En el cas d’Spotify, el Barça va dir que si volia vincular-te amb ell havia d’incloure el català. A TikTok, abans de l’Aliança, els ho vaig demanar i ho han fet. Nosaltres veiem la inclusió del català en tota mena de productes i plataformes d’una manera més àmplia perquè no n’hi ha prou amb la interfície. Tu pots fer la interfície en català, però després hi ha altres àmbits en els quals el català no està previst. TripAdvisor no només no té la interfície en català, que seria una cosa relativament fàcil. Podríem traduir TripAdvisor, com s’ha fet amb la majoria de les gran aplicacions, que les hem traduït nosaltres, però si t’esborren directament els comentaris en català… Aquí es poden fer dues coses: si diuen que no tenen ningú capaç de moderar els comentaris es pot buscar algú que els pugui moderar. I, si no, recomanarem Booking.com, que fa la mateixa funció i no té cap problema amb els comentaris en català.
Fer-se valer com a consumidors.
Si a TripAdvisor li cau un 8% del trànsit de l’estat espanyol i tot li ve d’aquí, ja veuràs com s’ho creuran. A vegades som nosaltres que ens entestem a fer servir una plataforma quan hi ha una alternativa.
Un dels problemes que hi ha és que molts catalanoparlants no tenen configurat els dispositius en català.
Una de les accions que pretenem fer és una campanya per ajudar la gent a catalanitzar el seu dispositiu.
Softcatalà ho posa molt fàcil.
Sí. Cada vegada que he dit la notícia que Google Maps ja parla en català he posat una coda al final que és: i ara ja podeu configurar el mòbil en català perquè molts de vosaltres el teníeu en espanyol o en anglès perquè volíeu tenir les indicacions parlades. També hi ha moltes aplicacions de start-up catalanes amb molt de trànsit que no tenen el web en català, com Wallapop, i els estem intentant explicar la importància del català.
Tampoc en tenen LinkedIn, Instagram…
El nostre objectiu són, per una banda, el microclima d’aplicacions que es fan a Catalunya amb vocació internacional, que està bé que tinguin l’anglès, però s’haurien de preocupar també pels seus veïns. L’altra és LinkedIn i Instagram, que és un cas estrany perquè Facebook està en català i WhatsApp també. També estem parlant amb Facebook sobre per què no ens posa l’Instagram en català.
El català té una presència important a la tecnologia gràcies, molt sovint, als voluntaris. A Common Voice, per exemple, ja és la llengua amb més enregistraments de veu fets i validats.
Exacte, això és un gran èxit i demostra que els catalans quan ens hi posem ens hi posem. A Twitter em va explicar, en el moment en què va obrir la traducció al català, que estaven al·lucinats amb els catalans perquè estem per sota de la magnitud dels àrabs i ho traduïm molt més ràpid. Quan ens deixen fer les coses queden sorpresos de la nostra bona disposició eficient i crec que això és un element que hem d’aprofitar. El que passa és que també arriba un punt en què la gent se’n cansa. Com pot ser que el català que té deu milions de parlants no tingui la mateixa consideració digital que tenen el danès o el suec, que en tenen menys?
L’èxit del Common Voice és una garantia que el tema dels assistents de veu el tenim ben encarrilat perquè siguin en català?
Em sap greu dir-ho, però no. El Common Voice no tindrà una influència important en el Google Assistant, Siri i Alexa perquè aquesta gent vol controlar els seus models. No és tan senzill com agafar el Common Voice i incrustar-lo a Siri perquè parli català. Jo crec que aquestes empreses estan una mica a l’expectativa sobre com els influirà l’arribada dels xatbots.
El ChatGPT ja incorpora el català.
No. El ChatGPT dialoga en català d’una manera impecable. El problema és que el que té al darrere ho mira en anglès, però ChatGPT té una aplicació mòbil per IOS que tu la pots interrogar amb la veu. En el moment que tu pots interrogar el chatGPT amb la veu en català, Siri ja no té cap sentit. Fins a quin punt Apple s’esforçarà a fer que estigui en català? No ho sabem. Alexa és un cas una mica estrany perquè la principal retallada de recursos interns que han fet Amazon és la que afecta la divisió de l’Alexa. Google Assistant és un cas molt curiós perquè el pots interrogar amb la veu en català, però no et contesta parlant en català. Common Voice creiem que és un recurs important per oferir-lo als tres grans, a Siri, Alexa i Google Assistant, però li veiem futur amb interacció verbal amb electrodomèstics: la cafetera, la nevera, la rentadora…
Quin creieu que és el principal forat negre del català a la tecnologia?
En aquest moment, clarament, tenim l’incendi dels cercadors i, després, tots els que afectin serveis i productes que utilitzem molta estona. Per exemple, en el cas dels cotxes, el manual d’instruccions no te’l mires mai, però sí que veus cada cop que hi puges els quilòmetres, el consum… S’ha de prioritzar. Un dels costos més importants de catalanitzar el cotxe són les ordres de veu, però si les ordres de veu les poses a Google Maps, potser no cal. No cal reinventar la roda cada vegada. El que passa és que dir això devalua el seu propi navegador i aquests grans grups fan unes inversions molt importants en el navegador. El forat negre és la falta de consideració del català.
Amb la feina que hi ha per fer, sembla que tindrem Aliança per anys.
És molt trist, però és així. Els catalans hem d’estar sempre vigilant que no se’ns espatlli res. Ara estem treballant en un sistema que supervisa automàticament la situació del català a les cerces web perquè no ens torni a passar el que ens va passar l’any passat. Gràcies a la qualificació tècnica d’alguns membres de l’Aliança ja tenim més o menys embastat un mecanisme de supervisió d’això, de manera que s’arregli el problema dels cercadors ho podrem verificar i si es torna a espatllar ens n’adonarem abans. Aquest és un patró que hem d’aplicar a tots els altres casos. Si aconseguim que un fabricant de cotxes hi posi el català, hem de vigilar que no el tregui a la següent actualització perquè això passa. Hem d’estar observant contínuament, tenim feina per anys pel català.