TECNOLOGIA

El projecte AINA inicia una gira per totes les vegueries per buscar veus de les diferents variants i accents

AINA és un projecte basat en tecnologies de dades i Intel·ligència Artificial impulsat per la Vicepresidència del Govern i el BSC per fer que les màquines entenguin i parlin el català
Puigneró banc de veus
photo_camera El conseller de Polítiques Digitals, Jordi Puigneró / Aina Martí

Després de visitar durant el mes d’abril la Catalunya Nord, el País Valencià, les Illes Balears i fins i tot Nova York (EUA) per apropar la campanya ‘La nostra llengua és la teva veu’ als territoris i comunitats de parla catalana d’arreu del món, el projecte AINA engega aquest dissabte la segona part de la gira per sumar veus de les diferents variants dialectals i accents del català, ara per tot el Principat.

Impulsada pel Departament de la Vicepresidència i de Polítiques Digitals i Territori, la gira d’AINA pretén esperonar els parlants de totes les variants del català perquè participin en la campanya de recollida de veus a través del web projecteaina.cat, per poder generar així un corpus de veu del català que contempli tota la diversitat lingüística de la llengua.

Així, del 14 de maig a principis de juny, la gira d’AINA farà parada a les vuit vegueries catalanes, amb un acte de presentació a cadascuna d’elles on hi intervindrà el vicepresident del Govern, Jordi Puigneró, una autoritat local i una entitat de defensa de la llengua del territori. L’actriu Marta Bayarri conduirà els actes, que comptaran, a més, amb una actuació musical a càrrec de Dave ZuluetaMaria Hein o Sara Roy.

unnamed (9)

Més enllà dels actes centrals de presentació del projecte, però, la gira d’AINA pel Principat comptarà amb una altra protagonista destacada: una furgoneta vinilada amb la gràfica de la campanya i habilitada com a punt itinerant de recol·lecció de veus del projecte AINA, on la ciutadania dels territoris visitats podrà enregistrar les seves veus.

Calendari de la gira

La gira de l’AINA per territori català arrencarà aquest dissabte, 14 de maig, a la vegueria del Penedès, concretament a la plaça de la Vila de Vilanova i la Geltrú, i farà la segona parada a la vegueria de la Catalunya Central (21 de maig, a Manresa). Posteriorment i fins a principis del mes de juny, la gira passarà per les vegueries del Camp de Tarragona, Terres de l’Ebre, Lleida, Alt Pirineu i Aran i Girona.

En el cas de la vegueria de Barcelona, el pas de la gira d’AINA consistirà en la instal·lació del punt itinerant de recollida de veus al recinte del festival gastronòmic ‘Time to Eat Fest’, que se celebra els dies 28 i 29 de maig a l’Antiga Fàbrica Damm, a Barcelona.

Cap al milió de veus enregistrades

El Govern de Catalunya va llançar a mitjans de febrer la campanya ‘La nostra llengua és la teva veu’ en el marc del projecte AINA amb l’objectiu de recollir el màxim de veus possible per nodrir de continguts la primera versió del corpus de veu del català, imprescindible per ensenyar les màquines a entendre i parlar la nostra llengua.

La campanya convida la ciutadania de parla catalana de totes les edats, gèneres, condicions i procedències a “donar” la seva veu a través del web projecteaina.cat, des d’on tothom pot llegir, enregistrar i validar un nombre il·limitat de frases agrupades de 5 en 5 a la plataforma Common Voice de Mozilla.

Des que va començar la campanya i fins avui, ja s’ha aconseguit arribar a gairebé 1.200 hores noves gravades 860.000 talls de veu nous enregistrats. De fet, l’excel·lent acollida de la campanya per part de la ciutadania va fer que en poc més d’un mes el català passés a ser la segona llengua del món amb més locutors a Common Voice, només per darrere de l’anglès, i que en menys de dos mesos s’assolís un dels objectius que els impulsors del projecte s’havien marcat per a tot el 2022: superar les 2.000 hores de gravació a la plataforma.

Amb tot, la variant dialectal dominant a la plataforma continua sent el català central, que supera el 75% de les veus enregistrades, mentre que les variants menys representades són el balear (1%), el nord-occidental (1%), el septentrional (3%) i el valencià (5%). Aconseguir incrementar aquests percentatges és, precisament, l’objectiu de la gira de l’AINA.

Sobre el projecte AINA

Impulsat pel Departament de la Vicepresidència i de Polítiques Digitals i Territori en col·laboració amb el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), AINA és un projecte basat en tecnologies de dades i Intel·ligència Artificial per fer possible que les màquines entenguin i parlin el català amb l’objectiu últim d’evitar l’extinció digital de la llengua catalana.

En aquest sentit, el projecte AINA està construint els corpus i els models de llengua del català per facilitar que les empreses tecnològiques puguin desenvolupar les seves solucions o serveis específics (traductors, assistents personals, sintetitzadors de veu, classificadors de textos, etc.) en la nostra llengua.