8 hores de veu enregistrades per un centenar d'aranesos per desenvolupar tecnologies de la parla

REDACCIÓ
Publicat: 
20-12-2022
Temps aproximat lectura Temps aproximat de lectura:
  • 8 hores de veu enregistrades per un centenar d'aranesos per desenvolupar tecnologies de la parla
    Peu de foto: 
    Col·lectivaT
  • 8 hores de veu enregistrades per un centenar d'aranesos per desenvolupar tecnologies de la parla
    Peu de foto: 
    Col·lectivaT
  • 8 hores de veu enregistrades per un centenar d'aranesos per desenvolupar tecnologies de la parla
    Peu de foto: 
    Col·lectivaT

 

Aquest cap de setmana, la Marató de veus del "Projecte Araina, votzes en aranés" ha recollit més de 8 hores de veu enregistrades en aranès d’un centenar de participants. L’esdeveniment, celebrat en format presencial i virtual, ha comptat amb persones de parla aranesa de diverses edats, registres i parlars que s’han gravat llegint fins a 4.000 frases en aquesta varietat de la llengua occitana.

Durant el matí de dissabte, les primeres persones voluntàries van donar la seva veu a la convocatòria presencial de la Marató de veus al Conselh Generau d’Aran a Vielha. Col·lectivaT va fer una presentació de l’activitat i va organitzar una roda de premsa per explicar els objectius del projecte amb les intervencions del lingüista computacional Alp Öktem, la investigadora Helena Torres i la docent d’aranès Maria José Fernández. La resta de cap de setmana, les persones voluntàries van continuar enregistrant la seva veu de manera virtual a través dels seus dispositius mòbils i ordinadors.

La Marató de veus ha estat l’activitat principal del Projecte Araina per començar a crear el primer corpus de veu en aranès a partir de la participació col·lectiva, imprescindible per desenvolupar tecnologies de la parla. Després d’aquest cap de setmana, la web del projecte es mantindrà activa per ampliar el corpus i aconseguir suficients gravacions de veu en aranès, un mínim de 100 hores per poder crear els primers prototips de sistemes de la parla en aquesta llengua.

Per enregistrar la seva veu, les persones participants han d’entrar al web del projecte, seguir les instruccions de funcionament i llegir en veu alta diversos fragments de text que apareixen projectats a la seva pantalla. Els textos introduïts per fer l’exercici són de les obres literàries clàssiques traduïdes a l’aranès per Antòni Nogués. Tot aquest procés de recollida de veus es realitza a través de la plataforma oberta Common Voice de Mozilla tal com s’està fent amb el Projecte Aina que ja porta més de 2.500 hores de veus recollides en català.

Sobre el Projecte Araina i Col·lectivaT

El Projecte Araina està impulsat per la cooperativa Col·lectivaT amb la col·laboració de l’investigador Jordi Suïls Subirà i de la investigadora Helena Torres Purroy, membres de la Universitat de Lleida i el Conselh Consultatiu der Aranés. Està subvencionat pel Departament de Cultura de la Generalitat de Catalunya en el marc de les "Subvencions per promoure el coneixement i l'ús de l'occità, aranès a l'Aran, a Catalunya" i rep el suport del Conselh Generau d'Aran, Lo Congrès permanent de la lenga occitana i la fundació Mozilla.

Col·lectivaT és una cooperativa sense ànim de lucre que promou el coneixement obert i el diàleg entre diferents realitats, mitjançant la investigació social i la prestació de serveis lingüístics i tecnològics. Dins d'aquest últim àmbit, una de les seves tasques centrals és el desenvolupament de tecnologies innovadores al servei de llengües minoritzades. En aquest sentit, han desenvolupat el primer sintetitzador de veu basat en xarxes neuronals en català, el Catotron, i segueixen col·laborant per la digitalització de llengües com l’amazic, el judeo-castellà i el gallec.

Comparteix

També t'interessarà