Las traducciones de la Biblia se han usado en la investigación de la traducción de idiomas basada en texto y se acompañan de lecturas grabadas
Los modelos de habla multilingüe masivos han expandido las tecnologías de texto a voz y de voz a texto de 100 idiomas a más de 1.100 (Pexels)
23 de mayo de 2023 10:40 AM | Con información de DP
15 minutos. Meta ha desarrollado una serie de modelos de inteligencia artificial (IA) para preservar las lenguas que están en peligro de desaparición, que ya son capaces de abarcar 4 mil idiomas hablados de todo el mundo.
Los modelos de habla multilingüe masivos han expandido las tecnologías de texto a voz y de voz a texto de 100 idiomas a más de 1.100. El salto también se replica en la identificación de lenguas habladas, que alcanza las 4 mil, "40 veces más que antes".
Así lo ha afirmó Meta, que compartió novedades sobre los modelos de IA en los que trabaja para preservar las lenguas en peligro de desaparición. La finalidad es que los usuarios puedan acceder a la información y usar su dispositivo en el idioma de su preferencia.
Con este objetivo, anunció la apertura de sus modelos y códigos para que la comunidad de investigadores pueda colaborar con esta tarea, según un comunicado compartido en su blog oficial.
Asimismo, explicó el enfoque que han aplicado a los trabajos con los modelos de habla multilingüe masivos, que ha permitido el salto en la cantidad de idiomas que admite. Para ello, han recurrido a la Biblia, ya que se ha traducido a multitud de idiomas.
Las traducciones de la Biblia se han usado en la investigación de la traducción de idiomas basada en texto y se acompañan de lecturas grabadas que están disponibles de forma pública. A partir de estos audios, Meta ha creado "un conjunto de datos de lecturas del Nuevo Testamento en más de 1.100 idiomas, que proporcionó un promedio de 32 horas de datos por idioma".
Para alcanzar la cifra de los 4 mil idiomas, consideraron también "grabaciones no etiquetadas de otras lecturas religiosas cristianas". A pesar de que el contenido es religioso, la compañía asegura que sus modelos no tienen un sesgo para producir un lenguaje más religioso.
La compañía espera en un futuro ampliar el número de idiomas que los modelos de habla multilingüe masivos pueden soportar, e incorporar dialectos.