Miércoles 25 de diciembre de 2024

20241211_mh_noexigencia_dui_728x90
20240813_lechematerna_728x91
20240701_vacunacion_728x90
20231124_etesal_728x90_1
20230816_dgs_728x90
20230601_agenda_primera_infancia_728X90
domfuturo_netview-728x90
20240604_dom_728x90
CEL
previous arrow
next arrow

Meta presenta nuevo modelo de IA para traducciones y transcripciones multilingües

Redacción ||

Hoy, Meta ha dado a conocer un emocionante avance en el campo de la inteligencia artificial (IA) con la presentación de su último modelo, SeamlessM4T. Esta novedosa tecnología está diseñada para llevar a cabo traducciones y transcripciones en casi cien idiomas, marcando un importante paso hacia el desarrollo de un traductor universal.

SeamlessM4T adopta un enfoque integral al combinar múltiples funciones en un solo sistema, lo que reduce los errores y los retrasos en los procesos de traducción. Este modelo innovador se basa en los avances logrados por otros modelos desarrollados por Meta, como No Language Left Behind, el traductor universal de voz y los modelos masivos de voz multilingüe.

En términos concretos, este modelo multimodal y multilingüe tiene la capacidad de reconocer el habla en casi cien idiomas, traducir del habla al texto en aproximadamente cien idiomas tanto de entrada como de salida, realizar traducciones de voz a voz en cerca de cien idiomas de entrada y 36 de salida, efectuar traducciones de texto a texto en casi cien idiomas y traducir de texto a voz en cien idiomas de entrada y 35 de salida.

La empresa ha compartido su visión detrás de este avance en su blog de IA, comparando el desafío de construir un traductor universal con el famoso “Pez de Babel” de la novela “Guía del autoestopista galáctico”. Los sistemas actuales de voz a voz y de voz a texto solo abarcan una fracción limitada de los idiomas del mundo. Sin embargo, Meta considera que el nuevo modelo SeamlessM4T representa un paso crucial en el camino hacia la creación de un traductor verdaderamente universal.

En asociación con esta revelación, Meta ha puesto a disposición del público un conjunto de datos llamado SeamlessAlign, que ofrece alrededor de 270,000 horas de alineaciones de voz y texto. Este conjunto de datos está diseñado para respaldar la investigación y el desarrollo continuo en el campo de la traducción multimodal, lo que subraya el compromiso de Meta con la colaboración y el progreso en la comunidad de IA.

El lanzamiento de SeamlessM4T y la disponibilidad de SeamlessAlign marcan un hito significativo en el impulso hacia la comunicación sin barreras en un mundo globalizado y diverso. La combinación de avances tecnológicos y datos abiertos promete un futuro en el que las barreras lingüísticas se desvanezcan gradualmente, permitiendo una comunicación fluida y enriquecedora en todas partes.