[ad_1]
Volviendo al agosto de 2023, Meta reveló un modelo de traducción que funciona con inteligencia artificial “todos” capaz de comprender aproximadamente 100 idiomas diferentes.
Doblado M4t suave (Traducción de un mecanismo de lenguaje múltiple y multimedia a gran escala), este es un intento muerto de crear un “traductor global” que se asemeja a una babilonia en la clásica serie de ciencia ficción de Douglas Adams Guía de viajero para la galaxia.
El equipo detrás de la herramienta SeamlessM4T ahora ha detallado su trabajo en un artículo en la revista naturalezaY la divulgación del sistema avanzado proporciona una solución integral para traducir el texto en un texto, desde las palabras hasta el texto, y de las palabras a las palabras, y de el texto a las palabras a través de una maravillosa y creciente colección de idiomas.
Más de 400 años de sonido crudo
SeamlessM4t, que se usa, entre otras cosas, tiene videos automáticamente en Facebook e Instagram, actualmente admite la traducción del habla en palabras de 101 a 36 idiomas, traduciendo el discurso en texto de 101 a 96 idiomas, convirtiendo el texto en palabras, traduciendo textos en 96 Idioma, traducir el texto en palabras de 96 a 36 idiomas e identificación automática del habla para 96 idiomas. Este enfoque unificado supera las restricciones de los sistemas consecutivos tradicionales, que a menudo requieren subsistemas separados para identificar habla, traducción y sintetizar el texto en palabras.
Al simplificar estos procesos, Meta dice que SeamlessM4T supera a los modelos actuales, y logra hasta un 23% más alto que BLU (estudio de evaluación bipolar) en la precisión de la traducción y muestra una flexibilidad sorprendente frente al ruido de fondo y las diferencias de los auriculares.
Para crear SeamlessM4t, Meta comenzó 4 millones de horas (más de 400 años) de sonido bruto de lenguaje múltiple desde un almacén disponible para el público para los datos web a los que se arrastró. El equipo ha desarrollado Seamlessalign, un grupo multimedia que contiene más de 470,000 horas de habla consistente y fusionó el conjunto de datos con técnicas avanzadas de aprendizaje automático, incluida la sonar (representaciones multimedia y representaciones no lenguaje de la oración a nivel de oración), lo que permite Cifrado de lenguaje múltiple y neutral para medios. Para texto y habla.
Meta dice que al abordar los desafíos sociales y éticos mediante el uso de garantías, SeamlessM4t puede ser una herramienta valiosa para la comunicación global. Estas garantías reducen el sesgo sexual (errores para determinar el sexo gramatical) y reducen el problema tóxico adicional, donde las palabras abusivas aparecen en las traducciones pero no en la fuente original.
Puede que también quieras
[ad_2]
Source Article Link