Categories
News

Mistral anuncia el lanzamiento del modelo Pixtral 12B multimedia AI con visión por computadora.

[ad_1]

Mistral Pixtral 12B lanzó el miércoles su primer modelo multimedia de inteligencia artificial (IA) llamado Pixtral 12B. La compañía de inteligencia artificial, conocida por sus modelos de lenguajes grandes (LLM) de código abierto, también ha puesto a disposición de los usuarios su último modelo de inteligencia artificial en GitHub y Hugging Face para que los usuarios lo descarguen y lo prueben. Vale la pena señalar que a pesar de ser multimedia, Pixtral sólo puede procesar imágenes mediante tecnología de visión por computadora y responder consultas sobre las mismas. Se han agregado dos codificadores especiales para esta función. No puede crear imágenes como Propagación estable Modelos generativos de Midjourney o GAN.

Mistral lanza Pixtral 12B

Mistral ha ganado tanta fama por sus anuncios sencillos que su cuenta oficial en X (antes conocida como Twitter) lanzó el modelo de IA en correo Compartiendo su enlace magnético. El tamaño total del archivo Pixtral 12B es de 24 GB y requerirá una computadora con una NPU o una máquina con una GPU potente para ejecutar el modelo.

El Pixtral 12B viene con 12 mil millones de parámetros y está construido utilizando el modelo de IA Nemo 12B existente de la compañía. Mistral destaca que los usuarios también necesitarán una unidad lineal de error gaussiano (GeLU) como transductor de visión y una incrustación de posición rotativa 2D (RoPE) como codificador de visión.

Vale la pena señalar que los usuarios pueden cargar archivos de imágenes o URL en Pixtral 12B, y debería poder responder consultas sobre la imagen, como identificar objetos, contar su número y compartir información adicional. Debido a que está basado en Nemo, el modelo también será experto en completar todas las tareas de texto típicas.

Usuario de Reddit ha sido publicado Imagen que muestra puntuaciones de referencia para Pixtral 12B El LLM parece superar a Claude-3 Haiku y Phi-3 Vision en capacidades multimedia en la plataforma ChartQA. También supera a los dos modelos de IA de la competencia en la plataforma Massive Multitask Language Understanding (MMLU) en términos de conocimiento y razonamiento multimodal.

Citado por el portavoz de la empresa, TechCrunch Informes El modelo Mistral AI se puede configurar y utilizar bajo la licencia Apache 2.0. Esto significa que el resultado del modelo se puede utilizar para uso personal o comercial sin restricciones. Además, Sophia Yang, jefa de Relaciones con Desarrolladores de Mistral, explicó en correo Pixtral 12B pronto estará disponible en Le Chat y Le Platforme.

Actualmente, los usuarios pueden descargar el modelo de IA directamente mediante el enlace magnético proporcionado por la empresa. Alternativamente, también se agregan pesos de modelo. Alojado Acerca de Hugging Face y GitHub Liza.

[ad_2]

Source Article Link

Categories
Life Style

La startup francesa Mistral ha presentado su modelo de IA multimedia Pixtral 12B

[ad_1]

Francés inteligencia artificial comenzar Mistral ha bajado Su primer modelo multimediaPixtral 12B, capaz de procesar imágenes y texto.

El modelo de 12 mil millones de parámetros, que se basa en el modelo de texto Nemo 12B existente de Mistral, está diseñado para tareas como traducción de imágenes, identificación de objetos y respuesta a consultas relacionadas con imágenes.

Esta muestra tiene un tamaño de 24 GB y está disponible gratuitamente bajo la licencia Apache 2.0, lo que significa que cualquiera puede usarla, modificarla o comercializarla sin restricciones. Los desarrolladores pueden descargarlo desde GitHub y Hugging Face, pero aún no se han publicado demostraciones web funcionales.

Velocidad de la luz medible

Según el jefe de relaciones con desarrolladores de Mistral, Pixtral 12B pronto se integrará en el chatbot de la empresa, Le Chat, y en la plataforma API, La Platforme.

Los modelos multimodales como Pixtral 12B podrían ser la próxima frontera de la IA generativa, siguiendo los pasos de herramientas como GPT-4 de OpenAI Sin embargo, existen dudas sobre las fuentes de datos utilizadas para entrenar estos modelos. Según lo informado por Tech CrunchMistral, como muchas empresas de inteligencia artificial, probablemente entrenó a Pixtral 12B utilizando grandes cantidades de datos web disponibles públicamente, una práctica que ha provocado demandas por parte de Los titulares de derechos de autor cuestionan el argumento del “uso justo” Suelen ser fabricados por empresas de tecnología.

El lanzamiento llega después de Mistral. Recaudó 645 millones de dólares en financiaciónLo que elevó su valor a 6 mil millones de dólares. Con el respaldo de Microsoft, Mistral se está posicionando como la respuesta europea a OpenAI.



[ad_2]

Source Article Link