Categories
Featured

El nuevo refuerzo de inteligencia artificial de OpenAI podría cambiar la forma en que los científicos usan sus modelos

[ad_1]

El segundo día de Abierto AI's 12 días de OpenAI Convertidos en intereses institucionales menos apasionantes y más comparados con la oferta pública de Modelo OpenAI o1 A ChatGPT el primer día.

En cambio, OpenAI ha anunciado planes para lanzar Reinforcement Fine-Tuning (RFT), una forma de personalizar sus modelos de IA para desarrolladores que quieran adaptar los algoritmos de OpenAI para tipos específicos de tareas, especialmente tareas más complejas. Esta versión representa un claro cambio hacia las aplicaciones empresariales en comparación con las actualizaciones del primer día centradas en el consumidor. Puede pensar en RFT como una forma de mejorar el funcionamiento de los modelos de IA razonando sobre las respuestas. El uso de un conjunto de datos y una rúbrica de un desarrollador permite a la plataforma OpenAI entrenar su IA especializada sin muchos aumentos costosos de experimentos posteriores.



[ad_2]

Source Article Link

Categories
News

OpenAI lanza la versión completa de su modelo de IA o1 centrado en la inferencia y ofrece una suscripción ChatGPT Pro

[ad_1]

Abierto AI El jueves sacó de la versión preliminar su modelo de inteligencia artificial (IA) o1 y lanzó la versión completa. La compañía de inteligencia artificial afirma que el nuevo modelo ahora puede realizar tareas que la vista previa de o1 no podía. También se dice que es más rápido en tiempos de respuesta y más conciso en su pensamiento. El modelo OpenAI o1 AI estará disponible para todos los suscriptores pagos de ChatGPT. Aparte de esto, la compañía también introdujo una nueva suscripción llamada ChatGPT Pro que brindará un amplio acceso a los mejores modelos y herramientas de OpenAI.

Modelo de IA OpenAI o1, nueva suscripción Pro

Los nuevos anuncios son parte de la campaña '12 días de OpenAI' de la compañía, donde planea realizar 12 transmisiones en vivo en 12 días y brindar nuevas actualizaciones todos los días. El primer día la empresa publicar En

Al destacar las capacidades mejoradas en la versión completa, la compañía afirmó que el o1 genera respuestas más rápido y ofrece un mejor rendimiento en programación, matemáticas y mecanografía. Además, el modelo de IA también puede procesar imágenes cargadas y generar respuestas basadas en ellas. Por ejemplo, los usuarios pueden mostrarle a un chatbot una imagen de una pajarera y pedirle que proporcione una guía paso a paso para crearla.

Durante las pruebas internas, OpenAI descubrió que el modelo o1 reducía errores significativos en preguntas difíciles del mundo real en un 34 por ciento en comparación con la vista previa de o1. El modelo AI reemplaza la vista previa o1 y está disponible para los usuarios de ChatGPT Plus y Team a través de la opción de selección de modelo en el chatbot. Los usuarios empresariales y educativos podrán acceder al modelo dentro de una semana.

De cara a la hoja de ruta futura, la compañía de inteligencia artificial dijo que está trabajando para agregar soporte para navegación web y herramientas de carga de archivos al modelo o1 de ChatGPT. Además, OpenAI también planea hacer que el modelo de lenguaje grande (LLM) esté disponible en la API y agregar soporte para llamadas a funciones, mensajes para desarrolladores, resultados estructurados y visibilidad.

en un Publicación de blogOpenAI también anunció la introducción de la suscripción ChatGPT Pro. La suscripción brindará a los usuarios acceso ilimitado a los modelos más capaces de la compañía, como o1, o1-mini, GPT-4o y Advanced Audio Tool. Además, los usuarios obtendrán un nuevo modo o1 pro, que se describe como una versión mejorada de o1 diseñada para “ofrecer mejores respuestas” a problemas complejos utilizando potencia de procesamiento adicional.

ChatGPT La suscripción Pro tiene un precio de 200 dólares (alrededor de 16.900 rupias) al mes, lo que la hace casi diez veces más cara que la suscripción Plus, que cuesta Rs. 1950 en la India. Al explicar el precio, la compañía dijo que esta suscripción está dirigida a investigadores, ingenieros e individuos que utilizan inteligencia de investigación.

[ad_2]

Source Article Link

Categories
Life Style

OpenAI está un paso más cerca del Pentágono gracias a una asociación con la startup de defensa

[ad_1]

OpenAI ha entrado en La primera gran asociación de defensaun acuerdo que podría hacer que el gigante de la IA llegue al Pentágono.

La empresa conjunta se anunció recientemente por un valor de mil millones de dólares. Industrias Anduriluna startup de defensa propiedad de Palmer Lackey, cofundador de Oculus VR, que vende torres de vigilancia, bloqueadores de comunicaciones, drones militares y submarinos autónomos. La “asociación estratégica” integrará los modelos de inteligencia artificial de OpenAI en los sistemas de Anduril para “recopilar rápidamente datos urgentes, reducir la carga sobre los operadores humanos y mejorar la conciencia situacional”. Anduril ya suministra al gobierno estadounidense tecnología anti-drones. Recientemente fue seleccionado Desarrollo y prueba de aviones de combate no tripulados. Se le adjudicó un contrato de 100 millones de dólares con la oficina principal de inteligencia digital y artificial del Pentágono.

OpenAI explicado a El Correo de Washington Que la asociación solo cubrirá sistemas que “defiendan contra amenazas aéreas no tripuladas” (léase: detectar y derribar drones), evitando en particular la asociación explícita de su tecnología con aplicaciones militares que causan víctimas humanas. Tanto OpenAI como Anduril dicen que la asociación mantendrá a Estados Unidos en pie de igualdad con los avances en IA en China, un objetivo recurrente que se refleja en las inversiones del gobierno de EE.UU. al estilo del “Proyecto Manhattan” en IA y “Eficiencia gubernamental.

Velocidad de la luz triturable

“OpenAI construye IA para beneficiar a la mayor cantidad de personas posible y apoya los esfuerzos liderados por Estados Unidos para garantizar que la tecnología defienda los valores democráticos”, escribió Sam Altman, director ejecutivo de OpenAI. “Nuestra asociación con Anduril ayudará a garantizar que la tecnología OpenAI proteja al personal militar de Estados Unidos y ayudará a la comunidad de seguridad nacional a comprender y utilizar esta tecnología de manera responsable para mantener a nuestros ciudadanos seguros y libres”.

En enero, OpenAI El lenguaje político fue eliminado silenciosamente. Que prohibió las aplicaciones de sus tecnologías que supongan un riesgo importante de daño físico, incluidas las “militares y bélicas”. Un portavoz de OpenAI le dijo a Mashable en ese momento: “Nuestra política no permite que nuestras herramientas se utilicen para dañar a personas, desarrollar armas, monitorear comunicaciones, infectar a otros o destruir propiedades. Sin embargo, existen casos de uso de seguridad nacional que se alinean con nuestra misión. por ejemplo Ejemplo, ya estamos trabajando con DARPA Estimular la creación de nuevas herramientas de ciberseguridad para proteger el software de código abierto del que dependen la infraestructura crítica y la industria. “No estaba claro si estos casos de uso beneficioso estarían permitidos bajo el 'estatus militar' de nuestras políticas anteriores”.

Durante el año pasado, la compañía supuestamente ha estado ofreciendo sus servicios en diversos campos a las oficinas militares y de seguridad nacional de EE. UU., con el apoyo de un ex oficial de seguridad de la compañía de software y contratista gubernamental Palantir. OpenAI no es el único innovador de IA centrado en aplicaciones militares. Las empresas de tecnología Anthropic, creadores de Claude y Palantir, anunciaron recientemente… Asociación con servicios web de Amazon Vender los modelos de IA de Anthropic a agencias de defensa y de inteligencia, que se anuncian como herramientas de “toma de decisiones ventajosas” en “entornos clasificados”.

Rumores recientes sugieren que el presidente electo Donald Trump está mirando al CTO de Palantir Shyam Shankar Asumir un puesto clave de ingeniería e investigación en el Pentágono. Shanker ha criticado anteriormente el proceso de adquisición de tecnología del Ministerio de Defensa, argumentando que el gobierno debería depender menos de los principales contratistas de defensa y comprar más “tecnología disponible comercialmente”.



[ad_2]

Source Article Link

Categories
Life Style

OpenAI anuncia ChatGPT Pro a un precio mensual de 200 dólares

[ad_1]

El primer día de lanzamiento, AbiertoAI Te regalé: ChatGPT Pro por una tarifa considerable.

Nuevo Chat GPT Pro El nivel de suscripción, disponible ahora, cuesta 200 dólares al mes.

El jueves, OpenAI Anunciar Nuevo nivel de suscripción como parte de “12 días de OpenAI” Magnificencia. ChatGPT Pro viene con acceso ilimitado a sus plantillas, GPT-4o, modo de audio avanzado y Versión completa de o1 Que está fuera de vista previa a partir de hoy.

OpenAI también presentó el modo o1 pro, una función exclusiva de ChatGPT Pro que puede manejar más computación para problemas complejos de matemáticas, programación y escritura. OpenAI dice que el modo o1 pro funciona mejor para los estándares de aprendizaje automático para preguntas de matemáticas, programación y ciencias de nivel doctoral. El director ejecutivo Sam Altman dijo que ChatGPT Pro está diseñado para “usuarios avanzados”. Debido a la complejidad de las tareas, el modo o1 pro tardará más en responder, por lo que mostrará una barra de progreso.

Velocidad de la luz triturable

El aumento de precios no es nada inesperado. Según A. un informe de tiempos de nueva york, OpenAI está considerando aumentar el costo de una suscripción ChatGPT Plus a $44 por mes durante los próximos cinco años. OpenAI es ambicioso (algunos podrían argumentar Poco realista) pretende triplicar sus ingresos para el próximo año y 100 mil millones de dólares para 2029. Los usuarios pueden esperar que OpenAI comience a ganar más dinero con sus productos. Creador de ChatGPT también Mirando Plantilla de anuncio.

A día de hoy, o1 se ha lanzado por completo. El modelo de inferencia, que anteriormente estaba disponible como una vista previa limitada, ahora está disponible para los usuarios de ChatGPT Plus y Teams, y los usuarios de Edu y Enterprise tendrán acceso a él la próxima semana.

OpenAI dice que el modelo o1 es un 50 por ciento más rápido y supera a la vista previa de o1 en “preguntas difíciles del mundo real” en un 34 por ciento. El o1 ahora admite entrada multimedia, lo que significa que puede comprender las imágenes cargadas. La empresa agregó que está trabajando en herramientas para navegar por la web y descargar archivos.

Menos de dos horas antes de la transmisión en vivo, se hizo el anuncio. Se filtró On X por el ingeniero de software Tibor Blaho (según TechCrunch). Explore la página de planes de precios de Blaho que contiene información sobre ChatGPT Pro, incluidos precios y funciones.

Blaho también filtró otra página sobre el plan del equipo ChatGPT que incluía una “vista previa limitada de GPT-4.5” como parte de su presentación. Desde entonces, la referencia ha sido eliminada, pero podría ser una indicación de lo que sucederá en las próximas semanas.



[ad_2]

Source Article Link

Categories
Life Style

Se informa que Sora se enviará como parte del maratón de transmisión en vivo “12 días de OpenAI”.

[ad_1]

¿Pensaste que la temporada navideña sería un momento para la paz en la Tierra, o al menos la paz en Internet? OpenAI tiene otras ideas.

El miércoles, el creador de ChatGPT anunció los “12 días de OpenAI”. A partir del jueves 5 de diciembre, OpenAI transmitirá en vivo el lanzamiento de un nuevo producto todos los días. Durante 12 días.

Según The Verge, uno de los anuncios será el tan esperado generador de vídeo Sora, impulsado por IA. Este será uno de los lanzamientos más importantes en mucho tiempo para OpenAI. Pero no habrá una explosión al nivel de Sora todos los días. “No todos los días habrá un gran lanzamiento; los 12 días incluirán algunos regalos y obsequios más grandes”, dijo la portavoz de OpenAI, Leah Anise. Las versiones secundarias pueden incluir audio con temas navideños para el modo de audio avanzado, según el usuario. manchado Nuevo ícono de sonido y copo de nieve en el código ChatGPT.

Velocidad de la luz triturable

Desde OpenAI Anunciar Sora, que actualmente se encuentra en fase preliminar de investigación cerrada, es un generador de vídeo con IA que ha generado controversia. Basado en las demostraciones, el modelo de texto a video puede proporcionar presentaciones realistas y detalladas, a través de indicaciones de texto simples. Pero al igual que con otros modelos de IA, OpenAI no ha compartido ningún detalle sobre los datos de entrenamiento de Sora. Esto no impidió que los creadores Especulación Ha sido entrenado en trabajos creados por humanos en YouTube y otras partes de la web.

Recientemente, los probadores de Sora han echado más leña al fuego proverbial filtración Llega a la API como una forma de protesta contra los “señores corporativos de la IA” que dicen que están “siendo atraídos al 'artwashing' para decirle al mundo que Sora es una herramienta útil para los artistas”. Si Sora se envía en los próximos 12 días, sin duda reavivará el discurso de la IA, y en un momento en el que en Mashable todos queríamos pensar en asar castañas a fuego abierto.



[ad_2]

Source Article Link

Categories
Life Style

OpenAI definitivamente está pensando en los anuncios ChatGPT

[ad_1]

OpenAI puede llevar publicidad a ChatGPT, con énfasis en eso puede.

La directora financiera Sarah Friar dijo… Tiempos financieros el lunes que la empresa de inteligencia artificial está considerando un modelo publicitario y agregó que planea “pensar cuándo y dónde lo implementaremos”.

Sin embargo, Friar dio marcha atrás ligeramente en una declaración de seguimiento al medio, diciendo: “Si bien estamos abiertos a explorar otras fuentes de ingresos en el futuro, no tenemos planes activos para dedicarnos a la publicidad”.

Velocidad de la luz triturable

Esto va con lo que OpenAI le dijo a Mashable Cuando se lanzó Buscar ChatGPT A finales de octubre. Cuando se le preguntó si la empresa planea publicar anuncios en el motor de búsqueda impulsado por inteligencia artificial, un portavoz de la empresa dijo: “No tenemos planes de publicar anuncios”.

Sin embargo, OpenAI ha contratado recientemente a muchos de los mejores talentos en monetización. Shivakumar Venkataraman, anteriormente miembro del equipo de publicidad de Búsqueda de Google, se convirtió en vicepresidente de OpenAI en mayo, y Kevin Weil, director de producto que dirigió los equipos de producto en Instagram y X, se unió al equipo en junio. El martes, OpenAI contratado Su primera directora de marketing, Kate Roche, quien supervisó los anuncios del Super Bowl de Coinbase.

OpenAI cerró recientemente un sitio enorme Ronda de financiación 6 mil millones de dólares, lo que le da a la empresa una valoración de 150 mil millones de dólares. De acuerdo a New York Timesel pronóstico de ingresos de OpenAI que respalda su mayor ronda de capital de riesgo jamás espera que genere $11,6 mil millones de dólares en 2025. Esto a pesar de que OpenAI está operando actualmente con una pérdida de $2,3 mil millones de dólares. Entonces de alguna manera OpenAI tiene que triplicar sus ingresos a pesar del enorme coste de mantener y desarrollar sus modelos de IA. Este dinero tiene que venir de alguna parte y Escalada Es posible que sus suscripciones premium no sean suficientes.

Por supuesto, traer anuncios a ChatGPT conlleva riesgos. excitando producto y alienar a los usuarios. Esto podría resultar costoso en un entorno altamente competitivo donde Anthropic, Perplexity y Google Gemini están desarrollando herramientas similares.



[ad_2]

Source Article Link

Categories
Entertainment

Elon Musk quiere que un tribunal impida que OpenAI se convierta en una empresa con fines de lucro

[ad_1]

Los abogados de Elon Musk presentaron una demanda contra… orden judicial contra OpenAI y Microsoft el viernes, acusándolos de prácticas anticompetitivas. Quiere dejar de convertir OpenAI en una empresa con fines de lucro. Musk demandó por primera vez a OpenAI a principios de este año por supuestamente violar su misión fundacional de construir inteligencia artificial “en beneficio de la humanidad”, pero retiró la demanda unos meses después. En agosto presentó otra demanda contra OpenAI en un tribunal federal de California.

La tercera es la vencida y todo: la nueva propuesta de Musk acusa a OpenAI y Microsoft de decirle a los inversores que no financien a los competidores de OpenAI, como xAI de Musk, “aprovechando información competitivamente sensible o formatos obtenidos ilícitamente” a través de su relación con Microsoft.

– Matt Smith

Las historias tecnológicas más importantes que te perdiste

Reciba esto diariamente directamente en su bandeja de entrada. ¡Suscríbete aquí!

HechoHecho

Intel

Intel se está preparando para un anuncio el 3 de diciembre sobre sus GPU Arc, sin embargo, las filtraciones están arruinando la fiesta. Informes de VideoCardz Afirma que el evento presentará dos GPU de escritorio Battlemage, Arc B580 y Arc B570, que se lanzarán el 12 de diciembre. El B580 supuestamente contará con 20 núcleos Xe2, una GPU de 2,8 GHz y 12 GB de VRAM. Por otro lado, el B570 tendrá 18 núcleos Xe2, una GPU de 2,6 GHz y 10 GB de memoria. En otro lugar, el filtrador @momomo_us en X publicó listados que sugieren que la edición limitada del B580 costará alrededor de $250.

Continúe leyendo.

Bluesky actualizó su política de suplantación para que sea “más agresiva” después de que un análisis de terceros resaltara su problema de verificación. El servicio de redes sociales está eliminando cuentas que se hacen pasar por otras personas y aquellas que se sientan en manijas, dijo la cuenta de Bluesky Safety. Bluesky no cuenta con un sistema de verificación tradicional, por lo que es fácil para usuarios sin escrúpulos hacerse pasar por otra persona, ya sea para llamar la atención o para estafar a otros. Bluesky ahora también prohíbe explícitamente los cambios de identidad. Las cuentas que comiencen como imitadores para ganar nuevos usuarios y luego cambien a una identidad diferente para eludir la prohibición seguirán excluidas de la aplicación.

Continúe leyendo.

[ad_2]

Source Article Link

Categories
News

Investigadores de Alibaba presentan el modelo de IA Marco-o1 como otro competidor centrado en el razonamiento del modelo OpenAI

[ad_1]

Alibaba Recientemente introdujo un modelo de IA centrado en heurística llamado Marco-o1. Este modelo es similar al modelo de lenguaje grande QwQ-32B, que también está optimizado para tareas que requieren habilidades de pensamiento avanzadas; sin embargo, una diferencia importante es que Marco-o1 es un modelo más pequeño y se deriva del modelo Qwen2-7B-Instruct. El gigante tecnológico chino afirmó que se utilizaron varios ejercicios de ajuste para que el nuevo modelo se centrara en el pensamiento. Además, los investigadores destacaron que está optimizado para tareas complejas de resolución de problemas del mundo real.

Modelo de inteligencia artificial Alibaba Marco-O1

El nuevo modelo de IA se detalla en un artículo papel Ha sido publicado en arXiv, una revista electrónica preimpresa. Cabe señalar que los artículos publicados en la revista electrónica no están sujetos a revisión por pares. Además, Alibaba también tiene… Alojado Se ha permitido descargar y utilizar el modelo de IA en Hugging Face para casos de uso personal y comercial bajo la licencia Apache 2.0.

Sin embargo, no es completamente de código abierto ya que solo se ha puesto a disposición un conjunto de datos parcial. Como tal, los usuarios no podrán duplicar ni descomponer el modelo para analizar la estructura o los componentes.

Al llegar a Marco-o1, se ajustó a partir del modelo base Qwen2-7B-Instruct. En este artículo, los investigadores destacan que el modelo de IA se apoya en el ajuste de la Cadena de Pensamiento (CoT), la Búsqueda de Árboles de Monte Carlo (MCTS), los mecanismos de reflexión y otras estrategias de razonamiento.

Como resultado, el software Marco-o1 de Alibaba es capaz de resolver preguntas abiertas y encontrar consultas para responder “donde no existen criterios claros y donde las recompensas son difíciles de cuantificar”. Sin embargo, debe entenderse que las capacidades de pensamiento avanzado no provinieron de ningún avance en el hardware o la arquitectura.

En cambio, todos los modelos de inferencia actuales utilizan una técnica llamada computación en tiempo de prueba que permite que un modelo de IA dedique más tiempo de procesamiento a una sola consulta. Esto les permite probar diferentes teorías para encontrar la solución y comprobar los hechos por sí mismos. Como resultado, estos modelos están orientados a brindar respuestas más precisas y completar tareas complejas. Un área importante en la que Marco-o1 sobresale, según los investigadores, es la comprensión de los matices de la jerga y la traducción de expresiones coloquiales.

Una limitación del modelo de IA, según los investigadores, es que, si bien Marco-o1 muestra propiedades de inferencia, su “rendimiento sigue siendo inferior al del modelo de inferencia completamente realizado”.

[ad_2]

Source Article Link

Categories
Life Style

Elon Musk ha emitido una orden judicial para evitar que OpenAI se convierta en una empresa con fines de lucro

[ad_1]

Elon Musk pidió al tribunal que impidiera que Sam Altman, Greg Brockman, OpenAI y otros coacusados ​​convirtieran al fabricante de ChatGPT en una corporación. Empresa con fines de lucro.

por TechCrunchMusk presentó un un movimiento El viernes por la noche, en el Tribunal de Distrito de EE. UU. para el Distrito Norte de California, Altman, Brockman, los miembros de la junta directiva y los accionistas de OpenAI acusaron a Microsoft de “violar los términos de las contribuciones fundadoras de Musk a la organización benéfica” y de participar en una conducta anticompetitiva mientras OpenAI busca convertir de una organización sin fines de lucro a una con fines de lucro.

“Los demandantes y el público deben hacer una pausa”, decía el expediente judicial. “El camino de OpenAI de ser una organización sin fines de lucro a un gigante con fines de lucro está plagado de prácticas anticompetitivas en sí mismas, violaciones flagrantes de su misión caritativa y autocontratos desenfrenados”.

Velocidad de la luz triturable

era almizcle Inversor temprano y miembro de la junta directiva de OpenAI, pero cortó los lazos con la compañía en 2018. Más tarde afirmó que Altman y Brockman violaron su acuerdo para mantener su condición de organización sin fines de lucro y desarrollar tecnología de inteligencia artificial de código abierto. El año pasado, Musk presentó una demanda en su nombre. incumplimiento Este contrato, disminuido La demanda, luego se presentó una nueva demanda”.Más poderoso“Una demanda basada en las mismas acusaciones.


Ofertas del Black Friday que puedes comprar ahora

Los productos disponibles para comprar aquí a través de enlaces de afiliados son seleccionados por nuestro equipo de comercialización. Si compra algo a través de los enlaces de nuestro sitio, Mashable puede ganar una comisión de afiliado.


Ahora, Musk busca una orden judicial “para preservar lo que queda del carácter sin fines de lucro de OpenAI, libre de transacciones privadas”, según la moción. “Si no, OpenAI ha prometido a Musk y al público una larga espera hasta que el tribunal llegue al fondo”.

la voluntad de almizcle Acusa a OpenAI de adoptar un comportamiento que merece detener la transformación de la empresa. Las acusaciones incluyen un acuerdo obtenido de inversores de OpenAI para no financiar competidores como xAI de Musk, “acuerdos exclusivos” entre OpenAI y Microsoft para lograr el dominio colectivo del mercado para productos de IA generativa, y la “autonegociación desenfrenada” de Altman a través de contratos de OpenAI entre empresas como Stripe. . Rain AI, Helion Energy y Reddit, donde tiene intereses financieros.

En una declaración a TechCrunch, un portavoz de OpenAI dijo: “El cuarto intento de Elon, que una vez más trae las mismas quejas infundadas, todavía está en curso”. Completamente en vano“.



[ad_2]

Source Article Link

Categories
News

Alibaba lanza el modelo QwQ-32B de IA centrado en la inferencia en versión preliminar para competir con el GPT-o1 de OpenAI

[ad_1]

Alibaba OpenAI lanzó un nuevo modelo de inteligencia artificial (IA) el jueves, que se dice que rivaliza con los modelos de la serie GPT-o1 de OpenAI en capacidad de razonamiento. El modelo de lenguaje grande (LLM) QwQ-32B se lanzó en versión preliminar y se dice que supera a la versión preliminar GPT-o1 en varios puntos de referencia relacionados con la inferencia matemática y lógica. El nuevo modelo de IA está disponible para descargar en Hugging Face, pero no es de código abierto. Recientemente, otra empresa china en el campo de la inteligencia artificial Liberado Un modelo de inteligencia artificial de código abierto DeepSeek-R1, que supuestamente compite con los modelos subyacentes centrados en el pensamiento del fabricante de ChatGPT.

Modelo de IA Alibaba QwQ-32B

en un Publicación de blogAlibaba detalló su nuevo programa LLM centrado en heurística y destacó sus capacidades y limitaciones. El QwQ-32B está actualmente disponible como versión preliminar. Como sugiere el nombre, se basa en 32 mil millones de parámetros y tiene una ventana contextual de 32.000 tokens. El modelo completó las fases de pre-entrenamiento y post-entrenamiento.

En cuanto a su arquitectura, el gigante tecnológico chino reveló que el modelo de IA se basa en la tecnología Transformer. Para la codificación posicional, el QwQ-32B utiliza incrustaciones de posición rotatoria (RoPE), junto con funciones de unidad lineal controlada por transformación (SwiGLU) y normalización cuadrática media (RMSNorm), así como sesgo de consulta de atención y sesgo de valor clave (atención QKV). .

al igual que AbiertoAI GPT-o1, el modelo de IA muestra su monólogo interno al evaluar la consulta del usuario e intentar encontrar la respuesta correcta. Este proceso de pensamiento interno permite al QwQ-32B probar diferentes teorías y verificar hechos antes de proporcionar la respuesta final. Alibaba afirma que el LLM obtuvo una puntuación del 90,6 por ciento en el punto de referencia MATH-500 y del 50 por ciento en el punto de referencia AIME durante las pruebas internas y superó a los modelos OpenAI centrados en la inferencia.

Vale la pena señalar que los modelos de IA con mejor razonamiento no son evidencia de que los modelos se estén volviendo más inteligentes o capaces. Es simplemente una nueva técnica, también conocida como cálculo del tiempo de prueba, que permite a los modelos dedicar tiempo de procesamiento adicional para completar la tarea. Como resultado, la IA puede proporcionar respuestas más precisas y resolver preguntas más complejas. Muchos expertos de la industria han señalado que los programas LLM más nuevos no mejoran al mismo ritmo que las versiones anteriores, lo que sugiere que las arquitecturas actuales están alcanzando un punto de saturación.

Debido a que el QwQ-32B dedica más tiempo a procesar consultas, también tiene varias limitaciones. Alibaba afirmó que el modelo de IA a veces puede mezclar o cambiar de idioma, creando problemas como la mezcla de idiomas y el cambio de código. También tiende a entrar en bucles de razonamiento y, aparte de las habilidades matemáticas y de razonamiento, otras áreas aún necesitan mejoras.

Vale la pena señalar que Alibaba puso a disposición el modelo de inteligencia artificial a través de una cara abrazada. existente Puede ser descargado tanto por individuos como por organizaciones para fines personales, académicos y comerciales bajo la licencia Apache 2.0. Sin embargo, la empresa no ha puesto a disposición los pesos y los datos del modelo, lo que significa que los usuarios no pueden replicar el modelo ni comprender cómo funciona la estructura.

[ad_2]

Source Article Link