Categories
Featured

Hacer frente a los crecientes costos de la inferencia de IA en la era de las aplicaciones a gran escala

[ad_1]

Impulso de la IA Aplicaciones Se está acelerando en todo el mundo y muestra pocas señales de desaceleración. Según datos de IBM, el 42% de las empresas de más de 1.000 empleados lo utilizan activamente Amnistía Internacional En su negocio, hay otro 40% que lo está probando y experimentando con él.

Con el ritmo cada vez mayor de adopción de la inteligencia artificial, con plataformas como Abierto AIGPT-4o y GoogleGemini Al establecer nuevos estándares de rendimiento, las organizaciones están descubriendo nuevas aplicaciones para estas tecnologías que pueden ofrecer mejores resultados. Afronte nuevos desafíos para implementar tecnología a gran escala. Cada vez más flujos de trabajo empresariales incorporan llamadas a estos modelos de IA, lo que aumenta drásticamente su uso. ¿Los casos de uso justifican el aumento del gasto en los últimos modelos?

[ad_2]

Source Article Link

Categories
News

OpenAI lanza la versión completa de su modelo de IA o1 centrado en la inferencia y ofrece una suscripción ChatGPT Pro

[ad_1]

Abierto AI El jueves sacó de la versión preliminar su modelo de inteligencia artificial (IA) o1 y lanzó la versión completa. La compañía de inteligencia artificial afirma que el nuevo modelo ahora puede realizar tareas que la vista previa de o1 no podía. También se dice que es más rápido en tiempos de respuesta y más conciso en su pensamiento. El modelo OpenAI o1 AI estará disponible para todos los suscriptores pagos de ChatGPT. Aparte de esto, la compañía también introdujo una nueva suscripción llamada ChatGPT Pro que brindará un amplio acceso a los mejores modelos y herramientas de OpenAI.

Modelo de IA OpenAI o1, nueva suscripción Pro

Los nuevos anuncios son parte de la campaña '12 días de OpenAI' de la compañía, donde planea realizar 12 transmisiones en vivo en 12 días y brindar nuevas actualizaciones todos los días. El primer día la empresa publicar En

Al destacar las capacidades mejoradas en la versión completa, la compañía afirmó que el o1 genera respuestas más rápido y ofrece un mejor rendimiento en programación, matemáticas y mecanografía. Además, el modelo de IA también puede procesar imágenes cargadas y generar respuestas basadas en ellas. Por ejemplo, los usuarios pueden mostrarle a un chatbot una imagen de una pajarera y pedirle que proporcione una guía paso a paso para crearla.

Durante las pruebas internas, OpenAI descubrió que el modelo o1 reducía errores significativos en preguntas difíciles del mundo real en un 34 por ciento en comparación con la vista previa de o1. El modelo AI reemplaza la vista previa o1 y está disponible para los usuarios de ChatGPT Plus y Team a través de la opción de selección de modelo en el chatbot. Los usuarios empresariales y educativos podrán acceder al modelo dentro de una semana.

De cara a la hoja de ruta futura, la compañía de inteligencia artificial dijo que está trabajando para agregar soporte para navegación web y herramientas de carga de archivos al modelo o1 de ChatGPT. Además, OpenAI también planea hacer que el modelo de lenguaje grande (LLM) esté disponible en la API y agregar soporte para llamadas a funciones, mensajes para desarrolladores, resultados estructurados y visibilidad.

en un Publicación de blogOpenAI también anunció la introducción de la suscripción ChatGPT Pro. La suscripción brindará a los usuarios acceso ilimitado a los modelos más capaces de la compañía, como o1, o1-mini, GPT-4o y Advanced Audio Tool. Además, los usuarios obtendrán un nuevo modo o1 pro, que se describe como una versión mejorada de o1 diseñada para “ofrecer mejores respuestas” a problemas complejos utilizando potencia de procesamiento adicional.

ChatGPT La suscripción Pro tiene un precio de 200 dólares (alrededor de 16.900 rupias) al mes, lo que la hace casi diez veces más cara que la suscripción Plus, que cuesta Rs. 1950 en la India. Al explicar el precio, la compañía dijo que esta suscripción está dirigida a investigadores, ingenieros e individuos que utilizan inteligencia de investigación.

[ad_2]

Source Article Link

Categories
News

Alibaba lanza el modelo QwQ-32B de IA centrado en la inferencia en versión preliminar para competir con el GPT-o1 de OpenAI

[ad_1]

Alibaba OpenAI lanzó un nuevo modelo de inteligencia artificial (IA) el jueves, que se dice que rivaliza con los modelos de la serie GPT-o1 de OpenAI en capacidad de razonamiento. El modelo de lenguaje grande (LLM) QwQ-32B se lanzó en versión preliminar y se dice que supera a la versión preliminar GPT-o1 en varios puntos de referencia relacionados con la inferencia matemática y lógica. El nuevo modelo de IA está disponible para descargar en Hugging Face, pero no es de código abierto. Recientemente, otra empresa china en el campo de la inteligencia artificial Liberado Un modelo de inteligencia artificial de código abierto DeepSeek-R1, que supuestamente compite con los modelos subyacentes centrados en el pensamiento del fabricante de ChatGPT.

Modelo de IA Alibaba QwQ-32B

en un Publicación de blogAlibaba detalló su nuevo programa LLM centrado en heurística y destacó sus capacidades y limitaciones. El QwQ-32B está actualmente disponible como versión preliminar. Como sugiere el nombre, se basa en 32 mil millones de parámetros y tiene una ventana contextual de 32.000 tokens. El modelo completó las fases de pre-entrenamiento y post-entrenamiento.

En cuanto a su arquitectura, el gigante tecnológico chino reveló que el modelo de IA se basa en la tecnología Transformer. Para la codificación posicional, el QwQ-32B utiliza incrustaciones de posición rotatoria (RoPE), junto con funciones de unidad lineal controlada por transformación (SwiGLU) y normalización cuadrática media (RMSNorm), así como sesgo de consulta de atención y sesgo de valor clave (atención QKV). .

al igual que AbiertoAI GPT-o1, el modelo de IA muestra su monólogo interno al evaluar la consulta del usuario e intentar encontrar la respuesta correcta. Este proceso de pensamiento interno permite al QwQ-32B probar diferentes teorías y verificar hechos antes de proporcionar la respuesta final. Alibaba afirma que el LLM obtuvo una puntuación del 90,6 por ciento en el punto de referencia MATH-500 y del 50 por ciento en el punto de referencia AIME durante las pruebas internas y superó a los modelos OpenAI centrados en la inferencia.

Vale la pena señalar que los modelos de IA con mejor razonamiento no son evidencia de que los modelos se estén volviendo más inteligentes o capaces. Es simplemente una nueva técnica, también conocida como cálculo del tiempo de prueba, que permite a los modelos dedicar tiempo de procesamiento adicional para completar la tarea. Como resultado, la IA puede proporcionar respuestas más precisas y resolver preguntas más complejas. Muchos expertos de la industria han señalado que los programas LLM más nuevos no mejoran al mismo ritmo que las versiones anteriores, lo que sugiere que las arquitecturas actuales están alcanzando un punto de saturación.

Debido a que el QwQ-32B dedica más tiempo a procesar consultas, también tiene varias limitaciones. Alibaba afirmó que el modelo de IA a veces puede mezclar o cambiar de idioma, creando problemas como la mezcla de idiomas y el cambio de código. También tiende a entrar en bucles de razonamiento y, aparte de las habilidades matemáticas y de razonamiento, otras áreas aún necesitan mejoras.

Vale la pena señalar que Alibaba puso a disposición el modelo de inteligencia artificial a través de una cara abrazada. existente Puede ser descargado tanto por individuos como por organizaciones para fines personales, académicos y comerciales bajo la licencia Apache 2.0. Sin embargo, la empresa no ha puesto a disposición los pesos y los datos del modelo, lo que significa que los usuarios no pueden replicar el modelo ni comprender cómo funciona la estructura.

[ad_2]

Source Article Link

Categories
News

Google dijo que está trabajando en la inferencia de inteligencia artificial, persiguiendo los esfuerzos de OpenAI

[ad_1]

Google está trabajando en un programa de inteligencia artificial que se asemeja a la capacidad de pensar humana, similar al programa o1 de OpenAI, marcando un nuevo frente en la rivalidad entre el gigante tecnológico y la startup de rápido crecimiento.
En los últimos meses, varios equipos de Google de Alphabet Inc. han logrado avances. avances en software de inteligencia artificial, según personas familiarizadas con el tema, que pidieron permanecer en el anonimato porque la información es privada. Estos programas son más hábiles para resolver problemas de varios pasos en áreas como matemáticas y programación de computadoras.

Los investigadores de IA siguen modelos de inferencia mientras buscan el siguiente paso importante en la tecnología. el ama Abierto AIGoogle está intentando aproximarse al razonamiento humano utilizando una técnica conocida como inducción de cadena de pensamiento, según dos de las personas. En esta técnica, inventada por Google, el programa se detiene durante unos segundos antes de responder a un mensaje escrito mientras, detrás de escena e invisible para el usuario, considera una serie de mensajes relevantes y luego resume lo que parece ser la mejor respuesta.

Google Se negó a comentar sobre los esfuerzos.

Google y OpenAI han estado enfrascados en una intensa batalla por el dominio en el espacio de la IA, especialmente desde el lanzamiento de OpenAI. ChatGPTun popular chatbot que a algunos inversores les preocupa que eventualmente elimine la necesidad de realizar una búsqueda en Google. Google ha tomado varias medidas para recuperar su liderazgo, incluida la fusión de sus principales laboratorios de investigación para formar Leading Research Lab. Google DeepMind Unidad y fortalecimiento de las relaciones entre investigadores y equipos de producto. Sin embargo, el gigante de las búsquedas continúa moviéndose más lentamente cuando se trata de lanzar productos de IA, deteniéndose para considerar cuestiones éticas, la necesidad de estar a la altura de las expectativas públicas de confianza en su marca y los intereses en competencia de múltiples esfuerzos similares en la enorme organización. . .

Desde que OpenAI presentó su modelo o1, conocido internamente como Strawberry, a mediados de septiembre, a algunos en DeepMind les preocupa que la compañía se haya quedado atrás, según otra persona familiarizada con el asunto. Pero los empleados ya no están tan ansiosos como después del lanzamiento de ChatGPT, ahora que Google ha presentado parte de su trabajo, dijo la persona.

Aunque el ritmo de lanzamiento de productos de Google se ha desacelerado, sigue siendo un actor importante, dijo Oren Etzioni, un veterano investigador de inteligencia artificial que fundó TrueMedia.org, una organización sin fines de lucro dedicada a combatir la desinformación política.

“Técnicamente, las capacidades de Google siempre han estado al más alto nivel. Han sido más conservadores a la hora de implementar las cosas”, dijo Etzioni. “Es un maratón y la carrera es una victoria para cualquiera”.

En julio, Google mostró AlphaProof, que se especializa en razonamiento matemático, y AlphaGeometry 2, una versión actualizada del modelo centrado en la geometría que la compañía presentó a principios de este año. Google dijo en una publicación en su blog que los programas tuvieron éxito en cuatro de los seis problemas que aparecieron en la Olimpiada Internacional de Matemáticas, una competencia anual en la que los estudiantes abordan temas como álgebra y geometría.

En su conferencia de desarrolladores en mayo, Google mostró un vistazo de su asistente de inteligencia artificial, Astra, que puede usar la cámara del teléfono para ver el mundo que lo rodea y responder preguntas, como decirle al usuario dónde dejó sus gafas. Google dijo que algunas funciones del Asistente podrían llegar a su modelo insignia de IA, Gemini, a finales de este año.

“El razonamiento matemático avanzado es una capacidad crítica para la inteligencia artificial moderna”, escribió Demis Hassabis, director ejecutivo de Google DeepMind, en una publicación en la red social X en julio.

© 2024 Bloomberg LP

(Esta historia no ha sido editada por el personal de NDTV y se genera automáticamente a partir de un feed sindicado).

[ad_2]

Source Article Link

Categories
News

Se dice que OpenAI está trabajando en una nueva tecnología de inferencia con el nombre en clave “Strawberry”.

[ad_1]

chat gbt fabricante Abierto AI Facebook está trabajando en un nuevo enfoque para los modelos de inteligencia artificial en un proyecto con el nombre en código “Strawberry”, según una persona familiarizada con el asunto y documentos internos revisados ​​por Reuters.

Este proyecto, cuyos detalles no se informaron anteriormente, llega en un momento en el que… Desarrollado por Microsoft Las startups están compitiendo para demostrar que los tipos de modelos que ofrecen son capaces de ofrecer capacidades de pensamiento avanzadas.

Los equipos de OpenAI están trabajando en el desarrollo de Strawberry, según una copia de un documento interno reciente de OpenAI visto por Reuters en mayo. Reuters no pudo determinar la fecha exacta del documento, que detalla un plan sobre cómo OpenAI utilizará Strawberry para realizar investigaciones. La fuente describió el plan a Reuters como un trabajo en progreso. La agencia de noticias no pudo determinar qué tan cerca estaba Strawberry de estar disponible para el público.

El funcionamiento de Strawberry es un secreto muy bien guardado incluso dentro de OpenAI, afirmó esta persona.

El documento describe un proyecto que utiliza los modelos de Strawberry con el objetivo de permitir que la IA de la compañía no solo genere respuestas a consultas sino también planifique con suficiente antelación para navegar por Internet de forma autónoma y confiable para realizar lo que OpenAI llama “búsqueda profunda”, según el fuente.

Esto es algo que hasta ahora ha eludido los modelos de IA, según entrevistas con más de una docena de investigadores de IA.

Cuando se le preguntó sobre Strawberry y los detalles mencionados en esta historia, un portavoz de OpenAI dijo en un comunicado: “Queremos que nuestros modelos de IA puedan ver y comprender el mundo mejor como lo hacemos nosotros. Continuar la investigación sobre nuevas capacidades de IA es una práctica común en Estados Unidos. “Con la creencia compartida de que estos sistemas mejorarán su capacidad de pensar con el tiempo”.

El portavoz no respondió directamente a las preguntas sobre Strawberry.

El proyecto Strawberry se conocía anteriormente como Q* y, según informó Reuters el año pasado, la empresa ya lo consideraba un gran avance.

Dos fuentes describieron su visión a principios de este año de lo que los empleados de OpenAI les dijeron que eran demostraciones de Q*, capaces de responder preguntas científicas y matemáticas difíciles más allá del alcance de los modelos disponibles comercialmente en la actualidad.

En una reunión interna el martes, OpenAI hizo una demostración de un proyecto de investigación que, según afirmaba, tenía nuevas habilidades de pensamiento similares al razonamiento humano, según Bloomberg. Un portavoz de OpenAI confirmó la reunión pero se negó a proporcionar detalles sobre el contenido. Reuters no pudo determinar si el proyecto presentado era Strawberry.

OpenAI espera que la innovación mejore significativamente las capacidades de razonamiento de sus modelos de IA, dijo la persona familiarizada con el tema, y ​​agregó que Strawberry implica una forma especializada de procesar el modelo de IA después de entrenarlo previamente en conjuntos de datos muy grandes.

Los investigadores entrevistados por Reuters dicen que el pensamiento es clave para permitir que la IA alcance un nivel de inteligencia humano o sobrenatural.

Si bien los grandes modelos de lenguaje ya pueden resumir textos densos y componer prosa elegante mucho más rápidamente que cualquier ser humano, la tecnología a menudo no logra resolver problemas que requieren sentido común y cuyas soluciones parecen intuitivas para las personas, como reconocer falacias lógicas y jugar al tres en raya. . Cuando un modelo encuentra tales problemas, a menudo “alucina” información falsa.

Los investigadores de IA entrevistados por Reuters generalmente coinciden en que el razonamiento, en el contexto de la IA, implica formar un modelo que le permita planificar el futuro, reflejar cómo funciona el mundo físico y resolver problemas difíciles de varios pasos de manera confiable.

Mejorar el pensamiento de los modelos de IA se considera la clave para desbloquear la capacidad de los modelos para hacer de todo, desde realizar importantes descubrimientos científicos hasta planificar y crear nuevas aplicaciones de software.

CEO de OpenAI Sam Altman “Las áreas más importantes de progreso en inteligencia artificial estarán relacionadas con la capacidad de pensar”, dijo a principios de este año.

Otras empresas como GoogleMeta y Microsoft también están experimentando con diferentes técnicas para mejorar el pensamiento en modelos de IA, al igual que la mayoría de los laboratorios académicos que realizan investigaciones sobre IA. Sin embargo, los investigadores no están de acuerdo sobre si los grandes modelos lingüísticos son capaces de incorporar conocimientos y planificación a largo plazo en la forma en que hacen predicciones. Por ejemplo, uno de los pioneros de la inteligencia artificial moderna, Yan Le Qun, que trabaja en muertoHa dicho repetidamente que los titulares de un LLM son incapaces de pensar como los humanos.

Desafíos de la inteligencia artificial

La fuente familiarizada con el asunto dijo que Strawberry es un componente clave del plan de OpenAI para superar estos desafíos. El documento visto por Reuters describía lo que Strawberry pretendía habilitar, pero no explicaba cómo.

En los últimos meses, la compañía ha señalado en privado a los desarrolladores y otros terceros que está a punto de lanzar tecnología con capacidades de pensamiento dramáticamente más avanzadas, según cuatro personas que escucharon las presentaciones de la compañía. Se negaron a revelar sus identidades porque no están autorizados a hablar de asuntos privados.

Strawberry incluye un método especializado para lo que se conoce como “post-entrenamiento” para los modelos de IA generativa de OpenAI, o adaptación de los modelos subyacentes para perfeccionar su rendimiento de maneras específicas después de que ya hayan sido “entrenados” en grandes cantidades de datos generalizados, según una fuente.

La fase posterior al entrenamiento del desarrollo del modelo incluye métodos como el “ajuste fino”, un proceso utilizado en casi todos los modelos de lenguaje actuales y que se presenta de muchas formas, como hacer que los humanos brinden retroalimentación al modelo en función de sus respuestas y alimentándolo. Ejemplos de buenas y malas respuestas.

Una fuente familiarizada con el asunto dijo que Strawberry es similar a un método desarrollado en Stanford en 2022 llamado “razonamiento autoexplicativo” o “STaR”. Uno de los creadores de STaR, el profesor de la Universidad de Stanford, Noah Goodman, dijo a Reuters que STaR permite a los modelos de IA “elevarse” a niveles de inteligencia más altos generando repetidamente sus propios datos de entrenamiento y, en teoría, podría usarse para crear modelos de lenguaje más allá de la inteligencia humana.

“Creo que es emocionante y aterrador al mismo tiempo… Si las cosas continúan en esta dirección, tenemos algunas cosas serias en las que pensar como seres humanos”, dijo Goodman. Goodman no está afiliado a OpenAI y no conoce Strawberry.

Entre las capacidades que OpenAI apunta a Strawberry está la de realizar tareas a largo plazo (LHT), dice el documento, refiriéndose a tareas complejas que requieren de un modelo para planificar con anticipación y ejecutar una serie de acciones durante un período prolongado de tiempo, la primera explicó la fuente.

Con ese fin, OpenAI está construyendo, entrenando y evaluando modelos en lo que la compañía llama un conjunto de datos de “investigación profunda”, según los documentos internos de OpenAI. Reuters no pudo determinar el contenido de este conjunto de datos ni lo que podría significar un período prolongado.

Específicamente, OpenAI quiere que sus modelos utilicen estas capacidades para realizar investigaciones navegando de forma autónoma por la web con la ayuda de un “CUA”, o agente que utiliza una computadora, que puede tomar medidas en función de sus hallazgos, según el documento y uno de los fuentes. OpenAI también planea probar sus capacidades para realizar el trabajo de ingenieros de software y aprendizaje automático.

© Thomson Reuters 2024

[ad_2]

Source Article Link