La IA DeepSeek de China puede ser más inteligente que la IA más inteligente de OpenAI

[ad_1]

hay algo nuevo Amnistía Internacional Hay un jugador en la ciudad y es posible que quieras prestarle atención.

El lunes, la empresa china de inteligencia artificial profundamente enfermo DeepSeek R1 ha lanzado un nuevo modelo de código abierto para un lenguaje a gran escala.

Según DeepSeek, R1 supera a otros LLM (modelos de lenguajes grandes) populares, por ejemplo Abierto AI en varios Criterios importantesy el es Especialmente bueno Con tareas matemáticas, de codificación y de pensamiento.

Es posible que el tweet haya sido eliminado.

DeepSeek R1 es en realidad una mejora de DeepSeek R1 Zero, un LLM formado sin un método utilizado tradicionalmente llamado ajuste fino supervisado. Esto lo hacía muy capaz de realizar ciertas tareas, pero como dijo el propio DeepSeek, el Zero era “legible y ciego al lenguaje”. Ingrese a R1, que soluciona estos problemas incorporando “entrenamiento en múltiples etapas y datos de arranque en frío” antes de entrenarlo con aprendizaje por refuerzo.

Velocidad de la luz triturable

Dejando a un lado el lenguaje técnico vago (los detalles son… conectado Si está interesado), hay varias cosas clave que debe saber sobre DeepSeek R1. En primer lugar, es de código abierto, lo que significa que está examinado por expertos, lo que debería aliviar las preocupaciones sobre la privacidad y la seguridad. En segundo lugar, su uso como aplicación web es gratuito, mientras que el acceso API está disponible. muy barato ($0,14 por millón de tokens de entrada, en comparación con Abierto AI $7,5 por su modelo de razonamiento más poderoso, o1).

Ver también:

OpenAI podría lanzar pronto un lanzador de herramientas proxy de IA

Lo más importante es que esta cosa es muy, muy capaz. Para probarlo, lo lancé inmediatamente a aguas profundas y le pedí que codificara una aplicación web bastante compleja que necesitaba analizar datos disponibles públicamente y crear un sitio web dinámico que contuviera información meteorológica y de viajes para turistas. Sorprendentemente, DeepSeek produjo un código HTML bastante aceptable de inmediato y pudo mejorar aún más el sitio basándose en mis comentarios mientras refinaba y optimizaba el código por sí solo a lo largo del camino.

Inteligencia artificial de búsqueda profunda

Lo haré todo… mañana.
Crédito: Stan Schroeder/Mashable/DeepSeek

También le pedí que mejorara mis habilidades de ajedrez en cinco minutos, y respondió con una serie de consejos muy útiles y cuidadosamente seleccionados (mis habilidades de ajedrez mejoraron, pero sólo porque era demasiado vago para seguir las sugerencias de DeepSeek). .

Luego le pedí a DeepSeek que demostrara lo inteligente que es en exactamente tres oraciones. Mal movimiento de mi parte, porque yo, humano, no soy lo suficientemente inteligente como para verificar o incluso comprender completamente ninguna de las tres frases. Tenga en cuenta que en la captura de pantalla siguiente puede ver el “proceso de pensamiento” de DeepSeek mientras descubre la respuesta, que probablemente sea incluso más fascinante que la respuesta misma.

Lo entendemos, eres inteligente.
Crédito: Stan Schroeder/Mashable/DeepSeek

Es impresionante de usar. Pero como ZDnet tomó notaDetrás de todo esto hay costos de capacitación que son un orden de magnitud más bajos que los de algunos modelos de la competencia, así como chips que no son tan poderosos como los disponibles para las empresas estadounidenses de inteligencia artificial. DeepSeek demuestra así que una IA altamente inteligente con capacidad de razonar no tiene por qué ser muy costosa de entrenar o utilizar.

Temas
inteligencia artificial

[ad_2]

Source Article Link

By lisa nichols

Leave a Reply Cancel reply