Tag: LLM

Este exótico NAS de 8 unidades afirma tener un LLM integrado y no puedo esperar a que salga a la venta

Post author By lisa nichols
Post date January 14, 2025
No Comments on Este exótico NAS de 8 unidades afirma tener un LLM integrado y no puedo esperar a que salga a la venta

[ad_1]

La marca Challenger Ugreen dice que su último NAS insignia tiene un LLM integrado
Está equipado con Intel Core Ultra 5 y admite hasta ocho unidades.
Me gusta el hecho de que tiene LAN dual GbE e incluso un puerto OCuLink

motor 8 gente ¿Con el modelo integrado de lenguaje grande (LLM)? Cuenta conmigo.

Salón de electrónica de consumo 2025 Hemos visto una gran cantidad de anuncios de hardware interesantes a lo largo de la semana, pero los nuevos modelos UGREEN NASync iDX6011 e iDX6011 Pro se encuentran sin duda entre los mejores y más brillantes.

Beneficio Inteligencia artificial generativalos usuarios pueden interactuar con los dispositivos NAS en lenguaje natural, lo que les permite hacer preguntas relacionadas con información de bases de datos o incluso resumir documentos y automatizar tareas.

Debajo del capó está la serie NASync iDX6011

Aunque en este momento no somos ajenos a las capacidades de IA generativa y las indicaciones del lenguaje natural, esto representa un cambio gradual en la forma en que los usuarios interactúan con ellos. Almacenamiento conectado a la red Dispositivos.

Los beneficios de productividad por sí solos aquí son impresionantes. Al incorporar capacidades de inteligencia artificial, Ugreen tiene la capacidad de reducir significativamente el estrés de las tareas manuales y optimizar el flujo de trabajo diario al eliminar la necesidad de que los usuarios busquen información o conjuntos de datos importantes.

Ugreen desea enfatizar que esta nueva serie marca el lanzamiento del “primer NAS impulsado por IA” del mundo con certificaciones LLM integradas: así es como se comparan.

La serie NASync iDX6011 aprovecha el apalancamiento Procesadores Intel Core Ultra 5 Con un chip de 14 núcleos y 18 hilos capaz de alcanzar velocidades de hasta 4,5 GHz, lo que la convierte en una línea potente desde el principio y capaz de manejar tareas intensivas. Amnistía Internacional Cargas de trabajo.

Cabe señalar que NASync iDX6011 está equipado con Intel Procesador Core Ultra 5 125H. Sin embargo, el 6011 Pro cuenta con el último procesador Intel Core Ultra, según Ugreen.

La capacidad de almacenamiento es, por supuesto, otro punto clave de la serie iDX.

Análisis de nascomaris Antes del CES, noté que los dispositivos se destacan en este sentido, con una capacidad de almacenamiento total de 160 TB, respaldada por seis ranuras SATA y dos ranuras M.2 NVMe.

Imagen promocional de Ugreen NASync iDX6011 Smart Search que muestra respuestas rápidas en lenguaje natural.

(Crédito de la imagen: UGREEN)

Esto lo hace ideal para usuarios que manejan grandes conjuntos de datos o bibliotecas multimedia.

En otros lugares, los dispositivos NAS también cuentan con puertos de red duales de 10 Gb3, lo que ayuda a mejorar el rendimiento y puede ofrecer velocidades de transferencia de datos de hasta 2500 MB/s.

Un gran atractivo para los usuarios aquí será el hecho de que ofrece capacidades de redundancia para garantizar que el acceso y las transferencias de datos no se interrumpan en caso de una falla en la conexión.

La serie IDX también aprovecha la nube personal de Ugreen Sistema operativo, Yugos Proproporcionando a los usuarios una interfaz segura y fácil de usar.

El NASync iDX6011 Pro lleva las cosas a un nivel superior

Para los usuarios que buscan algo más potente, el iDX6011 Pro es la elección perfecta en este caso.

Esto viene completo con OCuEnlace puerto, proporcionando a los usuarios conectividad de alta velocidad y capacidades de transferencia de datos.

integración iluminación El peering significa que los usuarios pueden conectarse directamente entre el NAS y los dispositivos de almacenamiento externos con menor latencia y mayor rendimiento.

Finalmente, esto proporciona a los usuarios una capacidad de ancho de banda de hasta 64 Gbps. Esto también ofrece una gama más amplia de accesorios compatibles en comparación con el iDX6011 básico, como SSD externos o posibles aceleradores.

También te puede gustar

[ad_2]

Source Article Link

Tags afirma, esperar, este, exótico, integrado, LLM, NAS, puedo, salga, tener, unidades, venta

News

Hugging Face ofrece la biblioteca Smolagents para crear agentes de IA utilizando LLM de código abierto

Post author By miranda cosgrove
Post date January 4, 2025
No Comments on Hugging Face ofrece la biblioteca Smolagents para crear agentes de IA utilizando LLM de código abierto

[ad_1]

abrazo de cara La semana pasada presentó una nueva biblioteca de códigos para permitir a los desarrolladores crear fácilmente agentes de inteligencia artificial (IA). La herramienta, llamada smolagents, define la lógica subyacente de agentes de IA simples y de propósito general que pueden realizar acciones implementándolas en código. Smolagent se puede vincular a cualquier modelo de lenguaje grande (LLM) de código abierto o a un número selecto de LLM basados en la nube. Los desarrolladores también pueden crear herramientas para conectar la parte de salida externa del agente. Estas herramientas también se pueden compartir en la plataforma para permitir que otros desarrolladores accedan a ellas y las utilicen.

Hugging Face ofrece una biblioteca de Smolagents para agentes de IA

en un Publicación de blogLa plataforma de inteligencia artificial y aprendizaje automático (ML) anunció la nueva herramienta que tiene como objetivo facilitar a los desarrolladores el uso de las capacidades de los agentes. La biblioteca viene con aproximadamente 1000 líneas de código que definen la funcionalidad básica del agente de IA. Los desarrolladores pueden adjuntarlo al LLM y a cualquier herramienta externa de recopilación de datos o ejecución de acciones. Al centrarse únicamente en estos dos elementos, la plataforma afirma que a los desarrolladores les resultará más fácil crear nuevos agentes y utilizarlos en sus proyectos y aplicaciones.

Los Smolagents están diseñados teniendo en cuenta factores simples. Esto significa que pueden realizar cualquier tarea, pero probablemente no sean adecuados para trabajos de varios pasos o de múltiples agentes. Hugging Face declaró que puede escribir acciones en código (como ejecutar acciones) pero no puede usarse para escribir dicho código. La plataforma también permite a los desarrolladores implementar tengo un agente En ambientes aislados vía E2B para probar confiabilidad y modificar salidas.

La biblioteca del agente también admite el estándar ToolCallingAgent que escribe acciones en JSON o manchas de texto. Además, una vez que un desarrollador crea una herramienta de agente, también puede compartirla con la comunidad. Los usuarios pueden elegir cualquier modelo abierto alojado en la plataforma a través de la interfaz de programación de aplicaciones (API) de inferencia gratuita o elegir entre una lista de más de 100 modelos diferentes basados en la nube.

Cuando navega a la herramienta, Hugging Face recomienda crear una función que contenga sugerencias para escribir en las entradas y salidas, así como descripciones de las entradas. Al resaltar el caso de uso, la plataforma mostró un código para un agente de inteligencia artificial que puede obtener tiempos de viaje de Google Maps y planificar rutas de viaje para los usuarios.

Para lo último Noticias de tecnología y ReseñasSiga Gadgets 360 en incógnita, Facebook, WhatsApp, Temas y noticias de google. Para ver los últimos vídeos sobre gadgets y tecnología, suscríbete a nuestro canal. canal de youtube. Si quieres saber todo sobre los top influencers, sigue nuestra web ¿Quién es ese 360? en Instagram y YouTube.

La fecha de lanzamiento de la serie Oppo Reno 13 5G en India está fijada para el 9 de enero; Configuraciones de RAM y almacenamiento reveladas

KuCoin lanza una nueva función de pago que permite pagos similares a UPI mediante códigos QR

[ad_2]

Source Article Link

Tags Abierto, agentes, biblioteca, código, crear, Face, Hugging, LLM, ofrece, para, Smolagents, utilizando

Categories
Bisnis Industri

iOS 19 podría presentar un LLM Siri más conversacional

Post author By miranda cosgrove

Post date November 22, 2024

No Comments on iOS 19 podría presentar un LLM Siri más conversacional

[ad_1]

Es posible que llegue una Siri más habladora como parte de iOS 19 el próximo año.
Foto: Cult Mac/Nadezhda Moriak

Apple planea mejorar aún más Siri con iOS 19 en 2025 con modelos avanzados de lenguaje grande (LLM) de próxima generación.

Gracias al nuevo software LLM que impulsa a Siri, el asistente de voz debería volverse más conversacional.

Siri podría mejorar en iOS 19

Apple ha introducido importantes actualizaciones para Siri con iOS 18 Este año, incluye un nuevo y elegante diseño. con inteligencia de manzanaEl asistente de voz se volvió más inteligente.

Mayor actualización para Siri llegará con iOS 18.4 el próximo añopermitiéndole utilizar el asistente de voz para controlar aplicaciones. El gigante de Cupertino depende en gran medida de la inteligencia artificial para mejorar y potenciar la experiencia Siri. Pero eso no es todo, ya que Apple está planeando una actualización mayor a Siri con iOS 19 en 2025.

Bloomberg Los informes sugieren que Apple está desarrollando un Siri “más conversacional” impulsado por modelos de lenguaje avanzados de gran tamaño. Esto permitirá conversaciones naturales, como se ve en Gemini Live y el modo de voz de ChatGPT. Según se informa, los empleados de Apple se refieren internamente a la función como “LLM Siri”. Pasará a formar parte de Apple Intelligence en el momento del lanzamiento.

“La próxima generación de LLM planificada para iOS 19 será un nuevo sistema todo en uno que ofrecerá capacidades más avanzadas similares a ChatGPT”, dice el informe.

Apple está contratando ingenieros para trabajar en la creación de asistentes inteligentes

En los últimos meses, Apple ha publicado varias ofertas de trabajo para contratar a las personas adecuadas para el puesto.

Una lista dice: “Te unirás a un equipo que está redefiniendo la informática, creando tecnologías innovadoras de asistentes conversacionales tanto para sistemas a gran escala como para nuevos dispositivos de clientes, y con las personas que crean asistentes inteligentes”.

Aunque Apple está probando Siri conversacional para iOS 19, no se lanzará cuando se lance el sistema operativo en septiembre de 2025. En cambio, parece que no debutará hasta la primavera de 2026. Dado que la función aún está en desarrollo, es posible que Apple Los planes cambian y los planes de Apple pueden cambiar. Es posible que se inicien más conversaciones de Siri como parte del propio iOS 19.

[ad_2]

Source Article Link

Tags conversacional, iOS, LLM, más, podría, presentar, Siri

Categories
Business Industry

Samsung presenta Bixby de próxima generación impulsado por LLM

Post author By miranda cosgrove

Post date November 6, 2024

No Comments on Samsung presenta Bixby de próxima generación impulsado por LLM

[ad_1]

Hoy temprano, Samsung quitar el velo Dos nuevos teléfonos plegables (W25 y W25 Flip) para China. Comparten muchas características de hardware con Edición especial Galaxy Z Fold y Galaxy Z Flip 6. Sin embargo, tienen un nuevo truco de software que actualmente falta en los teléfonos Galaxy de todo el mundo: Bixby de próxima generación.

La nueva versión de Bixby puede entender fácilmente el lenguaje natural

La nueva versión de bixbyque apareció por primera vez en W25 y W25 Flip, es compatible con Large Language Models (LLM). Por lo tanto, es mucho mejor para comprender el lenguaje natural y el contexto. Puede comprender oraciones que contienen múltiples comandos. Samsung proporcionó algunos ejemplos de cómo el nuevo Bixby mejora la versión actual.

Esta versión de Bixby es ya disponible En algunos dispositivos Samsung nuevos y avanzados.

Si dices “Afuera está nublado. ¿Qué debo ponerme para ir a trabajar hoy?Bixby te dirá el pronóstico del tiempo y te pedirá que uses un impermeable de camino al trabajo debido a la posibilidad de lluvia. Entonces si preguntas:¿Cuanto tiempo me tomará llegar?Bixby entenderá que estás hablando de viajar a tu lugar de trabajo y te mostrará direcciones y tiempo estimado de llegada según las condiciones del tráfico.

Bixby también puede proporcionar procedimientos detallados paso a paso para realizar tareas en su teléfono Galaxy. Por ejemplo, si preguntas cómo agregar una marca de agua a las fotos tomadas con la cámara, Bixby te explicará la función de la cámara de una manera fácil de entender.

Puede obtener información de aplicaciones telefónicas y comprender el contexto. Entonces, cuando preguntes cuándo es tu función familiar, buscará en la aplicación de calendario y te traerá la entrada relevante con el nombre de la función, fecha, hora y ubicación.

La nueva versión de Bixby también puede comprender lo que hay en la pantalla y brindar asistencia contextual. Por ejemplo, cuando estás chateando con un amigo y te pide que te encuentres con él en un lugar determinado, puedes iniciar Bixby y pedirle que “Ve aquí.Bixby buscará en la pantalla información de ubicación y luego usará la aplicación Mapas para comenzar a navegar.

El nuevo Bixby tiene un diseño de interfaz de usuario moderno

Por lo que aparece en las imágenes, la nueva versión de Bixby tiene un nuevo diseño para la interfaz de usuario que ocupa toda la pantalla, y puedes hablar con él mediante texto o voz. Algunos comandos se sugieren en la parte superior. Puede utilizar estos comandos o escribir los suyos propios. También cuenta con animaciones multicolores, similares a Gemini y la nueva Siri.

También puedes llamarlo desde cualquier lugar del teléfono. Por ejemplo, puedes llamarlo durante una conversación con tu amigo y preguntarle sobre las cosas que aparecen en la pantalla. También puedes llamarlo mientras navegas por la web y pedirle que convierta la página web a tu idioma. También puede crear documentos (documento, presentación u hoja de cálculo) según sus requisitos.

¿Cuándo podrás usar la nueva versión de Bixby?

Por ahora, la nueva versión de Bixby solo está disponible en W25 y W25 Flip en China. Es posible que pronto se extienda a otros teléfonos.

Aunque la nueva versión de Bixby aún no está disponible a nivel mundial, Samsung podría lanzarla en todo el mundo (según el soporte de idiomas) con One UI 7.0 a principios del próximo año.

[ad_2]

Source Article Link

Tags Bixby, generación, impulsado, LLM, por, presenta, próxima, Samsung

Categories
Featured

Otra startup quiere descifrar el código LLM pero esta vez usando luz; La empresa líder en óptica Oriole Networks quiere que los estudiantes de LLM se capaciten 100 veces más rápido y con una fracción de energía

Post author By lisa nichols

Post date October 27, 2024

No Comments on Otra startup quiere descifrar el código LLM pero esta vez usando luz; La empresa líder en óptica Oriole Networks quiere que los estudiantes de LLM se capaciten 100 veces más rápido y con una fracción de energía

[ad_1]

Hace dos años, inicié la startup israelí CogniFiber. Ella apareció en los titulares con DeeplightSe trata de un cable de fibra óptica que puede “procesar algoritmos complejos dentro de la propia fibra antes de que la señal llegue a la estación”. En su momento, advertimos que esta tecnología no llegaría a los usuarios finales en un futuro próximo y que era poco probable que apareciera en portátiles o teléfonos inteligentes en un futuro próximo.

pero, eeNews incrustado Ahora informa sobre Oriole Networks, una startup con sede en el Reino Unido que utiliza la luz para un propósito diferente: crear redes eficientes de chips de inteligencia artificial.

Se dice que esta tecnología puede entrenar LLM hasta 100 veces más rápido que los métodos tradicionales y al mismo tiempo reducir significativamente el uso de energía. Esta investigación tiene como objetivo mitigar el creciente consumo de energía de los centros de datos impulsado por la rápida expansión de las cargas de trabajo de IA y la creciente demanda de alta potencia. -computación de rendimiento. .

20 años de investigación en fotónica

“Nuestra ambición es crear un ecosistema de redes ópticas que pueda remodelar la industria resolviendo los cuellos de botella existentes y permitiendo una mayor competencia en la capa de GPU, basándose en décadas de investigación, estamos allanando el camino para una IA más rápida y eficiente”, dijo James. Regan, director ejecutivo de Oriole Networks. Eficiente y más sostenible”.

Las raíces de la empresa se encuentran en la investigación de redes ópticas realizada por el University College London (UCL) y la propiedad intelectual única de Oriole se basa en el trabajo de los científicos fundadores, el profesor George Zervas, Alessandro Otieno y Joshua Benjamin.

La startup ya ha atraído la atención de varios inversores interesados en encontrar soluciones a las crecientes necesidades energéticas de la inteligencia artificial.

Con planes de lanzar sus productos en etapa inicial para 2025, Oriole Networks espera remodelar la infraestructura de IA haciéndola más rápida, más eficiente energéticamente y, en última instancia, más sostenible.

Suscríbase al boletín informativo TechRadar Pro para recibir las principales noticias, opiniones, características y orientación que su empresa necesita para tener éxito.

eeNews incrustado “La aplicación de 20 años de profunda investigación y aprendizaje en fotónica para crear una mejor infraestructura de IA demuestra cuánta innovación puede ayudar a cosechar los beneficios”, cita Ian Hogarth, miembro de la junta directiva de Oriole y socio de Plural que dirigió la última ronda de financiación. tecnología.

“El equipo detrás de Oriole Networks ha demostrado su experiencia tanto en la construcción de la empresa como en la introducción de ciencia profunda en el mercado, creando un cambio fundamental en el diseño de sistemas de red de próxima generación que reducirán la latencia y el impacto energético de los centros de datos que ahora tenemos. depender.”

Más de TechRadar Pro

[ad_2]

Source Article Link

Tags capaciten, código, Con, descifrar, empresa, energía, está, estudiantes, fracción, líder, LLM, Los, luz, más, Networks, óptica, Oriole, otra, pero, quiere, rápido, Startup, una, usando, veces, vez

Categories
Featured

¿Se convertirán los LLM en los mediadores definitivos, para bien o para mal? Los investigadores de DeepMind y los usuarios de Reddit parecen estar de acuerdo

Post author By lisa nichols

Post date October 23, 2024

No Comments on ¿Se convertirán los LLM en los mediadores definitivos, para bien o para mal? Los investigadores de DeepMind y los usuarios de Reddit parecen estar de acuerdo

[ad_1]

Los expertos en inteligencia artificial creen que los modelos de lenguajes grandes (LLM) pueden servir como intermediarios en ciertos escenarios donde no se pueden llegar a acuerdos entre individuos.

Un estudio reciente realizado por investigadores de Google DeepMind buscó explorar el uso potencial del MBA en este sentido, particularmente en relación con la resolución de disputas controvertidas en medio del clima político polémico a nivel mundial.

“A menudo resulta difícil llegar a acuerdos mediante el libre intercambio de opiniones”. Los autores del estudio señalaron. “La deliberación colectiva puede ser lenta, difícil de escalar y preocupada de manera desigual por las diferentes voces”.

ganando el grupo

Como parte del proyecto, el equipo de DeepMind capacitó a una serie de titulares de un LLM llamados “Habermas Machines” (HM) para que actuaran como mediadores. Estos modelos han sido entrenados específicamente para identificar creencias compartidas y superpuestas entre individuos en ambos extremos del espectro político.

Los temas cubiertos por el LLM incluyeron cuestiones polémicas como la inmigración, el Brexit, el salario mínimo, el cuidado infantil universal y el cambio climático.

“Utilizando las opiniones y críticas personales de los participantes, el moderador de IA genera y refina de forma iterativa declaraciones que expresan puntos en común del grupo sobre cuestiones sociales o políticas”, escribieron los autores.

En el proyecto también participaron voluntarios que interactuaron con el modelo, que se basaba en las opiniones y puntos de vista de cada individuo sobre temas políticos específicos.

Suscríbase al boletín TechRadar Pro para recibir las principales noticias, opiniones, características y orientación que su empresa necesita para tener éxito.

Luego, el modelo recopiló breves documentos de opiniones políticas voluntarias, lo que proporcionó un contexto adicional para ayudar a cerrar las divisiones.

Los resultados fueron muy prometedores, ya que el estudio reveló que los voluntarios valoraron más las declaraciones de Su Majestad que las declaraciones humanas sobre los mismos temas.

Además, después de dividir a los voluntarios en grupos para discutir más a fondo estos temas, los investigadores descubrieron que los participantes estaban menos divididos sobre estos temas después de leer las declaraciones de HM en comparación con los documentos de moderadores humanos.

Los investigadores concluyeron que “las declaraciones de opinión grupal generadas por la máquina de Habermas fueron consistentemente preferidas por los miembros del grupo sobre las escritas por moderadores humanos y recibieron calificaciones más altas de jueces externos en términos de calidad, claridad, informatividad y equidad percibida”.

“La deliberación mediada por IA también redujo la división dentro de los grupos, ya que las posiciones informadas por los participantes convergieron hacia una posición común sobre el tema después de la deliberación; este resultado no ocurrió cuando los participantes intercambiaron puntos de vista directamente, sin mediación”.

El estudio señaló que el “apoyo a la posición mayoritaria” sobre ciertos temas aumentó después de deliberaciones apoyadas por AI. Sin embargo, Sus Majestades “incluyeron explícitamente críticas de las minorías en las declaraciones revisadas”.

Lo que esto sugiere es que durante las deliberaciones mediadas por la IA, “las opiniones de los grupos de participantes tienden a moverse en una dirección similar sobre temas controvertidos”, dijeron los investigadores.

“Estos cambios no fueron atribuibles a sesgos en la IA, lo que sugiere que el proceso de deliberación realmente ayudó a surgir puntos de vista compartidos sobre posibles cuestiones sociales y políticas”.

Ya existen ejemplos de la vida real del uso de LLM para resolver conflictos, especialmente en las relaciones, con Algunos usuarios en Reddit Después de informar el uso ChatGPTPor ejemplo.

Un usuario informó que su pareja usaba chatbot “Cada vez” no están de acuerdo y eso genera fricciones.

“Yo (25) y mi novia (28) hemos estado saliendo durante 8 meses. Últimamente hemos tenido grandes discusiones y algunos pequeños desacuerdos”, escribió el usuario. “Cada vez que discutimos, mi novia se aleja y toma la decisión. argumento para ella ChatGPTA veces incluso haciéndolo en la misma habitación.

Cabe destacar que el usuario encontró en estas ocasiones que su pareja podía “volver con un argumento bien construido” analizando todo lo dicho o hecho durante la discusión anterior.

Sin embargo, es este aspecto de la situación el que ha causado una gran tensión.

“Le dejé claro que no me gustaba que hiciera eso porque podría sentir como si un robot me estuviera emboscando con pensamientos y opiniones”, escribieron. “Es casi imposible para un humano recordar todos los pequeños detalles y desglosarlos poco a poco, pero la IA no tiene problemas para hacerlo”.

“Cada vez que expresaba mi malestar, me lo decían. “ChatGPT dice que no estás seguro” o “ChatGPT dice que no tienes el ancho de banda emocional para entender lo que estoy diciendo”“.

Más de TechRadar Pro

[ad_2]

Source Article Link

Tags acuerdo, bien, convertirán, DeepMind, definitivos, estar, Investigadores, LLM, Los, mal, mediadores, para, parecen, Reddit, usuarios

Categories
Life Style

Un estudio de Apple revela una importante falla de IA en OpenAI, Google y Meta LLM

Post author By lisa nichols

Post date October 14, 2024

No Comments on Un estudio de Apple revela una importante falla de IA en OpenAI, Google y Meta LLM

[ad_1]

Los modelos de lenguajes grandes (LLM) pueden no ser tan inteligentes como parecen, según A el estudia de manzana Investigadores.

Los estudiantes de MBA de OpenAI, Google, Meta y otros han sido elogiados por sus impresionantes habilidades de razonamiento. Pero las investigaciones sugieren que su supuesta inteligencia puede estar más cerca de una “coincidencia de patrones complejos” que de un “verdadero razonamiento lógico”. Sí, incluso OpenAI o1 Modelo de razonamiento avanzado.

El estándar más común para las habilidades de razonamiento es una prueba llamada GSM8K, pero debido a que es tan común, existe el riesgo de contaminación de los datos. Esto significa que los estudiantes de LLM pueden conocer las respuestas del examen porque han sido capacitados en esas respuestas, más que por su inteligencia inherente.

Ver también:

La ronda de financiación OpenAI de la empresa está valorada en 157.000 millones de dólares

Para probar esto, el estudio desarrolló un nuevo punto de referencia llamado GSM-Symbolic que mantiene la esencia de los problemas de inferencia, pero cambia variables, como nombres, números y complejidad, y agrega información irrelevante. Lo que descubrieron fue una sorprendente “fragilidad” en el desempeño del LLM. El estudio probó más de 20 modelos, incluidos o1 y GPT-4o de OpenAI, Gemma 2 de Google y Llama 3 de Meta. Con cada modelo, el rendimiento del modelo disminuyó cuando se cambiaron las variables.

La precisión disminuyó unos pocos puntos porcentuales cuando se cambiaron los nombres y las variables. Como señalaron los investigadores, los modelos de OpenAI funcionaron mejor que otros modelos de código abierto. Sin embargo, la variación se consideró “no despreciable”, lo que significa que no debería ocurrir ninguna variación real. Sin embargo, las cosas se pusieron realmente interesantes cuando los investigadores agregaron a la mezcla “frases aparentemente relevantes pero en última instancia sin importancia”.

Velocidad de la luz triturable

Ver también:

La filtración sugiere que probablemente llegue pronto una actualización gratuita de Apple Intelligence

Para probar la hipótesis de que los estudiantes de MBA dependían más de la coincidencia de patrones que del pensamiento real, el estudio añadió declaraciones redundantes a los problemas de matemáticas para ver cómo interactuaban los patrones. Por ejemplo, “Oliver recoge 44 kiwis el viernes. Luego recoge 58 kiwis el sábado. El domingo, recoge el doble de kiwis que el viernes, Pero cinco de ellos eran ligeramente más pequeños que el promedio. ¿Cuántos kiwis tiene Oliver?

Lo que provocó una disminución significativa del rendimiento en todas las áreas. La vista previa o1 de OpenAI obtuvo los mejores resultados, con una caída de precisión del 17,5 por ciento. Eso sigue siendo bastante malo, pero no tan malo como el modelo Phi 3 de Microsoft, que tuvo un rendimiento un 65 por ciento peor.

Ver también:

ChatGPT-4, Gemini, MistralAI y más se unen en esta herramienta personal de IA

En el ejemplo del kiwi, el estudio dijo que los estudiantes de LLM tendían a restar cinco kiwis más pequeños de la ecuación sin entender que el tamaño del kiwi no tenía nada que ver con el problema. Esto sugiere que “los modelos tienden a transformar datos en procesos sin comprender realmente su significado”, validando la hipótesis de los investigadores de que los estudiantes de LLM buscan patrones en problemas de razonamiento, en lugar de comprender el concepto de forma innata.

El estudio no se anduvo con rodeos acerca de sus hallazgos. Probar modelos para comparar que incluyen información irrelevante “revela una falla grave en la capacidad de LLM para comprender verdaderamente conceptos matemáticos y discernir información relevante para resolver problemas”. Sin embargo, vale la pena señalar que los autores de este estudio trabajan para Apple, que es claramente un importante competidor de Google, Meta e incluso OpenAI; aunque existe una asociación entre Apple y OpenAI, Apple también está trabajando en sus propios modelos de IA.

Sin embargo, no se puede ignorar la aparente falta de habilidades de pensamiento formal entre los titulares de un LLM. En última instancia, este es un buen recordatorio para moderar el revuelo en torno a la IA con un saludable escepticismo.

Temas
manzana
inteligencia artificial

[ad_2]

Source Article Link

Tags Apple, estudio, falla, Google, importante, LLM, Meta, OpenAI, revela, una

Categories
Featured

La empresa matriz de TikTok podría eludir a Nvidia y AMD, ya que los informes afirman que utilizará 100.000 chips de IA de Huawei para formar un LLM de próxima generación.

Post author By lisa nichols

Post date October 13, 2024

No Comments on La empresa matriz de TikTok podría eludir a Nvidia y AMD, ya que los informes afirman que utilizará 100.000 chips de IA de Huawei para formar un LLM de próxima generación.

[ad_1]

Después del cese de las restricciones comerciales de Estados Unidos NVIDIA Al exportar chips de IA avanzados a China, la compañía respondió desarrollando la GPU H20, una versión modificada que cumple con las regulaciones al ofrecer niveles de rendimiento más bajos y al mismo tiempo cumplir con los requisitos de procesamiento de IA de las empresas chinas.

Aunque hay El próspero mercado negro En cuanto a las GPU de gama alta de Nvidia, la empresa matriz de TikTok, ByteDance, que ya está bajo un intenso escrutinio en Estados Unidos, no podía permitirse los riesgos legales y de reputación de participar en mercados ilegales, por lo que ha estado comprando procesadores capaces de Nvidia. para satisfacer sus necesidades de IA. Se dice que ByteDance es el mayor comprador de dispositivos H20 en China, y gastará más de 2 mil millones de dólares en dispositivos solo en 2024.

Si bien se espera que se sigan utilizando las GPU de Nvidia, Reuters Afirma que ByteDance ahora está dirigiendo su atención hacia proveedores locales de chips como Huawei para cumplir sus ambiciones de IA.

No sin desafíos

El informe afirma que ByteDance ha comprado más de 100.000 chips Ascend 910B hasta el momento, lo que lo convierte en uno de los mayores compradores de hardware de inteligencia artificial de Huawei en China, aunque hasta julio había recibido menos de un tercio del pedido.

Entrenar modelos de IA es un proceso computacional intensivo, razón por la cual las GPU de alta gama como la de Nvidia tienen una gran demanda. Cambiar al chipset Ascend de Huawei puede ser un movimiento estratégico para el propietario de TikTok, pero no estará exento de desafíos.

Los modelos de IA existentes de ByteDance, como Doubao y Jimeng, se basan en hardware más potente y se utilizan en aplicaciones que van desde chatbots hasta herramientas de texto a vídeo. Reuters dice que el objetivo final de la compañía es reducir su dependencia de Nvidia, pero el cambio a los chips Ascend de Huawei podría obstaculizar su capacidad para entrenar modelos más complejos.

La estrategia de ByteDance parece ser superar las restricciones comerciales de EE. UU. mientras busca proveedores locales que le ayuden a seguir siendo competitivo en el espacio de la IA y más allá. empresa recientemente Invertido en Xinyuan Semiconductorun fabricante chino de chips de memoria, lo que podría conducir a desarrollos como un potencial casco de realidad virtual para competir con Meta's Quest y manzanaVisión Pro.

Suscríbase al boletín TechRadar Pro para recibir las principales noticias, opiniones, características y orientación que su empresa necesita para tener éxito.

Más de TechRadar Pro

[ad_2]

Source Article Link

Tags afirman, AMD, chips, eludir, empresa, formar, generación, Huawei, informes, LLM, Los, matriz, NVIDIA, para, podría, próxima, Tiktok, utilizará

Categories
Featured

¿AMD planea enfrentarse a Apple y Nvidia con la APU más potente de todos los tiempos? Se rumorea que el Ryzen AI Max+ 395 admite 96 GB de RAM y puede ejecutar LLM masivos en memoria sin la necesidad de una GPU AI dedicada.

Post author By lisa nichols

Post date October 2, 2024

No Comments on ¿AMD planea enfrentarse a Apple y Nvidia con la APU más potente de todos los tiempos? Se rumorea que el Ryzen AI Max+ 395 admite 96 GB de RAM y puede ejecutar LLM masivos en memoria sin la necesidad de una GPU AI dedicada.

[ad_1]

AMD Los límites de las GPU integradas se están ampliando con la próxima serie Ryzen AI Max, construida sobre la arquitectura Strix Halo, según filtraciones e informes recientes de varios foros técnicos. Diseñada para superar al Ryzen AI 9 HX 375, esta serie tiene como objetivo ofrecer un rendimiento excepcional en gráficos integrados y potencia de procesamiento.

Según filtraciones de David Huang en X (anteriormente Twitter) e informes adicionales de foros de tecnología chinos, la línea Ryzen AI Max incluirá tres modelos. El Ryzen AI Max 385 tendrá 8 núcleos de CPU y una iGPU con 32 unidades de cómputo (CU). Por encima está el Ryzen AI Max 390 con 12 núcleos y 40 CU, mientras que el modelo insignia Ryzen AI Max+ 395 tiene 16 núcleos y 40 CU.

Según se informa, estos chips tendrán suficiente potencia de GPU para superar a las tarjetas dedicadas como la Radeon RX 7600 XT, lo que los hace ideales para tareas como juegos, inteligencia artificial y cargas de trabajo profesionales.

Zen 5 núcleos

Construido sobre un diseño de microchip, el Strix Halo contará con núcleos Zen 5 y potentes gráficos integrados basados en la arquitectura RDNA 3.5.

En [Vector General Purpose Registers] Descripción en LLVM td no hace mucho, y varias bibliotecas ROCm han agregado recientemente soporte oficial para Strix Halo… Además, el resultado de ejecución de CPU Geekbench 5 que he visto antes parece tener el ancho completo de AVX512 y el doble de ancho de banda por CCX. ¿Se pueden utilizar portátiles e incluso tabletas como superordenadores?

La inclusión de hasta 128 GB de memoria LPDDR5X y 32 MB de caché MALL mejora la capacidad de realizar tareas informáticas y gráficas de alto rendimiento. También se espera que Strix Halo admita hasta 96 GB de memoria para procesamiento de video, lo que lo hace adecuado para estaciones de trabajo y aplicaciones de tareas como LLM. Las APU también contarán con 60 NPU TOPS, lo que mejorará las capacidades de procesamiento de IA.

Las nuevas APU Strix Halo probablemente debutarán a principios del próximo año, y se espera que CES 2025 sirva como plataforma de lanzamiento oficial. Sin duda, surgirá más información a medida que nos acerquemos al evento.

Suscríbase al boletín TechRadar Pro para recibir las principales noticias, opiniones, características y orientación que su empresa necesita para tener éxito.

Estuve charlando con un grupo de amigos hoy y después de verificar gfx1151, descubrí que RDNA3.5 en strix halo se agregó a LLVM td con una descripción VGPR completa de 192K no hace mucho, y recientemente se agregaron en secreto varias bibliotecas ROCm. Descripción oficial de Soporte de strix halo… Combinado con el resultado de ejecución de la CPU Geekbench 5 que he visto antes, ¿parece tener el ancho completo del AVX512 y el doble de ancho de banda por CCX? 😆 pic.twitter.com/jKmWGVy1on13 de septiembre de 2024

Más de TechRadar Pro

[ad_2]

Source Article Link

Tags admite, AMD, Apple, APU, Con, dedicada, ejecutar, enfrentarse, GPU, LLM, Los, más, masivos, Max, memoria, necesidad, NVIDIA, planea, potente, puede, RAM, rumorea, Ryzen, sin, tiempos, todos, una

Categories
Featured

Cómo las organizaciones pueden aprovechar al máximo los programas LLM

Post author By lisa nichols

Post date August 13, 2024

No Comments on Cómo las organizaciones pueden aprovechar al máximo los programas LLM

[ad_1]

A medida que más organizaciones experimentan con GenAI, el alcance de los modelos de IA emergentes se amplía. La amplia variedad de modelos disponibles significa que las organizaciones que superaron la pregunta inicial de si deberían usar IA en primer lugar ahora enfrentan una pregunta más difícil: ¿qué modelo deberían usar?

Con la gran cantidad de opciones disponibles en el mercado y el desarrollo e introducción constante de nuevos modelos, muchas empresas no están seguras de qué dirección seguir y qué modelo adoptar para respaldar mejor el desarrollo de sus productos. AplicacionesMientras miramos hacia el futuro y esperamos que se introduzcan más modelos y versiones, las organizaciones deben adoptar un enfoque flexible al elegir modelos de IA, cambiando el enfoque de encontrar el proveedor que mejor se adapte a adoptar un enfoque equilibrado y con visión de futuro con LLM Mesh. .

Emma Irvin

Navegar a través de enlaces sociales

Responsable de Ingeniería de Ventas en Dataiku.

Los riesgos que plantea depender de un solo proveedor

Depender de un solo modelo es arriesgado. Por ejemplo, digamos que una empresa centra sus aplicaciones empresariales de atención sanitaria en torno a un único modelo de IA sin integrar otros. El peligro es que un solo modelo en el que se confía a veces puede proporcionar resultados y recomendaciones inexactos, lo que lleva no sólo a posibles problemas financieros sino también a una menor confianza en la empresa por parte del mercado en general. ¿Cómo sabemos que esto es cierto? Porque esto le pasó a IBM, que centró sus aplicaciones sanitarias en torno al modelo de IA de Watson. Debido a que el modelo a veces proporcionaba información inexacta, esto erosionaba la confianza, además de tener un impacto negativo significativo en la reputación. Atención sanitaria de la empresa brazo Desde entonces ha luchado por recuperarse.

A pesar de la importancia de herramientas como Desbloquear la inteligencia artificial'S chat gbtLas preocupaciones sobre su gobernanza han generado preguntas y dudas entre los inversores y quienes participan en la integración de nuevas tecnologías. Al igual que con IBM, existe un riesgo operativo cuando las empresas se suben a un tren y se atan a un único modelo de IA. Para mitigar estos riesgos, evitar la dependencia de un único proveedor es fundamental para navegar en el acelerado panorama de la IA y poder reducir las preocupaciones sobre la seguridad, la ética y la estabilidad. Es por eso que se alienta a las empresas a cambiar su perspectiva de estar encerradas en un solo proveedor a saltar a todas las diferentes olas de IA: con LLM Mesh.

LLM Mesh: saltando sobre todas las olas

Con LLM Mesh, las empresas pueden aprovechar la ola de modelos de IA mientras se preparan para cambios futuros. Al eliminar las complejidades de las comunicaciones backend y los requisitos de API, LLM Mesh simplifica el movimiento o el “salto de onda” de un modelo a otro rápidamente.

El beneficio del salto de ola es que permite a las empresas desarrollar aplicaciones empresariales utilizando los mejores modelos de IA actuales y al mismo tiempo tener la opción de cambiar a otros modelos, ya sea saltando a modelos más relevantes ahora o manteniendo abiertas las opciones para que lleguen al mercado modelos emergentes.

A medida que las empresas toman decisiones informadas sobre los costos de operar sistemas de gestión de aprendizaje automático, que pueden resultar costosos, también deben elegir el modelo adecuado para las necesidades de rendimiento de la aplicación. Mantener opciones abiertas para considerar necesidades como costos, rendimiento y seguridad permite a las empresas beneficiarse en un entorno en rápida evolución.

Suscríbase al boletín TechRadar Pro para recibir todas las noticias, opiniones, funciones y orientación que su empresa necesita para tener éxito.

Necesito saltar ahora

¿Por qué saltas ahora? Casi el 90% de los ejecutivos clasifican a GenAI como una de las principales prioridades tecnológicas. Esperar la ola perfecta es una estrategia para la debilidad competitiva. Mientras las empresas miran hacia el futuro de la tecnología de IA, es importante no esperar a subirse a la ola de la IA si quieren evitar quedarse atrás. Para aprovechar este impulso, las empresas deben sumergirse por completo en el uso de la IA. A partir de 2024, hay más de 125 empresas. Maestro de leyes Hay nuevos modelos disponibles, con un rápido aumento del 120 % en los modelos lanzados entre 2022 y 2023. El panorama está creciendo y se están introduciendo en el mercado nuevos modelos emergentes, y no hay mejor momento que ahora para que las empresas se suban al tren.

La conclusión es que las empresas que quieran aprovechar la ola de la IA sin sufrir las desventajas del monopolio de los proveedores en realidad sólo tienen una opción: adoptar un enfoque LLM Mesh. Este enfoque no solo brinda la flexibilidad para elegir el modelo que mejor se alinee con las prioridades de la organización, sino que también ayudará a que las aplicaciones y proyectos de IA estén preparados para el futuro para garantizar que la empresa siempre pueda aprovechar los últimos modelos de IA. Si una organización se sube a la ola de la IA de una manera más inteligente y ágil, tendrá muchas más posibilidades de adelantarse a la competencia y salir bien de la ola de innovación de la IA.

Hemos enumerado las mejores herramientas de inteligencia artificial..

Este artículo se produjo como parte del canal Expert Insights de TechRadarPro, donde destacamos las mejores y más brillantes mentes de la industria tecnológica actual. Las opiniones expresadas aquí son las del autor y no reflejan necesariamente los puntos de vista de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: https://www.techradar.com/news/submit-your-story-to-techradar-pro

[ad_2]

Source Article Link

Tags aprovechar, Como, Las, LLM, Los, máximo, Organizaciones, programas, pueden

Posts pagination

1 2 3 Older Posts