Los líderes empresariales de hoy se están dando cuenta de que algunas aplicaciones de la IA generativa tienen un gran potencial para ayudar a que sus negocios funcionen mejor, aunque es posible que todavía estén explorando exactamente cómo y cuál podría ser el retorno de la inversión final. De hecho, a medida que las empresas convierten los modelos generativos de IA en soluciones mensurables, deben considerar factores como el costo, la precisión y la latencia de la tecnología para determinar su valor a largo plazo.
El creciente panorama de grandes modelos lingüísticos (LLM), combinado con el miedo a tomar la decisión equivocada, deja a algunas empresas rascándose la cabeza. Los grandes modelos de lenguaje vienen en diferentes formas y tamaños y pueden servir para diferentes propósitos, y la verdad es que no existe un único modelo de gran lenguaje que pueda resolver todos los problemas. Entonces, ¿cómo puede un gran modelo de lenguaje resolver todos los problemas? un trabajo ¿Determinar cuál es la correcta?
Aquí, analizamos cómo tomar la mejor decisión para que su empresa pueda utilizar la IA generativa con confianza.
Director de Diseño y Estrategia de New Relic.
Elija el nivel LLM adecuado para usted: cuanto antes, mejor
Algunas empresas se muestran reticentes a adoptar un LLM, lanzar proyectos piloto y esperar a que la próxima generación vea cómo esto podría cambiar su aplicación de la IA generativa. Su renuencia a comprometerse puede estar justificada, ya que involucrarse demasiado pronto y no probarlo adecuadamente podría significar pérdidas importantes. Pero la IA generativa es una tecnología que evoluciona rápidamente, y aparentemente se introducen nuevos modelos centrales semanalmente, por lo que ser demasiado conservador y seguir esperando a que la tecnología evolucione puede significar que nunca se avanza.
Sin embargo, existen tres niveles de sofisticación que las empresas pueden considerar cuando se trata de IA generativa. La primera es una implementación contenedora simple alrededor de GPT, diseñada para interactuar con Abierto AIModela el lenguaje y proporciona una interfaz para guiar la finalización de textos y las interacciones basadas en conversaciones. El siguiente nivel de sofisticación es el uso de LLM con recuperación de generación aumentada (RAG). RAG permite a las empresas mejorar su producción de LLM con datos privados y/o propietarios. GPT-4, por ejemplo, es un LLM potente que puede comprender un lenguaje detallado e incluso la lógica.
Sin embargo, no está entrenado en los datos de ninguna empresa específica y puede resultar en imprecisiones, inconsistencias o irrelevancia (alucinaciones). Las empresas pueden superar las alucinaciones utilizando aplicaciones como RAG, que les permiten combinar conocimientos de un modelo LLM básico con algunos datos exclusivos de su negocio. (Vale la pena señalar que modelos alternativos altamente contextualizados como el Claude 3 pueden en realidad hacer que el RAG quede obsoleto. Si bien muchos de ellos todavía están en su infancia, todos sabemos lo rápido que avanza la tecnología, por lo que la obsolescencia puede llegar más temprano que tarde).
En el tercer nivel de desarrollo de la IA generativa, la empresa ejecuta sus propios modelos. Por ejemplo, una empresa podría tomar un modelo Fuente abierta modelo, ajústelo utilizando sus propios datos y ejecute el modelo por sí solo esa infraestructura En lugar de ofertas de terceros como OpenAI. Cabe señalar que el título LLM de tercer nivel requiere la supervisión de ingenieros capacitados en aprendizaje automático.
Aplicar la ley correcta al caso de uso correcto
Dadas las opciones disponibles aquí y las diferencias en costos y capacidades, las empresas deben decidir exactamente qué planean lograr con un LLM. Por ejemplo, si usted Comercio electrónico En las empresas, el soporte humano está capacitado para intervenir cuando un cliente corre el riesgo de abandonar su carrito de compras y ayudarlo a decidir completar su compra. Una interfaz de chat permitirá obtener el mismo resultado por una décima parte del coste. En este caso, puede valer la pena que la empresa de comercio electrónico invierta en ejecutar su propio programa MBA con ingenieros que lo controlen.
Pero un tamaño mayor no siempre es rentable, ni siquiera necesario. Si utiliza una aplicación bancaria, no puede permitirse el lujo de cometer errores en las transacciones. Por este motivo, necesitarás un mayor control. Desarrollar su propio modelo o utilizar un modelo de código abierto, ajustarlo, aplicar filtros de entrada y salida de gran ingeniería y alojarlo usted mismo le brinda todo el control que necesita. Para empresas que simplemente quieren mejorar la calidad de sus productos, esta es la solución ideal. Experiencia del clientesería beneficioso un LLM con buen rendimiento de un proveedor externo.
Una nota sobre la observabilidad
Independientemente del LLM elegido, comprender cómo funciona el modelo es clave. A medida que las pilas de tecnología se vuelven más complejas, puede resultar difícil centrarse en los problemas de rendimiento que pueden surgir en un LLM. Además, debido a que la pila de tecnología es tan diferente y las interacciones entre los LLM son tan diferentes, hay métricas completamente nuevas que rastrear, como el tiempo para acceder al código, las alucinaciones, el sesgo y la deriva. Aquí es donde entra en juego la observabilidad, proporcionando visibilidad integral en todo el grupo para garantizar el funcionamiento, la confiabilidad y la eficiencia operativa. En resumen, agregar un LLM sin visibilidad puede afectar significativamente la forma en que una empresa mide el ROI en tecnología.
El viaje de la IA generativa es emocionante y acelerado, si no un poco desalentador. Comprender las necesidades de su negocio y combinarlas con el programa LLM adecuado no solo garantizará beneficios a corto plazo, sino que también sentará las bases para resultados comerciales óptimos en el futuro.
Proporcionamos las mejores herramientas de IA.
Este artículo se produjo como parte del canal Expert Insights de TechRadarPro, donde destacamos las mejores y más brillantes mentes de la industria tecnológica actual. Las opiniones expresadas aquí son las del autor y no reflejan necesariamente los puntos de vista de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: https://www.techradar.com/news/Envíe su historia a techradar-pro