microsoft Los investigadores han lanzado un marco de inteligencia artificial (IA) de código abierto para agentes que operan en entornos de nube. Se llama AIOpsLab y es un marco de investigación basado en principios que permite a los desarrolladores crear, probar, comparar y mejorar agentes AIOps. El marco es compatible con el servicio Azure AI Agent. AIOpsLab utiliza una interfaz de middleware, un generador de errores y carga de trabajo, así como una capa de observabilidad que muestra una amplia gama de datos de telemetría. En particular, la compañía dijo que se aceptó un documento sobre el marco en el Simposio anual ACM sobre Computación en la Nube (SoCC'24).
Microsoft lanza AIOpsLab para agentes basados en la nube
Los servicios basados en la nube y las organizaciones que los aprovechan a menudo enfrentan importantes desafíos operativos, especialmente en el diagnóstico y mitigación de errores. Los agentes AIOps, también conocidos como agentes de inteligencia artificial para operaciones de TI, son herramientas basadas en software que se utilizan para monitorear, analizar y optimizar los sistemas en la nube y resolver estos desafíos operativos.
Investigadores de Microsoft, en un Publicación de blogdestacó que cuando se trata de análisis de causa raíz de incidentes (RCA) o clasificación, los agentes AIOps dependen de servicios y conjuntos de datos propietarios, y solo utilizan marcos que atienden a soluciones específicas. Esto no logra captar la naturaleza dinámica de los servicios en la nube en el mundo real.
Para resolver este problema, la compañía ha lanzado un marco unificado de código abierto llamado AIOpsLab para desarrolladores e investigadores que les permitirá diseñar, desarrollar, evaluar y mejorar las capacidades de los agentes. Una de las formas básicas de resolver el problema es separar estrictamente el proxy y el servicio de aplicación mediante una interfaz intermedia. Esta interfaz se puede utilizar para integrar y ampliar otras partes del sistema.
Esto permite al agente AIOps abordar el problema paso a paso, simulando escenarios de la vida real. Por ejemplo, se podría enseñar a un agente a encontrar primero una descripción del problema, luego comprender las instrucciones y luego utilizar las interfaces de programación de aplicaciones (API) disponibles para invocar acciones.
AIOpsLabs también viene con un generador de errores y cargas de trabajo que se puede utilizar para capacitar a estos agentes de IA. Puede crear simulaciones de escenarios normales y defectuosos para permitir que los agentes de AIOps adquieran conocimientos sobre cómo resolverlos y eliminar cualquier comportamiento no deseado.
Además, AIOpsLab también viene con una capa de monitoreo extensible que brinda capacidades de monitoreo al desarrollador. Debido a que el sistema recopila una amplia gama de datos de telemetría, el marco solo puede mostrar datos relevantes para agentes específicos, lo que permite a los desarrolladores una forma granular de realizar cambios.
AIOpsLab actualmente admite cuatro tareas principales dentro del dominio AIOps: detección de incidentes, localización, diagnóstico de causa raíz y mitigación. Actualmente, el marco de IA de código abierto de Microsoft es disponible En GitHub con licencia MIT para casos de uso personal y comercial.
Los enlaces de afiliados pueden generarse automáticamente; consulte nuestro sitio web Declaración de ética Para más detalles.
La industria cinematográfica es conocida por representar vívidamente futuros cercanos. Piense en robots humanoides (Yo, Robot), borrado de memoria (Eternal Sunshine of the Spotless Mind) o incluso extensión de la vida (Vanilla Sky). Es inevitable que algunas imágenes y predicciones se equivoquen; Sin embargo, otros ofrecen a los espectadores un vistazo a la tecnología futura.
Aunque todavía tenemos que descubrir todo el potencial de los automóviles o aviones totalmente automatizados, Steven Spielberg, quien adaptó la novela Minority Report, ha podido predecir correctamente algunos aspectos del futuro, como la publicidad digital personalizada, el software de reconocimiento del iris y Cinética de juegos virtuales. Interfaces. Pero sutilmente, el tema central de la película se convierte en el más profético: la tecnología capaz de predeterminar.
Ambientada en el año 2054, la película de ciencia ficción imagina un mundo en el que tres humanos “conscientes” pueden predecir crímenes violentos antes de cometerlos. Tom Cruise interpreta a un detective acusado de un “futuro asesinato”, y la narrativa sigue sus intentos de obtener el “informe” titular, que supuestamente contiene información fundamental para la profecía incriminatoria.
De hecho, es justo decir que tendemos a no confiar en los adivinos como fuentes confiables para identificar problemas inminentes. Sin embargo, los procedimientos “previos al crimen” de la película comparten similitudes con los métodos que utilizamos ahora. Herramientas de inteligencia artificial Para proteger nuestros ecosistemas digitales, reviviendo coincidentemente la idea de Gartner de que “no hay futuro para las operaciones de TI que no incluya la Inteligencia Artificial para Operaciones de TI (AIOps)”.
Quizás la relevancia actual del Minority Report, publicado hace 22 años, sea la razón por la cual se lanzó la fase de adaptación en el Reino Unido este año…
John Atkinson
Director de Ingeniería de Soluciones, Reino Unido e Irlanda, en Riverbed Technology.
De vuelta a la realidad
Hoy en día, los administradores de TI tienen una gran tarea sobre sus hombros. Son responsables de mantener un trabajo Práctico y seguro, mientras nos esforzamos constantemente por mejorar las experiencias digitales (DEX) que ofrece.
Se espera que los líderes de TI, junto con sus equipos, hagan frente al torrente de notificaciones y alertas que se producen como subproducto de la gestión de cantidades masivas de aplicaciones dentro de paisajes digitales innecesariamente complejos. Además, también se les encomendó la tarea de clasificar y procesar los distintos grados de gravedad de los mensajes entrantes. mesa de ayuda entradas.
Suscríbase al boletín TechRadar Pro para recibir las principales noticias, opiniones, características y orientación que su empresa necesita para tener éxito.
Según un estudio de mercado, más de un tercio de los directivos (38%) se sienten abrumados por esta mayor sobrecarga de información, lo que demuestra que no es inusual para ellos. infraestructura de TI Estar tan sobrecargado de datos que comience a obstaculizar la eficiencia y claridad operativa.
Este es un desafío que requiere que los equipos de TI hagan malabarismos con su tiempo y su personal, pero desafortunadamente, la mayoría de las empresas no tienen un repositorio completo de tecnología de Hollywood a su disposición. La mejor manera de abordar estos problemas es seguir adelante.
“Ahora, el sistema puede funcionar a su favor”.
Lo que las empresas necesitan hoy en día es un software que pueda identificar y resolver problemas antes de que se conviertan en notificaciones, alertas o tickets. O para usar un término de Minority Report: tecnología “cognitiva”.
AIOps podría ser esta solución. Hoy en día hay plataformas disponibles en el mercado que gestionan proactivamente las operaciones de TI en nombre de los administradores de TI y sus equipos, eliminando cargas de recursos y costos del trabajo humano y avanzando hacia la independencia digital. Esto permite que una empresa de TI opere de manera más autosuficiente, lo que permite a los líderes de TI volver a centrarse en cuestiones más importantes, como ofrecer DEX superior o maximizar las oportunidades comerciales.
La flexibilidad y libertad adicionales que esto brinda a los gerentes de TI es sin duda la razón por la cual el 45% de los encuestados en la encuesta Global DEX de Riverbed identifican la IA como cada vez más importante para los negocios, más que cualquier tecnología nueva o familiar que se espera remodele las experiencias digitales en los próximos dieciocho meses.
“Vemos lo que ellos ven”
Imagine un escenario en el que un minorista muy respetado experimenta mayores cantidades de tráfico digital durante las horas pico. Si su sitio web carece de la flexibilidad para manejar esta mayor demanda, corren el riesgo de experimentar problemas como tiempo de inactividad o transacciones fallidas. Del mismo modo, las aplicaciones, dispositivos y redes en las que confían para brindar un servicio excepcional en la tienda o en el centro de atención al cliente también pueden fallar, ya que los empleados contactan en masa a los equipos de soporte. En general, una tecnología de la información insuficiente y obsoleta puede afectar sus ventas, reputación y satisfacción del cliente.
Esta organización virtual puede evitar estos problemas adoptando AIOps, que utiliza inteligencia artificial y aprendizaje automático para evaluar continuamente métricas de rendimiento y patrones de red (un “informe minoritario” de TI, por así decirlo). Al analizar la evidencia histórica que recopilan, estas plataformas pueden identificar anomalías y predecir problemas futuros, como servidores sobrecargados, falta de espacio en disco o aplicaciones ineficientes.
Estos “conocimientos avanzados” (para usar más terminología de la película) proporcionan el tipo de conocimientos basados en datos que respaldan los intereses estratégicos de los equipos de TI. Los tomadores de decisiones pueden confiar en esta visión adicional e integral para desarrollar una imagen integral de las vulnerabilidades digitales de sus organizaciones, antes de abordar cambios relevantes. Para simplificar aún más las cosas, muchas plataformas de automatización inteligente pueden realizar estas correcciones sin necesidad de intervención humana.
Nueva era
Al detectar proactivamente y remediar automáticamente los problemas emergentes antes de que se conviertan en problemas activos, AIOps libera a los equipos de TI de la responsabilidad de encontrar y solucionar estos problemas ellos mismos. Aprovechar estas capacidades adicionales permite a las empresas aumentar el tiempo de actividad y ofrecer un rendimiento rápido de la red, brindando a sus clientes experiencias digitales excepcionales.
Eliminar las correcciones de errores de emergencia y evitar el tiempo de inactividad digital también reduce significativamente la carga de trabajo de su equipo de TI. De esta manera, la seguridad y eficiencia adicionales que brindan AIOps permite a las organizaciones lograr importantes ahorros de costos.
Si bien es posible que nuestro progreso en la industria de la tecnología aún no haya alcanzado la visión cinematográfica completa de Steven Spielberg, la llegada de AIOps de vanguardia ha marcado el comienzo de la era del Minority Report de TI.
Las empresas no sólo disfrutan de una mayor confiabilidad de la red, sino que ahora pueden reasignar su tiempo, dinero y nuevos recursos para adoptar la siguiente fase de la innovación digital, cualquiera que sea.
Este artículo se produjo como parte del canal Expert Insights de TechRadarPro, donde mostramos las mejores y más brillantes mentes de la industria tecnológica actual. Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: https://www.techradar.com/news/submit-your-story-to-techradar-pro
There’s a tendency to think that Application Performance Monitoring (APM) is the same as observability. However, APM is more focused on tracking specific metrics and logs, which is great for simpler systems. On the other hand, observability is designed for the intricate nature of today’s applications that use microservices. It gives you a detailed view of your system’s health and performance, helping you get to the bottom of problems for a more effective fix.
AIOps, short for Artificial Intelligence for IT Operations, is an approach in the field of IT operations that utilizes artificial intelligence, machine learning, and big data analytics to automate and enhance IT operations processes. The primary goal of AIOps is to help IT teams manage the increasing complexity and scale of their operations environments, especially as businesses grow and adopt more advanced technologies.
When it comes to observability, some people believe that log files are all you need. While logs are important, they’re just one piece of the puzzle. For the best results, you should be analyzing metrics, traces, and logs in real-time. This way, you can address issues before they impact your users. Observability goes beyond logs, offering insights into how your system is running and how users are interacting with it, which is key for keeping things running smoothly.
AIOps involves a number of areas including :
Data Analysis: AIOps platforms can process vast amounts of operational data from various IT sources, including performance monitoring tools, logs, and helpdesk systems. By analyzing this data, AIOps can detect patterns, anomalies, and potential issues.
Automation: A key aspect of AIOps is automating routine processes. This can range from simple tasks, like resetting a server, to more complex processes, like orchestrating a response to a network outage.
Machine Learning and AI: AIOps uses machine learning algorithms to learn from data over time. This enables the system to predict and prevent potential issues before they impact the business, and also to provide actionable insights for IT decision-making.
Enhancing IT Operations: AIOps helps IT teams become more proactive rather than reactive. It does this by offering insights that can drive better decision-making and by automating responses to common issues, freeing up IT staff to focus on more strategic tasks.
Incident Management and Response: In the event of IT issues or outages, AIOps can assist in rapid diagnosis and response, often identifying the root cause of a problem more quickly than a human could.
Capacity Optimization: AIOps tools can analyze usage patterns and trends to optimize the allocation of IT resources, such as server and storage capacity, ensuring that resources are used efficiently and effectively.
Another myth is that observability tools are always expensive. It’s true that some can be costly, but there are many options with different pricing models to suit various budgets. For instance, per-host pricing can give you a predictable cost, so you can improve your monitoring without worrying about unexpected expenses. It’s important to look at the different pricing options available to find one that fits your budget and needs.
AIOps myths
Here are some other articles you may find of interest on the subject of AI automation :
There’s also a misconception that observability is only for Site Reliability Engineers (SREs). This isn’t the case. Observability makes data accessible to many teams, like marketing, development, DevOps, and business analysts. This means that everyone can use this data to make better decisions. By breaking down data silos, observability encourages teamwork and helps everyone contribute to making the system more reliable and successful.
Difference Between APM and Observability: Application Performance Monitoring (APM) is designed for monolithic runtimes, while observability caters to complex, microservices-based applications, offering a comprehensive view of the entire system.
Misconception of Log Files as Observability: Relying solely on log files for problem resolution is an anti-pattern. Effective monitoring involves real-time analysis of various system components and user performance to proactively address issues.
Cost of Observability Tools: Observability tools can be expensive, but there are pricing models that offer predictability and inclusivity, such as per-host pricing, as opposed to variable costs based on data volume or user count.
Observability is Not Just for SREs: Observability is not exclusively for Site Reliability Engineers (SREs). It democratizes data access across different teams, including marketing, development, DevOps, and business users, enabling them to make informed decisions.
Avoiding Favoritism in Application Monitoring: Traditional monitoring tools often force organizations to prioritize certain applications due to resource constraints. Observability allows for comprehensive monitoring, ensuring that all applications receive attention.
The Pitfalls of DIY Monitoring: Building custom monitoring solutions can slow down development and lead to lower quality applications. Automated observability solutions are recommended to maintain development speed and application performance.
In the past, monitoring tools might have focused more on certain applications because of limited resources. This could lead to an uneven emphasis. Observability changes this by allowing for equal monitoring of all applications. This ensures that no application is neglected and that performance issues are dealt with across the entire system. This balanced approach is essential for providing a good user experience.
Finally, the idea of creating a custom DIY monitoring system might seem appealing, but it comes with its own set of problems. Building your own system can take away resources from your main development work, which might lower the quality of your applications. Instead, it’s better to use automated observability solutions. They help keep your development on track and ensure your applications are performing well, all while saving you the hassle of managing a monitoring system yourself.
By understanding these aspects of observability and monitoring, you can avoid common mistakes and adopt practices that improve your system’s performance and reliability. Good observability means having a full view of your system, solving problems before they happen, and working together across different teams. With the right tools and approaches, you can make sure your applications are running perfectly and providing a great experience for your users.
Filed Under: Guides, Top News
Latest timeswonderful Deals
Disclosure: Some of our articles include affiliate links. If you buy something through one of these links, timeswonderful may earn an affiliate commission. Learn about our Disclosure Policy.