Cualquiera que haya utilizado IA generativa durante un período de tiempo estará más que familiarizado con las alucinaciones. Estos casos ocurren cuando los sistemas de IA generan información falsa o engañosa, una falla que a menudo tiene su origen en limitaciones en los datos de entrenamiento o en el diseño del modelo. Estos errores pueden aparecer de forma impredecible y variar ampliamente en su gravedad: desde errores menores hasta distorsiones importantes que pueden sesgar significativamente los procesos de toma de decisiones.
El programa Lamini Memory Tuning tiene como objetivo reducir las alucinaciones de forma significativa, del 50% al 5%, que es el 90%. Esta tecnología permite incorporar datos precisos al MBA, logrando tasas de precisión de hasta el 95%, un salto significativo con respecto al 50% de precisión proporcionado por los métodos anteriores.
Al ajustar millones de transformadores especializados, como LoRA (adaptaciones de bajo rango) a cualquier LLM de código abierto, Lamini Memory Tuning garantiza una retención precisa de los hechos, desde eventos históricos hasta datos técnicos complejos, sin la alta latencia y el costo típicamente asociados con dicha granularidad. .
Una combinación de expertos en memoria
Este método, inspirado en los mapas mentales, activa selectivamente a los expertos más relevantes a través de un índice durante la inferencia, reduciendo drásticamente los cálculos innecesarios.
Por ejemplo, la compañía dice que cuando se le asigna la tarea de recordar hechos específicos sobre el Imperio Romano, el sistema extrae sólo la información necesaria sobre Julio César, los acueductos o las legiones, evitando activar pesos de modelos irrelevantes.
La tecnología central detrás de Lamini Memory Tuning implica un marco disperso conocido como Mixture of Memory Experts (MoME), que se escala para admitir una gran cantidad de hechos limitados únicamente por el tamaño de los datos de entrenamiento. Este enfoque no sólo mejora la capacidad de respuesta del modelo, sino que también reduce significativamente los requisitos computacionales, lo que lo convierte en una solución viable para mejorar el rendimiento de MBA en diferentes aplicaciones, afirma Lamini.