- Microsoft anuncia el nuevo modelo de inteligencia artificial Phi-4
- Ya está disponible para desarrolladores e investigadores.
- Se desempeña bien en tareas de matemáticas a pesar de su pequeño tamaño.
microsoft Anunció un nuevo modelo de IA llamado Phi-4, que es un modelo de lenguaje pequeño (SLM) a diferencia de los modelos de lenguaje grande (LLM), que aman a los chatbots. ChatGPT y Copiloto se utiliza. Además de ser liviano, Phi-4 destaca en el razonamiento complejo, lo que lo hace ideal para el procesamiento de matemáticas y lenguaje.
Microsoft ha publicado una serie de pruebas comparativas que muestran que el Phi-4 supera incluso a modelos de lenguajes grandes como el Gemini Pro 1.5 en cuestiones de competencia matemática.
Avances posteriores al entrenamiento
Modelos de lenguaje pequeños, p.e. ChatGPT-4o mini, Gemini 2.0 Flash y Claude 3.5 Haiku tienden a ser más rápidos y económicos de ejecutar que los modelos de lenguaje más grandes. Sin embargo, su rendimiento ha aumentado significativamente con los lanzamientos recientes.
Para Microsoft, estas mejoras pueden haber sido posibles gracias a avances en el entrenamiento de Phi-4 en conjuntos de datos sintéticos de alta calidad e innovaciones posteriores al entrenamiento. Dado que el obstáculo para mejorar la capacidad de la IA siempre ha sido la enorme cantidad de potencia de procesamiento y datos necesarios para la capacitación (a veces llamado “muro de datos previo a la capacitación”), las empresas de IA han estado buscando formas de mejorar el desarrollo posterior a la capacitación. Para mejorar el rendimiento.
Phi-4 está actualmente disponible en Fundición de IA de Azureuna plataforma para que los desarrolladores creen aplicaciones de IA generativa. Entonces, aunque Phi-4 está disponible bajo el Acuerdo de licencia de Microsoft Research, no puede simplemente comenzar a chatear con él, como puede hacerlo con Copilot o ChatGPT. En cambio, tendremos que esperar y ver qué se le ocurre a la gente en el futuro.