Stable Diffusion, una alternativa de código abierto a los generadores de imágenes impulsados por IA como En pleno vuelo y DALL-Eha sido actualizado a Versión 3.5. El nuevo modelo intenta corregir algunos de los errores (que pueden estar subestimados) en Stable Diffusion 3 Medium. Stability AI dice que el Modelo 3.5 cumple con las afirmaciones mejor que otros generadores de imágenes y compite con modelos mucho más grandes en calidad de salida. Además, se ha ajustado para ofrecer una mayor variedad de estilos, tonos de piel y características sin que tengas que solicitarlo explícitamente.
El nuevo modelo viene en tres sabores. El Stable Diffusion 3.5 Large es el más potente de los tres, con la más alta calidad del grupo, y al mismo tiempo lidera la industria en adherencia instantánea. La estabilización de IA dice que el modelo es adecuado para usos profesionales a 1MP.
Mientras tanto, el Stable Diffusion 3.5 Large Turbo es una versión “destilada” del modelo más grande, con un enfoque más en la eficiencia que en la máxima calidad. Stability AI dice que la variante Turbo aún produce “imágenes de alta calidad con una participación excepcionalmente rápida” en cuatro pasos.
Finalmente, Stable Diffusion 3.5 Medium (2,5 mil millones de parámetros) está diseñado para funcionar en dispositivos de consumo, equilibrando calidad y simplicidad. Con gran facilidad de personalización, el modelo puede crear imágenes con una resolución de entre 0,25 y 2 megapíxeles. Sin embargo, a diferencia de los dos primeros modelos disponibles ahora, Stable Diffusion 3.5 Medium no llegará hasta el 29 de octubre.
Un nuevo trío sucede al fallido Distribución estable 3 mediana En junio. La compañía admitió que el lanzamiento “no cumplió plenamente con nuestros estándares ni con las expectativas de nuestras comunidades”, algunas de las cuales fueron producidas. El horror corporal es ridículamente grotesco. En respuesta a las reclamaciones usted no pidió nada por el estilo. Estabilidad Las repetidas referencias de Amnistía Internacional al compromiso inmediato extraordinario en el anuncio de hoy probablemente no sean una coincidencia.
Aunque Stability AI solo lo mencionó brevemente en la publicación de su blog de anuncio, la Serie 3.5 tiene nuevos filtros para reflejar mejor la diversidad humana. La compañía describe la producción humana de los nuevos modelos como “representar el mundo, no solo un tipo de persona, con diferentes tonos de piel y características, sin la necesidad de indicaciones intensas”.
Esperemos que sea lo suficientemente sofisticado como para tener en cuenta matices y sensibilidades históricas, a diferencia de la debacle de Google que ocurrió a principios de este año. Sin que se lo pidieran, Gemini produjo colecciones de “fotografías” históricas extremadamente inexactas, por ejemplo Nazis racialmente diversos y padres fundadores de los Estados Unidos. La reacción fue tan severa que Google no resurgió durante generaciones humanas. Incluso después de seis meses.