- Google Whisk utiliza imágenes como entrada en lugar de mensajes de texto
- Está construido sobre el modelo de IA generativa Imagen 3 de Google.
- La herramienta de demostración se puede probar de forma gratuita para los usuarios de Estados Unidos.
GoogleUna nueva herramienta de inteligencia artificial facilita la creación y remezcla de conceptos visuales. En lugar de pedirle que describa lo que tiene en mente, Whisk le permite ingresar tres indicaciones de imagen: una para el tema, otra para la escena y otra para el estilo. Whisk se encarga del resto, lo que hace que sea aún más fácil probar diferentes ideas.
Mientras que la mayoría Los mejores generadores de imágenes con IA Requiere que usted escriba un reclamo detallado y Whisk se encarga de eso detrás de escena. Cuando colocas imágenes en la interfaz web de Whisk como inspiración, Google mellizo El modelo los analiza automáticamente y escribe un comentario detallado para cada uno. Estos luego son alimentados Imagen 3 Plantilla, para crear una imagen coincidente.
Por ejemplo, puedes añadir una foto de un coche como tema y una foto de un paisaje rural como escena. Puedes agregar acuarela como estilo para ver qué crea Whisk. Presione el botón y obtendrá un par de imágenes basadas en su entrada.
A partir de aquí, resulta fácil remezclar imágenes. La interfaz le permite especificar detalles adicionales basados en texto para modificar los resultados. También puedes incluir fácilmente diferentes imágenes de origen o tirar los dados si necesitas inspiración. Los nuevos hallazgos aparecen en pares en el resumen, lo que lo convierte en una forma intuitiva de pensar en ello. También puede optar por mejorar las imágenes revelando el mensaje de texto y agregando más detalles.
falla
Si bien Whisk está diseñado para eliminar la necesidad de indicaciones de texto, Google incluye la opción de optimizar las indicaciones escritas porque los resultados no siempre coincidirán con el material original.
en un Publicación de blog Acerca de la herramienta de demostración, Google explica que Whisk “captura la esencia de su tema, no una copia exacta del mismo”. Es tan efectivo como el análisis que hace Gemini de las fotos que envías. Si bien esto es generalmente impresionante, no puede entrar en tu cabeza: podrías esperar que Whisk extraiga un detalle de la imagen, mientras se centra en otros.
La publicación explica además: “Debido a que Whisk solo extrae algunas características básicas de su imagen, puede generar imágenes que difieran de sus expectativas. Por ejemplo, el sujeto generado puede tener una altura, peso, peinado o tono de piel diferente. Estas funciones pueden ser fundamentales para su proyecto y Whisk puede no dar en el blanco, por lo que le permitimos ver y editar indicaciones clave en cualquier momento.
Incluso con estos inconvenientes, Whisk es una aplicación interesante de las herramientas de inteligencia artificial existentes de Google. Los modelos generativos básicos son los mismos que si estuvieras chateando con Gemini a través de su interfaz de texto. Al basarse en entradas de imágenes, Whisk es una forma más accesible e intuitiva para que los creadores de contenido visual jueguen con sus ideas.
Basándose en los primeros comentarios de los creadores digitales, Google se refiere a Whisk como “un nuevo tipo de herramienta creativa” destinada a la “exploración visual rápida, no a ediciones perfectas en píxeles”.
Cómo probar Google Whisk
Actualmente, Google Whisk solo está disponible para usuarios de Estados Unidos. Si vives allí, puedes probarlo a través de tu navegador web en labs.google/whisk.
Jugar con la herramienta de demostración es completamente gratuito. Los datos de su experiencia con Whisk se enviarán a Google para ayudar a mejorar y desarrollar futuros productos de IA.