Categories
Featured

Google Whisk es una nueva forma de crear imágenes impulsadas por IA mediante indicaciones de imágenes: aquí se explica cómo probarlo

[ad_1]

  • Google Whisk utiliza imágenes como entrada en lugar de mensajes de texto
  • Está construido sobre el modelo de IA generativa Imagen 3 de Google.
  • La herramienta de demostración se puede probar de forma gratuita para los usuarios de Estados Unidos.

GoogleUna nueva herramienta de inteligencia artificial facilita la creación y remezcla de conceptos visuales. En lugar de pedirle que describa lo que tiene en mente, Whisk le permite ingresar tres indicaciones de imagen: una para el tema, otra para la escena y otra para el estilo. Whisk se encarga del resto, lo que hace que sea aún más fácil probar diferentes ideas.

Mientras que la mayoría Los mejores generadores de imágenes con IA Requiere que usted escriba un reclamo detallado y Whisk se encarga de eso detrás de escena. Cuando colocas imágenes en la interfaz web de Whisk como inspiración, Google mellizo El modelo los analiza automáticamente y escribe un comentario detallado para cada uno. Estos luego son alimentados Imagen 3 Plantilla, para crear una imagen coincidente.

[ad_2]

Source Article Link

Categories
Entertainment

La nueva herramienta de inteligencia artificial de Google, Whisk, utiliza imágenes como indicaciones

[ad_1]

Google aún no lo ha hecho último Herramientas de inteligencia artificial para agregar a la pila. Batidor es un creador de imágenes de Google Labs que le permite utilizar una imagen existente como mensaje. Pero su resultado sólo captura la “esencia” de la imagen inicial en lugar de recrearla con nuevos detalles. Por lo tanto, es mejor realizar una lluvia de ideas y realizar visualizaciones rápidas en lugar de editar la imagen de origen.

La empresa describe a Whisk como “un nuevo tipo de herramienta creativa”. La pantalla de entrada comienza con una interfaz sencilla que contiene entradas para estilo y tema. Esta sencilla interfaz introductoria le permite elegir entre tres estilos preestablecidos: pegatina, pin esmaltado y peluche. Sospecho que Google ha encontrado que estos tres permiten el tipo de resultado aproximado para el que la herramienta de demostración es ideal en su forma actual.

Como puede ver en la foto de arriba, he producido una imagen sólida de un peluche de Wilford Brimley. (Los términos de Google prohíben tomar fotografías de celebridades, pero Wilford se coló por las puertas llevando avena cuáquera, sin alertar a los guardias).

Whisk también incluye un editor más avanzado (que se puede encontrar haciendo clic en Empezar desde cero en la pantalla de inicio). En este modo, puede utilizar el texto o la imagen de origen en tres categorías: tema, escena y estilo. También hay una barra de entrada para agregar más texto para los toques finales. Sin embargo, en su forma actual, los controles avanzados no produjeron resultados que se parezcan a mis consultas.

Por ejemplo, mira mi intento de crear al difunto Sr. Brimley en una escena estilizada al estilo de un retrato de morsa disecada que encontré en línea:

Captura de pantalla de una herramienta de generación de inteligencia artificial que produce imágenes de un hombre que se parece un poco a Wilford Brimley.Captura de pantalla de una herramienta de generación de inteligencia artificial que produce imágenes de un hombre que se parece un poco a Wilford Brimley.

Google/Captura de pantalla de Will Shanklin para Engadget

Escupiendo lo que parece ser el misterioso actor de Wilford Brimley comiendo avena dentro de un marco de caja aerodinámico. Hasta donde puedo decir, este tipo no es un Belushi. Entonces, está claro por qué Google recomienda usar la herramienta más para una “exploración visual rápida” y menos contenido listo para producción.

Google reconoce que Whisk sólo se basará en “algunas propiedades básicas” de su imagen de origen. “Por ejemplo, el sujeto creado puede tener diferente altura, peso, peinado o tono de piel”, advierte la empresa.

Para entender por qué, no busque más que la descripción de Google sobre cómo funciona Whisk bajo el capó. se utiliza Modelo de lenguaje Géminis Para escribir un título detallado para la imagen fuente que está cargando. Luego ingresa esta descripción en un archivo. La imagen 3 es una imagen del generador.. Por lo tanto, el resultado es una imagen incorporada. Géminis habla de tu imagen – No la imagen original en sí.

Whisk sólo está disponible en EE. UU., al menos por ahora. Puedes probarlo en el proyecto. Sitio web de Google Labs.

[ad_2]

Source Article Link