Los generadores de imágenes impulsados por IA pueden hacer cosas impresionantes, pero a menudo están limitados por su capacidad para explicar con palabras su visión de un reclamo. Incluso cuando la IA puede traducir tus palabras en la imagen que tienes en tu cabeza de alguna manera, puede resultar difícil obtener la combinación correcta de personajes, ubicación y estilo en una sola imagen.
DALL-E u otras herramientas pueden crear imágenes basadas en las imágenes que usted carga, pero incluso así, puede ser difícil obtener la combinación correcta. Esto es lo que hace nuevo Google La experiencia de batir es muy interesante.
Utilizando Google Gemini y el modelo de creación de imágenes Imagen 3, Whisk puede crear imágenes completamente nuevas combinando imágenes existentes. Whisk evita la molestia de la poesía descriptiva tomando imágenes designadas como tema, escena o estilo e incorporándolas apropiadamente. Si prefiere no buscar la imagen adecuada para uno o más de estos aspectos, puede describirla y ver qué hace Google con ella antes de crear el modelo final.
Por ejemplo, pude tomar una foto de mi perro y pedir verlo como un muñeco, un alfiler esmaltado y una calcomanía, y luego obtuve los resultados a continuación.
como azotar
Batidor Disponible en Google Labs, aunque por el momento sólo está disponible en EE.UU. Una vez que estés dentro, la interfaz es sorprendentemente simple. Tiene tres espacios para cargar una imagen, escribir un mensaje que Google amplíe o solicitar una imagen aleatoria de la biblioteca de Google. Puedes elegir el sujeto o sujetos de la foto, lo que significa que no se limita a una sola persona y puede ser una persona, un animal u un objeto. Luego eliges la escena, el fondo o la ubicación que deseas. Finalmente, puedes seleccionar el estilo, que puede ser literalmente cualquier forma de arte, o incluso un objeto elaborado como un animal de peluche.
Cada foto tiene una descripción de texto escrita por Gemini que puedes cambiar si crees que la foto está incorrecta. O, si se trata de una imagen generada, puedes manipular la descripción para obtener algo más. Luego puedes agregar más detalles a la imagen final, por ejemplo, hacer que mi perro se balancee sobre una pelota con un sombrero divertido.
Con estos elementos en su lugar, Whisk crea dos imágenes que no solo recopilan sus entradas, sino que también las interpretan. esto no es asi Photoshop Capas. Es una cultura remix completa de la inteligencia artificial.
Los azotes son mejores cuando se inclinan hacia lo inesperado y divertido. Whisk se nutre de la experimentación, lo que significa que la mitad de la diversión es observar cómo interpreta sus entradas tremendamente desiguales. A veces funciona; A veces te quedas con algo muy extraño. De cualquier manera, es una victoria.
Por ejemplo, la primera imagen a continuación comenzaba con la imagen de un reloj de bolsillo, una estantería y un cuadro gótico. El segundo utilizó una foto de un cantante de rock, una foto de un antiguo callejón de la ciudad de Nueva York y una descripción escrita del arte de los cómics clásicos antiguos. El tercero tomó una fotografía de un oso en libertad, una fotografía de un antiguo restaurante y una ilustración de un libro para niños. Los resultados hablan por sí solos.
Escamotear
Aunque Whisk es intuitivo, algunos trucos pueden ayudarte a sacarle el máximo partido. Usar fotografías de alta calidad es de gran ayuda, especialmente si desea acercar el sujeto al personaje u objeto original. La IA hace su mejor trabajo cuando sabe lo que está mirando.
Además, piense fuera de lo común. Nunca se sabe a qué conducirán estas combinaciones. Y si no funciona como te gustaría, es mucho más fácil subir nuevas fotos de la persona o lo que quieras con lo que quieras que juegue la IA. Finalmente, siempre puedes editar tus subtítulos y entradas básicas para obtener resultados más precisos.
El hecho de no necesitar indicaciones escritas con precisión probablemente hace que Whisk sea más atractivo para la persona promedio. Sin embargo, es probable que enfrente más críticas por parte de los creadores cuyo trabajo se ha utilizado para entrenar los modelos de IA detrás de él.
Sin embargo, si tienes dificultades para traducir tu visión creativa en palabras, un creador de imágenes con IA que se centra en imágenes en lugar de vocabulario podría ser tu nuevo juguete favorito, incluso si es solo para ver cómo te verías si fueras un peluche. personaje.