Google I/O 2024: se presenta el modelo de texto a imagen con IA Imagen 3, con capacidades mejoradas de creación de imágenes


Google hizo varios anuncios nuevos en su conferencia anual centrada en desarrolladores Google I/O 2024 Ocurrió. Entre muchos inteligencia artificial (Amnistía Internacional) De los anuncios específicos realizados durante la sesión principal, uno fue particularmente sorprendente. El gigante tecnológico ha presentado su modelo de IA de próxima generación para la conversión de texto a imagen, Imagen 3. El nuevo modelo de IA se presentó pocos meses después del lanzamiento de su predecesor Imagen 2, que se lanzó en diciembre de 2023 y posteriormente se lanzó. promoción El mes pasado. La compañía dijo que el nuevo modelo puede crear imágenes detalladas y realistas siguiendo estrictamente las instrucciones.

Imagen 3 fue presentada por Douglas Ek, director senior de investigación de Google DeepMind. “Hoy estoy muy emocionado de presentar Imagen 3”, dijo durante su presentación. “Es nuestro modelo de generación de imágenes más capaz hasta el momento. Entiende las indicaciones escritas de la misma manera que la gente escribe. Cuanto más creativo y detallado sea, mejor. Además, este es nuestro mejor modelo hasta el momento para mostrar texto, lo que ha sido un desafío para los modelos de generación de imágenes.

Se dice que la capacidad del modelo de IA para comprender indicaciones ha mejorado significativamente, lo que ahora le permite seguir las indicaciones más de cerca para captar pequeños detalles y crear una imagen precisa. Esta también pareció ser la tendencia común de la mayoría de los anuncios relacionados con la IA durante el evento, ya que la mayoría de los modelos de IA ahora pueden comprender mejor las afirmaciones. Google Añadió que Imagen 3 estará disponible en múltiples versiones y cada modelo estará optimizado para un tipo específico de tarea que puede ir desde la creación de dibujos rápidos hasta la creación de imágenes de alta resolución.

See also  How to learn dropshipping with Google Bard

Para permitir que Imagen 3 capture pequeños detalles e instrucciones específicas, como ángulos de cámara o composiciones en indicaciones largas y complejas, Google entrenó el modelo de IA utilizando imágenes que tenían descripciones detalladas en sus leyendas, lo que le permitió capturar matices más pequeños. También puede crear una variedad de texturas y mostrar imágenes basadas en texto.

Centrándonos en la seguridad, cada imagen creada con Imagen 3 contendrá una marca de agua SynthID. Incorpora una marca de agua digital directamente en los píxeles de la imagen, lo que hace imposible eliminarla recortando, compartiendo o realizando ajustes en la imagen. Se espera que el modelo de IA llegue a una versión preliminar pública en los próximos meses. Actualmente, Google está trabajando para agregar opciones de edición en Dibujo y Dibujo externo. Imagen 3 está actualmente disponible en vista previa privada dentro de ImageFX para creadores seleccionados. Pronto estará disponible para los clientes empresariales de los gigantes tecnológicos.


Los enlaces de afiliados pueden generarse automáticamente; consulte nuestro sitio web Declaración de ética Para detalles.

Para lo último Noticias de tecnología Y ReseñasSiga Gadgets 360 en X, Facebook, WhatsApp, Hilos Y noticias de Google. Para ver los últimos vídeos sobre gadgets y tecnología, suscríbete a nuestro canal. Canal de Youtube. Si quieres saber todo sobre los top influencers, sigue nuestra web ¿Quién es ese 360? en Instagram Y YouTube.


Redmi K70 Ultra visto en el sitio web de certificación 3C; Se recomienda obtener el SoC MediaTek Dimensity 9300+





Source Article Link

Leave a Comment