Si lees mucho para la escuela o el trabajo pero prefieres escuchar podcasts, GoogleLa nueva herramienta de descripción general de audio impulsada por IA lo tiene cubierto. También se mostró por primera vez en E/S de Google La función Audio Overviews de este año le permite convertir documentos, diapositivas y otro texto en un programa de audio en el que presentadores de IA discuten el tema. Google está promocionando esta función como una forma para que las personas que aprenden mejor escuchando en lugar de leyendo absorban información compleja. La función personaliza el aprendizaje para usted si prefiere escuchar un tema que se discute en lugar de leer informes.
La descripción general del audio es parte de cuaderno LM Una aplicación para tomar notas que se presentó a principios de este año. La función se basa en los modelos de IA Gemini de Google para resumir y organizar documentos, ampliándolos con IA de voz. La parte más interesante es que no es solo una voz de IA que lee el mismo resumen de texto; Escucharás personajes sintéticos hablando entre sí sobre documentos. Los anfitriones virtuales explican el tema y las conexiones entre los diferentes temas en los documentos. Intentan hacer que el estudio y la investigación sean más fáciles o al menos algo que puedas disfrutar mientras conduces. La discusión de ida y vuelta incluso incluye chistes y bromas, como si le hubieran asignado un episodio de podcast muy específico solo para usted. Puede escuchar un ejemplo a continuación basado en este blog de Google. correo En NotebookLM.
Tus compañeros podcasters de IA
NotebookLM incluye un botón Crear en la aplicación para crear una descripción general de audio de un cuaderno. Una vez creada la descripción general, puedes descargar el archivo y escucharlo cuando quieras. El audio se crea utilizando únicamente los archivos que usted cargó; Sin embargo, no hay investigaciones adicionales, por lo que no es una guía de estudio completa. Además, como ocurre con todo el contenido generado por IA, tenga cuidado con las alucinaciones y la desinformación.
En I/O, Google prometió versiones más avanzadas de Audio Overviews. Esto incluye interacción en tiempo real, no solo una experiencia de escucha pasiva. Esto transformará el audio de un podcast en un programa de radio con una audiencia de una persona y presentadores que solo quieren hablar sobre un conjunto de información muy específico. Si bien Google centra las descripciones generales de audio en investigaciones y estudios académicos o de otro tipo, es muy fácil imaginar el uso de la misma tecnología para informes de noticias altamente enfocados (y conversacionales) o tal vez incluso una forma de obtener todas las actualizaciones sobre sus amigos y familiares desde sus redes sociales. publicaciones en los medios.