Categories
News

Google patenta un asistente de gafas inteligentes que se adapta con sugerencias basadas en la mirada y la voz del usuario

[ad_1]

Google Se ha concedido una patente para un asistente robótico que puede utilizarse para hacer sugerencias a un usuario que lleva gafas inteligentes y adaptarlas en función de lo que el usuario está mirando o de sus instrucciones verbales. Si bien Google estaba trabajando anteriormente en un par de gafas inteligentes que se basan en tecnología de realidad aumentada (AR), la empresa se dice El año pasado abandonó sus gafas inteligentes AR “Project Iris” en favor de la construcción de dispositivos similares para socios OEM. Actualmente no está claro si la empresa lanzará un par de gafas de realidad aumentada basadas en la tecnología descrita en su última patente.

El Asistente de Google para gafas inteligentes puede identificar características ambientales que sean de interés para el usuario

en un documento (a través de 91Mobiles) Publicado en el sitio web de la Organización Mundial de la Propiedad Intelectual (OMPI) y titulado “Adaptación de las sugerencias del asistente presentadas en gafas computarizadas según los cambios en la mirada del usuario y/u otras entradas del usuario”, la compañía describe el uso de un asistente “automatizado”. que puede adaptarse a la entrada de audio y video que el usuario presenta con un par de gafas inteligentes.

El documento de patente de Google muestra Adaptive Assistant en acción (haga clic para ampliar)
Fuente de la imagen: OMPI/Google

La compañía dice que el asistente automatizado podrá hacer sugerencias en la pantalla de las gafas inteligentes y los usuarios podrán seleccionar estas opciones utilizando tecnología que rastrea la “mirada” del usuario. Esto sugiere que el dispositivo tendrá algún tipo de seguimiento ocular que el asistente podrá utilizar.

Cuando el usuario mira hacia otra parte, el asistente podrá utilizar la cámara y el micrófono de las gafas inteligentes para “adaptar” dinámicamente sus sugerencias, en función del punto de vista del usuario y de las instrucciones verbales, respectivamente.

Google pone el ejemplo de un usuario que lleva gafas mientras explora una ciudad extranjera. El dispositivo hará sugerencias de restaurantes según la dirección de su mirada (Figura 2b). Los usuarios podrán convocar al asistente tocando las gafas o usando una frase de activación.

Según el documento, el Asistente también limitará la cantidad de sugerencias que aparecen en la pantalla de las gafas inteligentes, ya que demasiadas sugerencias pueden obstruir la visión del usuario. Estas sugerencias se pueden seleccionar basándose en gestos o mediante un comando hablado. La patente también indica que el asistente puede interactuar con otras aplicaciones del dispositivo.

La compañía también describe la capacidad de “descargar tareas computacionales” a un dispositivo servidor que permitiría a las gafas inteligentes “conservar recursos computacionales”, proporcionando de manera efectiva una duración adicional de la batería. Esto significa que el asistente puede estar alojado en el servidor o en las gafas inteligentes, mientras que las operaciones relacionadas con las operaciones del asistente pueden realizarse en cualquiera de los dos dispositivos.

[ad_2]

Source Article Link

Categories
News

Es posible que la aplicación Pixel Recorder pronto obtenga una función de “Voz clara” para reducir el ruido de fondo

[ad_1]

Google Google está desarrollando una nueva función para su aplicación nativa Pixel Recorder para eliminar el ruido de fondo y permitir una reproducción de voz más clara al grabar audio en sus teléfonos inteligentes, según un informe. Fue detectado durante el proceso de desmontaje del APK de la aplicación de Android. La aplicación es exclusiva de la gama de dispositivos Pixel de Google, como la última serie Pixel 9, y ofrece funciones como duplicación y etiquetado de altavoces, con tecnología de inteligencia artificial (Amnistía Internacional).

Función de sonido claro en Pixel Recorder

en un un informeAndroid Authority, en colaboración con Assemble Debug, destacó que la función Clear Voice se descubrió después de desmantelar el APK de la versión 4.2.20241001.701169069 de la aplicación Recorder. Como sugiere el nombre, bloqueará el ruido de fondo y priorizará el contenido hablado cerca del teléfono.

El informe revela que internamente se lo denomina “hdmic” y está desactivado de forma predeterminada para nuevas grabaciones. Una inmersión más profunda en el código de la aplicación reveló cadenas que mencionan la función que dice “Reducir el ruido de fondo durante la grabación para una reproducción de voz más clara”.

Sin embargo, existen algunas advertencias. Para empezar, utiliza el micrófono interno del teléfono y no funciona con micrófonos externos. Además, no admite audio estéreo y solo admite audio mono.

Se informa que la función está inactiva en este momento, e incluso descargar la última versión de la aplicación Grabadora para dispositivos Pixel no parece activarla. Se dice que requiere un componente del lado del servidor para la activación.

Acceso directo a la aplicación de marcador

Google en junio Anunciar Una nueva actualización de la aplicación Grabadora que introdujo un acceso directo a la pantalla de inicio. Aparece como un círculo rojo sobre un fondo blanco, idéntico al botón de acción flotante (FAB) más grande. El nuevo acceso directo de grabación ahora se puede colocar en la pantalla de inicio para comenzar a grabar rápidamente. Se dice que su llegada proporciona un impulso a las capacidades de transcripción directa a través de su acceso rápido.

Para lo último Noticias de tecnología y ReseñasSiga Gadgets 360 en incógnita, Facebook, WhatsApp, Temas y noticias de google. Para ver los últimos vídeos sobre gadgets y tecnología, suscríbete a nuestro canal. canal de youtube. Si quieres saber todo sobre los top influencers, sigue nuestra web ¿Quién es ese 360? en Instagram y YouTube.


Amazon Web Services (AWS) lanza comprobaciones lógicas automatizadas en versión preliminar para combatir las alucinaciones de la IA



[ad_2]

Source Article Link

Categories
Featured

Tim Cook no dejará Apple hasta que escuche una voz en su cabeza que se lo indique

[ad_1]

  • Tim Cook se sentó con Wired para una amplia entrevista
  • Enfatizó que Apple aún no ha considerado cobrar por las funciones de IA.
  • Cook arrojó algo de luz sobre el rendimiento del Vision Pro, aunque de forma indirecta

Amo Tim Cook. Ahora hace mucho tiempo manzana El director ejecutivo es generoso, inteligente y lo más parecido a una esfinge humana que puedas imaginar. Rara vez deja caer noticias importantes, ya sea de manera casual o cuando los medios lo cuestionan.

Cocinero no decepcionó Su última y amplia entrevista es con Steven Levy de Wired.. Uno de los mejores en el negocio, Levi acribilló a Cook con preguntas sobre todo, desde iPhone 16 Nuevo botón de control de cámara. inteligencia de manzanaLa empresa y su propio legado. Cook no dio exactamente la noticia, pero hubo áreas en las que reveló más sobre sí mismo, algunas de las decisiones estratégicas de Apple relacionadas con la IA y la realidad mixta, y lo que viene a continuación para el propio Cook.

[ad_2]

Source Article Link

Categories
News

Hume ofrece control de voz interpretable para personalización de voz con IA

[ad_1]

Hume, con sede en Nueva York inteligencia artificial (AI) presentó el lunes una nueva herramienta que permitirá a los usuarios personalizar voces de inteligencia artificial. La nueva función, llamada Control de voz, tiene como objetivo ayudar a los desarrolladores a integrar estas voces en sus chatbots y otras aplicaciones basadas en inteligencia artificial. En lugar de ofrecer una amplia gama de sonidos, la empresa ofrece un control preciso sobre 10 dimensiones diferentes de sonidos. Al especificar los parámetros requeridos en cada dimensión, los usuarios pueden crear sonidos únicos para sus aplicaciones.

La empresa detalló la nueva herramienta de inteligencia artificial en un documento. Publicación de blog. Hume dijo que está tratando de resolver el problema para que las empresas encuentren la voz de IA adecuada que coincida con su identidad de marca. Con esta función, los usuarios pueden personalizar diferentes aspectos de la percepción de la voz y permitir a los desarrolladores crear una voz más asertiva, relajada y enérgica para aplicaciones basadas en IA.

El control por voz de Hume se encuentra actualmente en versión beta, pero cualquier persona registrada en la plataforma puede acceder a él. Los empleados de Gadgets 360 pudieron acceder a la herramienta y probar la función. Hay 10 dimensiones diferentes que los desarrolladores pueden ajustar, incluidas la sensualidad, la asertividad, la flotabilidad, la confianza, el entusiasmo, la relajación, la suavidad, la frescura y la rigidez.

En lugar de agregar personalización basada en reclamos, la compañía agregó un control deslizante que va de -100 a +100 para cada una de las métricas. La empresa afirmó que se adoptó este enfoque para eliminar la ambigüedad asociada con la descripción textual de la voz y proporcionar un control preciso sobre los idiomas.

En nuestras pruebas, descubrimos que cambiar cualquiera de las 10 dimensiones produce una diferencia audible en la voz de la IA, y la herramienta pudo separar correctamente las diferentes dimensiones. La compañía de IA afirmó que esto se logró desarrollando un nuevo “enfoque no supervisado” que preserva la mayoría de las características de cada sonido subyacente cuando se varían parámetros específicos. Vale la pena señalar que Hume no detalló la fuente de los datos obtenidos.

En particular, después de crear la voz de IA, los desarrolladores deberán implementarla en la aplicación configurando el modelo de IA para Empathic Voice Interface (EVI). Si bien la compañía no lo especificó, es probable que se haya utilizado el modelo EVI-2 para esta función experimental.

En el futuro, Hume planea ampliar la gama de sonidos básicos, introducir dimensiones interpretables adicionales, mejorar la preservación de las propiedades del sonido bajo modificaciones extremas y desarrollar herramientas avanzadas para analizar y visualizar propiedades del sonido.

[ad_2]

Source Article Link

Categories
Featured

La inteligencia artificial controlada por voz algún día podría reemplazar al mouse y al teclado

[ad_1]

Experimentos antrópicos para darle inteligencia artificial a Claude Toma el control de tu computadora Adquieren un tono nuevo, literalmente. El control por voz puede potencialmente cambiar la forma en que funciona su dispositivo. El asistente de desarrollo de IA se ha asociado con Hume AI y la nueva Empathic Voice Interface (EVI) 2 para que Claude comprenda las emociones detrás de nuestras palabras y responda de la misma manera.

Esto es más que simplemente igualar tus gustos en la conversación. Facilita la conexión entre lo que dices y cómo Cloud puede controlar tu computadora. Básicamente, EVI 2 convierte tu voz en texto y lo envía a la nube. Luego, Claude controla la computadora, mueve el mouse, hace clic en los botones e incluso toma capturas de pantalla. Luego, Claude utiliza un lenguaje sencillo para explicar el proceso, que es un texto que EVI convierte en un habla natural y humana. Es una conversación y una forma de completar tareas en la computadora sin usar mouse o teclado.

[ad_2]

Source Article Link

Categories
News

WhatsApp está implementando mensajes de texto de voz con soporte para inglés y otros idiomas

[ad_1]

WhatsApp El jueves lanzó una nueva función destinada a hacer que compartir mensajes de voz sea más conveniente. Ofrece mensajes de texto de voz en WhatsApp para Androide y iOS plataformas, lo que permite a los usuarios ver una transcripción de un mensaje de voz recibido de otras personas. Se dice que esta característica es útil mientras está en movimiento o en un ambiente ruidoso. Esta novedad se produce tras la reciente implementación de WhatsApp. Liberado Una etiqueta de borrador para mensajes no leídos en chats y un nuevo widget de pantalla de inicio para su aplicación iOS.

Textos de mensajes de voz de WhatsApp

en un blog correoWhatsApp ha aclarado que los textos de los mensajes de voz se generan en el dispositivo y nadie más puede escuchar ni leer el contenido de los textos. La compañía confirmó que los mensajes de voz aún están protegidos mediante el cifrado de extremo a extremo de la plataforma de mensajería instantánea.

La función debe activarse antes de su uso. Una vez que cambia, el texto aparece automáticamente debajo del mensaje de voz en el idioma seleccionado. Según la empresa, sólo el destinatario podrá ver una copia del mensaje de voz y no el remitente.

WhatsApp dice que actualmente solo admite inglés, portugués, español y ruso en la plataforma Android, mientras que su aplicación para iOS admite varios otros idiomas, incluidos árabe, chino, francés, alemán, italiano, japonés, noruego, tailandés y turco. y sueco.

Cómo utilizar esta función:

  1. abrir WhatsApp Configuración > Chats
  2. Cambiar Textos de mensajes de voz. Activar o desactivar y seleccionar el idioma deseado.
  3. Mantenga presionado un mensaje de voz, luego toque copias.
  4. Toque el ícono de expandir en el mensaje de voz para revelar más transcripciones.

WhatsApp dice que el texto puede tardar algún tiempo en aparecer. Si los usuarios encuentran el error “Texto no disponible”, puede deberse a un idioma de texto no compatible, ruido de fondo de palabras irreconocibles o un idioma de mensaje de voz no compatible. La compañía también recomienda precaución ya que las transcripciones de mensajes de voz pueden ser inexactas.

[ad_2]

Source Article Link

Categories
Featured

Revisión de SwannBuddy4K: un timbre con video con su propio asistente de voz

[ad_1]

SwannBuddy4K: revisión de 2 minutos

Fundada en Melbourne en la década de 1980, la empresa australiana Swann puede no ser un nombre muy conocido. Sin embargo, tiene una excelente reputación en la industria de la seguridad gracias a su amplia gama de cámaras de vigilancia inteligentes para interiores y exteriores. Hemos revisado varios de ellos aquí en TechRadar y, si bien no siempre son los más elegantes, tienden a ser algunos de los más confiables del mercado: están sólidamente construidos con software intuitivo y ofrecen un rendimiento decente (consulte nuestra guía para… Las mejores cámaras de seguridad para el hogar. Para nuestras recomendaciones más importantes).

el cisne 4k Parece que el timbre con vídeo no es una excepción. Visualmente es bastante similar a Timbre con vídeo inteligente de Yale Revisado recientemente. Esto significa que es más voluminoso que algunos timbres que existen, pero parece bien hecho.

[ad_2]

Source Article Link

Categories
Featured

La IA alivia la presión de los empleados de los centros de llamadas al mejorar sus ojos, oídos y voz

[ad_1]

Monitorear los tiempos de las llamadas, optimizar los horarios de los agentes y los análisis justo a tiempo, sin mencionar la capacidad de ver todo el recorrido del cliente en tiempo real y en tiempo histórico, garantiza que los agentes tengan recursos y datos bajo demanda para manejar operaciones complejas. cliente Aplicaciones – beneficios inteligencia artificial (Inteligencia Artificial) en el servicio al cliente es enorme y sólo se ha logrado parcialmente.

valor Amnistía Internacional No solo reemplazar puestos de trabajo, sino realizar trabajos que mejoren los oídos, los ojos y la “voz” del call center, sus agentes, para que ambos puedan, en pocas palabras, hacer mucho mejor su trabajo de atender al cliente. Explica cómo encontrar el camino a través del ruido de la IA hacia las cuatro áreas donde la IA aportará el mayor valor a los centros de contacto y a los empleados.

[ad_2]

Source Article Link

Categories
Bisnis Industri

WhatsApp finalmente admite la transcripción de mensajes de voz

[ad_1]

WhatsApp sigue el ejemplo de iMessage y finalmente agrega soporte para mensajes de texto de voz. Esto permitirá que la aplicación muestre transcripciones de notas de audio cuando no puedas escuchar el audio en sí.

Meta beta ha estado probando la transcripción de mensajes de voz en WhatsApp durante más de un año antes de lanzarla al público.

Habilite la transcripción de mensajes de voz yendo a la configuración de WhatsApp

Apple proporcionó Transcribe mensajes de voz en iMessage con iOS 17 En 2023, las notas de voz proporcionan una manera fácil y rápida de enviar mensajes largos sin la molestia de escribirlos.

Sin embargo, el destinatario puede estar en un lugar público o ruidoso, lo que le dificulta escuchar la nota de voz en ese momento. Aquí es donde la transcripción de audio resulta útil, ya que proporciona una versión escrita del mensaje de audio recibido para que el destinatario pueda leer y comprender su contenido.

Para usar voz a texto en WhatsApp, obtenga la última versión en la App Store. Entonces ve a Configuración > Chats > Transcribir mensajes de voz Y habilite la función. A continuación, para transcribir una nota de voz, manténgala presionada y seleccione Traducir.

La función se está implementando gradualmente.

Avisos de whatsapp en anuncio Este mensaje se está implementando gradualmente, por lo que es posible que la función no aparezca inmediatamente en su teléfono. Por razones de privacidad, las transcripciones de mensajes de voz se generan completamente en el dispositivo y no afectan el cifrado de extremo a extremo de la nota de voz compartida.

En iPhone, la transcripción de mensajes de WhatsApp funciona en varios idiomas, incluidos inglés, español, francés, alemán, italiano, japonés, coreano, portugués, ruso, turco, chino, árabe, hebreo, sueco, tailandés y más.

En comparación, la función funciona en Android sólo en cuatro idiomas: inglés, portugués, español y ruso.

Meta está trabajando para agregar soporte para más idiomas en el futuro. Tenga en cuenta que es posible que el texto del mensaje no siempre sea exacto. Si la nota de voz contiene mucho ruido de fondo, el proceso de transcripción puede fallar.



[ad_2]

Source Article Link

Categories
Business Industry

La actriz de voz de Milhouse, Pamela Hayden, deja la serie después de 35 años.

[ad_1]






Todo lo bueno tiene que llegar a su fin. A pesar de “Los Simpson”, que ya va por su 36ª temporada, incluyó un final falsoNever Ends, nos dice adiós uno de los principales actores del programa que lleva 35 años allí. Pamela Hayden, la voz detrás de personajes como Milhouse, Jimbo Jones y muchos otros, ha anunciado su retiro de la clásica serie animada. Su aparición final se transmitirá dentro de unos días. Entonces el espectáculo tendrá que continuar sin ella.

La última aparición de Hayden será en el episodio de esta semana titulado “Treehouse of Horror Presents: Simpsons Wicked This Way Comes”. El anuncio se realizó a través de un video tributo (que puedes ver a continuación). Presenta a Hayden compartiendo su amor por Milhouse en particular, así como también por algunos de los otros personajes a los que ha expresado en “Los Simpson” a lo largo de los años. de acuerdo a El tiempo de entregaFox comenzará a elegir nuevos actores para asumir sus papeles. Hayden dijo esto sobre su fallecimiento en un comunicado:

“Ha llegado el momento de colgar el micrófono, pero ¿cómo puedo despedirme de Los Simpson?… No fácilmente. Ha sido un honor y una alegría trabajar en un programa tan divertido, inteligente e innovador, y para dar voz a Milhouse, Jimbo Jones y Rod Flanders, Janie, Malibu Stacy y muchos más.

A medida que la serie ha ido envejeciendo, otros personajes y los actores detrás de ellos han tenido que ser reemplazados. Marcia Wallace, quien dio voz a la Sra. Krabappel, murió en 2013. Con Kerry Washington finalmente asumiendo el cargo de nueva maestra de Bart, Rachel Peyton.. La repentina muerte de Phil Hartman en 1998 marcó el final de muchos de sus personajes. Pero mientras Hayden se separa del programa, parece que los personajes a los que expresó permanecerán.

Pamela Hayden es la heroína anónima de Los Simpson


Decir que esto es un gran éxito sería quedarse corto. Si bien Dan Castellaneta (Homer), Nancy Cartwright (Bart) y Harry Shearer (Ned Flanders), así como el resto del elenco principal del programa, son celebrados regularmente, no se pueden subestimar las contribuciones de Hayden. Milhouse ha sido la fuente de algunos de los momentos más memorables de la serie, desde “It's All Coming to Milhouse” hasta “Thrillhouse”. Sin mencionar que es un personaje importante en algunos de los mejores episodios de Los Simpson en general.. Y este es sólo un personaje. Hayden también es responsable de momentos inolvidables para personajes como Rod Flanders, Jimbo y otros personajes que ha interpretado a lo largo de los años.

“Bart necesitaba alguien con quien hablar en la cafetería de la escuela. Lo llamábamos Milhouse porque ese es el nombre más malo que cualquier niño podría tener”, dijo el creador de Los Simpson, Matt Groening, en respuesta a la salida de Hayden. “Pamela nos hizo reír mucho con Milhouse, el desventurado niño con la nariz más grande de Springfield. Hizo que Milhouse fuera divertido y real, y la extrañaremos”.

El programa ha superado los cambios de audio antes, Como cuando Hank Azaria dejó de darle voz a Apu en Los Simpson Después de la presión de la gente, no estuvieron de acuerdo con que el personaje fuera un estereotipo indio obsoleto expresado por un hombre blanco. Pero reemplazar a Hayden parece ser, en el mejor de los casos, un gran desafío. En el peor de los casos, la serie podría correr el peligro de perder algunos personajes clave. ¿Quizás sea hora de deshacerse de él después de todos estos años? Por ahora, tenemos una última actuación de Hayden que esperar.

“Treehouse of Horror Presents: Simpsons Wicked This Way Comes” se transmite el domingo 24 de noviembre de 2024 por Fox.



[ad_2]

Source Article Link