OpenAI está implementando el modo ChatGPT Advanced Voice en el navegador
Sólo los suscriptores pagos tendrán acceso en este momento.
Es un primer paso vital hacia los agentes de inteligencia artificial basados en navegador de ChatGPT
Ha sido un momento muy ocupado para ChatGPT y AbiertoAI. Tras los rumores de que el modo ChatGPT Advanced Voice (la capacidad de tener una conversación fluida con IA) está a punto de finalizar Adquirir la capacidad de “ver”y restar Aplicación ChatGPT de Windows para todos los usuarios gratuitos La semana pasada, anuncié que el modo de audio avanzado ahora está disponible en la versión de ChatGPT basada en navegador, solo para suscriptores pagos.
Entonces, si es suscriptor de ChatGPT Plus o Teams, visite ChatGPT.com (o su sitio recién adquirido) Chat.com Domain) pronto le dará acceso a la opción de modo de audio avanzado que anteriormente solo estaba disponible en las versiones de la aplicación ChatGPT.
El modo de audio avanzado ChatGPT se lanzó en septiembre para dispositivos móviles y recientemente se agregó a las aplicaciones de escritorio. La versión del navegador se describe como “continua”, por lo que es posible que no vea el modo de audio avanzado cuando inicie sesión con ChatGPT (actualmente no tenemos acceso), pero eso debería cambiar en los próximos días.
Los usuarios gratuitos eventualmente también tendrán acceso al modo de audio avanzado. en un correo En X.com, que también tiene un vídeo que demuestra cómo funciona el modo de voz avanzado ChatGPT en el navegador, Kevin Weil, CPO de OpenAI, dijo: “Buscaremos implementarlo para usuarios gratuitos en las próximas semanas”.
Próximamente para usuarios pagos de ChatGPT esta semana: ¡Modo de voz avanzado en la Web! 😍 Lanzamos el modo de voz avanzado en nuestras aplicaciones de iOS y Android en septiembre, y recientemente lo agregamos a nuestras aplicaciones de escritorio (https://t.co/vVRYHXsbPD), y ahora estamos entusiasmados de agregar la web a la mezcla. Esto significa… pic.twitter.com/HtG5Km2OGh19 de noviembre de 2024
Operadores de inteligencia artificial
El modo de voz avanzado ChatGPT es un primer paso vital hacia el rumoreado ChatGPT Player Agent, una herramienta que puede cambiar la forma en que interactuamos con las computadoras y la tecnología en general.
El agente operador ChatGPT es un agente de inteligencia artificial que puede interactuar directamente con su computadora en su nombre. Los agentes no son exclusivos de OpenAI: todos, desde antropólogos hasta… Google y microsoft También está desarrollando agentes de IA autónomos que pueden ver e interactuar con lo que hay en su pantalla. Podría, por ejemplo, contratar a un agente de inteligencia artificial para pagar sus facturas o reservarle unas vacaciones, llevando el modelo de asistente virtual al siguiente nivel. El control por voz en el navegador será un primer paso necesario para utilizar un agente de IA, ya que la mayor parte de su trabajo se basará en el navegador.
No espere que los anuncios de OpenAI disminuyan antes de fin de año. todavía estamos esperando Buscar ChatGPTque se lanzó recientemente para usuarios pagos, estará disponible para los usuarios del nivel gratuito en cualquier momento. Se lanzó con la nota: “Lo implementaremos para los usuarios de forma gratuita durante los próximos meses”.
Regístrese para ser el primero en enterarse de las ofertas imperdibles del Black Friday en la mejor tecnología y obtenga todo su contenido favorito de TechRadar.
Después de una larga espera, el iPhone ahora tiene su propio dispositivo independiente Aplicación Google Géminis Permitir a los usuarios acceder a la inteligencia artificial chatbot Más rápido y más fácil que nunca. Aún más emocionante que el lanzamiento de la aplicación en sí es la inclusión de Gemini Live, un increíble asistente de voz impulsado por IA. ChatGPTModo de sonido avanzado.
Géminis en vivo Es una gran herramienta que puede ayudarte a utilizar la IA de una forma conversacional que resulta inquietantemente realista, como si tuvieras tu propio asistente personal en el bolsillo. Gemini Live te responde fácilmente e incluso puede entender cuando retrocedes a mitad de una frase. Lo mejor de todo es que Gemini Live se ejecuta sin problemas en iOS y se puede reproducir desde el botón de acción superior de tu iPhone.
Gemini Live puede resultar intimidante al principio; después de todo, es muy extraño hablar con una voz de IA. Sin embargo, lo cubrimos seleccionando tres usos excelentes para el asistente de voz para comenzar y aprovechar al máximo Gemini Live en iPhone.
1. Recibe consejos sobre una situación difícil.
Gemini Live puede ser un amigo en tu bolsillo cuando necesitas consejos sobre una situación y no tienes a nadie más a quien recurrir. Ya sea que se trate de pedirle a una IA que ayude con disputas laborales, que ofrezca consejos sobre relaciones o incluso que tome decisiones, Gemini Live se siente tan real que hablar con él sobre sus problemas personales se siente extrañamente auténtico.
Simplemente comienza a chatear con Gemini Live como si fuera alguien que conoces desde hace años y pídele consejo sobre una situación difícil, nunca se sabe lo que se le puede ocurrir a Gemini Live, pero al menos es un punto de partida para pensar en el problema. por tu cuenta. No soy partidario del uso de la IA como mejor amiga, pero chatear con Gemini Live de vez en cuando es mejor de lo que cabría esperar, especialmente si estás abierto y escuchas sus sugerencias.
2. Cuente una historia interactiva
Este es probablemente mi uso favorito de Gemini Live porque me recuerda a esos libros de fantasía interactivos basados en dados que amaba cuando era niño. Piensa en una idea y pídele a Pepito Vida que cuente una historia. En mi prueba, dije: “Cuéntame una historia sobre los duendes y Pikachu”, y luego escuché una historia detallada sobre cómo Pikachu se separó de su entrenador y encontró un duende. campamento que considera uno de los suyos.
Puedes intervenir a lo largo de la historia para hacer una lluvia de ideas sobre la progresión de la narrativa y jugar toda la aventura interactiva todo el tiempo que quieras con la ayuda de Gemini Live. Al realizar la investigación para este artículo, me he sentido atraído por el mundo de la fantasía durante más tiempo del que me gustaría admitir. Si eres fanático de los audiolibros, honestamente puedo ver a alguien usando Gemini Live para historias interactivas cuando está aburrido y solo quiere divertirse un poco.
Regístrese para ser el primero en conocer las ofertas imperdibles del Black Friday en la mejor tecnología y obtenga todo su contenido favorito de TechRadar.
3. Obtén ayuda con tu tarea
Gemini Live tiene Google Tener su alcance al alcance de la mano y obtener ayuda con la tarea a través de una voz de IA en lugar de un chatbot se siente mucho más natural. mientras Un usuario informó que Gemini dijo que los “mataría”. Cuando nos pidieron ayuda con la tarea, no tuvimos ninguna experiencia aterradora con el asistente de voz de Google. De hecho, Gemini Live suele ser muy educado cuando se trata de proporcionar datos y ayudar con respuestas a sus preguntas escolares.
Descubrí que Gemini Live funciona mejor con la historia y la ciencia, ya que puede encontrar las respuestas fácilmente. Sin embargo, desafortunadamente, la IA puede alucinar, por lo que definitivamente recomendaría a cualquiera que use Gemini Live como tarea que la verifique antes de enviarla o llevarla a clase.
Bonificación: obtenga un resumen
(Crédito de la imagen: Google)
Este es el último consejo para aprovechar al máximo Gemini Live en iPhone. No importa de qué estés hablando en Gemini Live, puedes pedirle al asistente de voz un resumen de tu discusión para resumir todo lo que se dijo. Esto es increíblemente útil, ya que descubrirá que los chats con Gemini Live generalmente durarán mucho más que su conversación habitual de Chatbot con tecnología de inteligencia artificial.
Gemini Live está disponible de forma gratuita para todos los usuarios de Android e iOS a través de la aplicación Gemini. Pruébelo utilizando algunas de las ideas de este artículo y compruebe lo bueno que es el chat de voz con IA.
Focais Meet One es un dispositivo impulsado por inteligencia artificial que lleva la toma de notas y la grabación de voz a un nuevo nivel. Diseñado para brindar comodidad y precisión, AI Voice Recorder combina el reconocimiento de voz con funciones avanzadas de AI para simplificar la captura y organización de detalles esenciales de las conversaciones.
La función de transcripción AI admite más de 120 idiomas. Esto la convierte en una herramienta ideal para entornos multilingües y para cualquiera que trate con clientes o socios diversos. Ya sea una reunión, una conferencia o una llamada telefónica, Focais Meet One transcribe conversaciones con precisión.
Claro, puedes usar un iPhone. Aplicación de notas de voz Para realizar grabaciones. Pero Focais Meet One AI está diseñado específicamente para el trabajo y ofrece capacidades avanzadas.
Por ejemplo, la función de traducción en la grabadora de voz AI aumenta enormemente su utilidad. Puede salvar las barreras del idioma y facilitar la comunicación entre idiomas. Esta función ha demostrado ser particularmente útil para estudiantes de idiomas o quienes trabajan a través de fronteras, ya que permite un acceso rápido a información esencial en el idioma de su elección.
Además, el Focais Meet One es pequeño (mide 2,4″ x 2,4″ x 0,3″), liviano (0,6 libras) y cuenta con hasta 20 horas de duración de la batería. Para que puedas llevarlo a cualquier parte y usarlo todo el día con una sola carga. También es magnético, por lo que puedes fijarlo a superficies metálicas.
Resumir automáticamente conversaciones largas
Otra herramienta única que distingue a esta grabadora de voz con IA es la función de resumen de conversaciones. Puede condensar automáticamente grabaciones largas en resúmenes claros y concisos. Esto significa que captura puntos clave sin tener que reproducir audio durante horas. Esto lo hace ideal para revisiones urgentes o cuando se centra en información importante de discusiones prolongadas.
El dispositivo se sincroniza perfectamente con su aplicación móvil, lo que le permite controlar la transcripción, la traducción y los resúmenes, todo desde un solo lugar.
Ahorre en la grabadora de voz Focais Meet One con tecnología de inteligencia artificial
el Focais Meet One es una grabadora impulsada por IA activada por voz Ofrece una solución de alta tecnología que brinda claridad y eficiencia para administrar llamadas, reuniones y clases, para que siempre esté listo para revisar los detalles más importantes. Ya está a la venta por sólo $99,99, que es un 32% de descuento sobre el precio normal de $149.
Con OpenAI ingresando al mercado de los motores de búsqueda con Búsqueda de ChatGPT,Google está intensificando sus esfuerzos en inteligencia artificial para mantener su dominio en los motores de búsqueda.
¿Último movimiento? Función de búsqueda por voz y chat en tiempo real directamente dentro de la Búsqueda de Google.
Baliza de aplicación de Google @AssembleDebug en X publicar Vídeo de una nueva función actualmente disponible por Google una prueba, Lo que permite a los usuarios hablar con la Búsqueda de Google dentro de la aplicación móvil de Google.
Velocidad de la luz triturable
Es posible que el tweet haya sido eliminado.
Cómo utilizar la nueva función de búsqueda por voz AI
Usted envía una pregunta o consulta de búsqueda a Google hablando con su dispositivo y Google le proporcionará resultados de búsqueda en respuesta. Luego puede hacer preguntas de seguimiento y la Búsqueda de Google se actualizará en tiempo real para proporcionar también resultados de búsqueda relevantes para esas consultas.
Aunque Google ya ofrece capacidades de búsqueda por voz, anteriormente estaban limitadas a una consulta a la vez. Para hacer otra pregunta, el usuario debía reiniciar el proceso haciendo clic en el botón del micrófono. Con esta nueva actualización, la búsqueda por voz ahora será contextual y conversacional. Una vez que el usuario inicia el proceso, puede continuar con la solicitud de seguimiento sin necesidad de realizar más entradas manuales.
A cambio, Google proporcionará continuamente enlaces de búsqueda y resúmenes basados en inteligencia artificial en respuesta a esas consultas.
La función aún no está disponible públicamente en la aplicación de Google y no se sabe si se lanzará o no. Sin embargo, a medida que OpenAI y otras empresas de IA avancen hacia capacidades de voz a texto, es probable que Google también lance funciones similares para mantenerse al día, por lo que se espera que esta función, o alguna versión de ella, en algún momento en el futuro cercano.
Waze ha facilitado a los conductores informar accidentes en la carretera, con una nueva herramienta que permite informar peligros con la voz.
anunciar en un Publicación de blog Según la aplicación propiedad de Google el jueves, la nueva función Informes de conversación de Waze utiliza el modelo de inteligencia artificial de la compañía. mellizo Para permitirle informar en voz alta sobre cosas como atascos de tráfico, obras y basura aleatoria que se encuentra en la carretera.
Todo lo que tiene que hacer es tocar el botón de informe en la aplicación y hablar en una conversación sobre el incidente, y Gemini lo procesará inmediatamente y lo convertirá en un informe. Si gritas estos detalles con ira o no, depende de ti.
Según Waze, la aplicación puede hacerle preguntas de seguimiento sobre el informe, pidiéndole que proporcione más detalles; por ejemplo, si su colchón está bloqueando el tráfico, es posible que desee especificarlo. Puedes ver cómo funciona en el vídeo de la campaña publicitaria de Waze a continuación, donde el taxista informa el proceso de construcción con un solo clic y hablando en voz alta.
La función de informes de conversaciones estará disponible para los “probadores confiables de Waze” esta semana en todo el mundo como una versión beta en Android e iOS, y se implementará a más usuarios en más idiomas además del inglés “en los próximos meses”.
Esta no fue la única característica que Waze anunció esta semana, ya que la compañía también agregó la capacidad para que los usuarios marquen zonas escolares en un mapa. Una característica muy solicitada. La función, que estará disponible a nivel mundial antes de fin de año, también alerta a otros usuarios sobre las zonas escolares a través de la aplicación. el es el ultimo Fisonomía Se agregó a Waze este año.
Las actualizaciones de Waze se eliminaron el mismo día que Google las anunció Nueva y útil función de diseño para mapasque le brinda la posibilidad de hacer preguntas a la aplicación que generan las respuestas de la IA de Gemini. Se acabaron los días de las plataformas de mapas sin IA.
CLEVELAND – La última vez que supe de él fue hace dos semanas. Como siempre, quería saber sobre sus brownies.
Le gustaba mucho Jim Donovan. marrones de cleveland. Amaba su trabajo como presentador deportivo en WKYC-TV durante casi 40 años, pero amaba aún más a los Browns. Como cualquier fan desde Columbia hasta Chesterland, su ira se desbordó por algunas tonterías a lo largo de los años, pero era un amor incondicional que nunca flaqueó.
Hace dos semanas, mientras el cáncer asolaba su cuerpo, Jimmy me envió un mensaje de texto porque estaba preocupado por Kevin Stefanski y todo el precio que le estaba pasando. Le dije que era fantástico saber de él.
Ese mensaje de texto fue la única comunicación que tuve con él desde el campo de entrenamiento. Le envié un mensaje de texto después de él. Anunció su retiroPero él no respondió de inmediato. Lo entiendo. La respuesta del público tuvo que ser abrumadora.
Nuestro intercambio de hace dos semanas fue el último que compartimos. Donovan murió durante el fin de semana después de una batalla de 20 años contra una enfermedad implacable.
ir más profundo
Jim Donovan, locutor de los Cleveland Browns desde hace mucho tiempo, falleció a la edad de 68 años
Claro, Jimmy ha tratado con su parte de entrenadores a lo largo de los años como la voz de los Browns, pero realmente admiraba y respetaba a Stefanski. No se trataba simplemente de un hombre de la empresa que repetía la línea de la empresa para proteger al entrenador: creía que Stefanski era un hombre inteligente y de gran carácter que era la persona adecuada para liderar una organización con reputación de reaccionar emocionalmente ocasionalmente.
Por eso fue tan cálido cuando vi a Stefanski y al gerente general Andrew Berry pasar el balón del juego a su esposa, Cheryl, y a su hija, Megan, después de la victoria del domingo sobre Cuervos de Baltimore.
“Les dije, muchachos, que nada me encantaría más que darle este balón a la familia de Jim Donovan”, dijo Stefanski a sus jugadores en el vestuario después del partido. “Jim amaba a los Cleveland Browns. Él los amaba a ustedes. Nosotros también lo amamos. Estaremos allí para su familia. Esto es para Jimmie”.
Siempre en nuestros corazones 🤎🧡 Después de la victoria de hoy sobre los Ravens, el entrenador en jefe de los Browns, Kevin Stefanski, y el gerente general, Andrew Perry, entregaron personalmente el balón del juego a la esposa de Jim Donovan, Cheryl, y a su hija Megan.
Siempre esperaba con ansias mis conversaciones con Jimmy. Lo único que amaba más que los chismes de Brown era cualquier pequeño dato que tuviera sobre sus amados Boston Celtics.
Ni siquiera 40 años en Cleveland pudieron curarlo de su atletismo en Boston, especialmente para los Celtics. Lo ocultó bien en el aire, pero Jimmy Amo Sus celtas. Lo conocí por primera vez cuando estaba haciendo programas populares para el Canal 3 cubriendo a los Cleveland Cavaliers y… NBA Hace casi 10 años.
Cada vez que entraba al estudio para grabar un segmento de los Browns con él, pasábamos al menos unos minutos hablando sobre los Celtics y sus posibilidades de ganar un campeonato. Fue el primer jugador en el que pensé cuando Boston venció a los Dallas Mavericks en junio. Lo felicité cuando lo vi en The Greenbrier en julio. Todavía estaba brillando.
Estoy seguro de que Jimmy estuvo con los Browns el domingo. kyle hamiltonDejó caer lo que habría sido una intercepción ganadora. para los Ravens al final del último cuarto porque Jimmy estaba defendiendo la jugada. Justin Tucker Falló un gol de campo de 50 yardas Porque Jimmy pateó su pie vegetariano. Tucker fue lo suficientemente ingenuo como para revisar el césped cuando su pie resbaló. No era hierba. Era Jimmy.
Rashad Bateman Deja que el tráfico profundo de Lamar JacksonRebota en su máscara facial Porque Jimmy empujó el sol quince centímetros hacia el oeste. Bateman miró hacia el cielo brillante con incredulidad. No lo sabía, pero en realidad estaba mirando a Jimmy.
Hace unos seis años, Jimmy y yo nos sentamos a discutir Su viaje con el cáncer en una pieza navideña el atleta. Conduje hasta Hinckley, Ohio, y lo encontré en un restaurante cerca de su casa. Por supuesto que todos en el lugar lo conocen. Compartió una cálida sonrisa con los camareros y algunos clientes habituales que lo dejaron en paz.
Hablamos de cómo conoció a Cheryl en el segundo piso del edificio The Arcade en el centro de Cleveland hace varias décadas. Jimmy iba a conocer a su colega Jim Holly, quien era meticuloso con su cabello y se lo cortaba constantemente. Holly y Donovan estaban comprando corbatas verdes anticipándose al Día de San Patricio, que se acercaba rápidamente. Donovan eligió algo más que una simple corbata ese día. Empezó a charlar con la mujer que le estaba cortando el pelo a Holly. Celebraron su 35 aniversario de bodas en junio.
Hablamos sobre su amor por los deportes de Boston cuando era niño y cómo trabajó en la estación de radio de la Universidad de Boston junto a Howard Stern. Hablamos de sus inicios en la televisión. Y por supuesto, hablamos con todo lujo de detalles sobre su trasplante de médula ósea en 2011.
El nombre del donante era Dallas Gentry, un funcionario penitenciario del suroeste de Virginia que no tenía vínculos con Donovan ni su familia. Era simplemente un tipo que creció para ayudar a la gente y hacer lo correcto, razón por la cual comenzó a donar sangre regularmente cuando tenía 18 años. Una de las mujeres que trabajaba en el banco de sangre finalmente le preguntó si estaba interesado en convertirse en donante de médula ósea.
Gentry realmente no sabía nada al respecto, pero aceptó hacerlo y luego continuó con su vida y no pensó mucho en ello.Catorce años después, recibió una llamada telefónica desde Cleveland. Fue una coincidencia perfecta de 10 puntos para un paciente con cáncer que necesitaba desesperadamente un trasplante.
Los médicos advirtieron a Gentry que sería doloroso para él, pero que el paciente probablemente moriría sin él. Los nobles nunca dudaron. Estaba ansioso por ayudar a un hombre que nunca había conocido antes.
Revisé la historia que taché en ese almuerzo que compartimos mientras ayudaba a escribir su obituario. el atleta Durante el fin de semana.Olvidé esta línea. Me puso la piel de gallina y me rompió el corazón:
“No sé si mucha gente ha usado la palabra 'sanado' a tu alrededor”, recuerda Jamie que le dijeron los médicos en el verano de 2018. “Pero en realidad estás curado”.
Esto fue más de siete años después del trasplante de médula ósea. Jimmy pensó que lo había superado, que lo había superado. Imagínese la devastación que sintió en su mente cuando el cáncer regresó el año pasado, y nuevamente con venganza este año.
Un fanático sostiene un cartel en memoria de Jim Donovan durante el partido Cleveland Browns-Baltimore Ravens el domingo. (Ken Blaze/Imagine Imágenes)
Al final, Gentry no pudo salvar a Jim Donovan, pero sí compró un marido, un padre y una leyenda, el bien más valioso: el tiempo. La negación de Gentry le dio a Jimmy 13 años más con sus amigos y familiares… y con todos nosotros. Fueron años que todos apreciamos.
Uno de los mayores arrepentimientos en mi carrera es no haber contactado a Jimmy durante las últimas semanas. Sabía que iba cuesta abajo rápidamente. Quería darle la oportunidad de despedirse en sus propios términos y con sus propias palabras, para contarles todo lo que estaba pensando y lo que esta vida significa para él. Nunca he hecho eso.
Me enfrentaré a cualquier jugador, entrenador, ejecutivo o propietario de esta ciudad y nunca me rendiré. Pero con Jimmy creo que tenía un poco de miedo. No sabía cómo expresarlo, cómo presentárselo.
¿Cómo le preguntas a alguien si está listo para morir si aún no sabes la respuesta?
Hablé con alguien cercano a Jimmy después del partido del domingo. Me dijo que Jimmy habría dicho que no. Él no haría eso. Nunca lo sabré con seguridad.
Jim Donovan, nos dieron nuestra votación del domingo por la tarde. “¡Corre, William, corre!” Ya no tiene que funcionar. Que los ángeles te lleven al interior.
En el episodio de “Los Simpson” “La sustituta de Lisa” (25 de abril de 1991) La maestra de segundo grado de la escuela primaria Springfield, Miss Hoover (Maggie Roswell), se toma un tiempo libre para recuperarse de un ataque de enfermedad de Lyme y es reemplazada por un maestro sustituto llamado Sr. Bergstrom (Dustin Hoffman, acreditado como “Sam” Etick). Bergstrom es un gran profesor, incluso mejor. Al igual que la sarcástica y distante señorita Hoover, en su primer día entra al aula vestido de vaquero, animando a los alumnos a encontrar errores o anacronismos en su vestimenta. (Yardley Smith) descubre cuatro errores que inmediatamente provocan una conexión entre el niño y el maestro.
Lisa, como señala repetidamente “Los Simpson”, rara vez recibe el estímulo intelectual que necesita. Es terca y atenta, pero tiene que vivir con un hermano grosero y de bajo rendimiento y un padre tonto e curioso. En el hilo de burla más persistente del programa, Lisa, de ojos brillantes, siempre pasará desapercibida y despreciada. Cuando entabla una conversación con el Sr. Bergstrom fuera de la escuela (Lisa y Homer (Dan Castellaneta) lo conocieron en el museo), se da cuenta de que él es un modelo a seguir adecuado, alguien que la apoya. El Sr. Bergstrom también se da cuenta de que Homer no está logrando brindarle a Lisa una paternidad sólida.
La tragedia del “reemplazo de Lisa” es que el trabajo de Bergstrom requerirá que se vaya tarde o temprano. Cuando la señorita Hoover regresa, Lisa se sorprende. Se apresura a ir a la estación de tren para anunciar que se perderá sin él como guía. El señor Bergstrom le entregó una nota. Dice que contiene toda la información que necesitará para luchar contra su soledad. La nota dice: “Tú eres Lisa Simpson”.
“Lisa's Substitute” es lo suficientemente conmovedora como para hacer llorar al espectador, un rasgo inusual para una serie que a menudo se basa en la parodia y la sátira. El episodio también hizo que Smith fuera más que simplemente grosero. Como admitió la actriz en una entrevista reciente con Vulture. Ella admitió haber llorado abiertamente durante la grabación de la escena final donde Lisa tiene que decírselo a Homer.
El reemplazo de Lisa hizo llorar a Yeardley Smith durante la grabación.
Zorro del siglo XX
Cuando Lisa admite que perdió al Sr. Bergstrom, Homer, como era de esperar, se muestra grosero. “El hecho de que no me importe no significa que no lo entienda”, dice. Lisa se derrumbó y comenzó a gritarle a su padre, llamándolo babuino una y otra vez. Homero está claramente herido y Lisa continúa gritando. Ella va a su habitación a llorar en paz. Smith recuerda haber grabado esa escena y cómo se sorprendió a sí misma con la fuerza de su actuación. Ella dijo:
“Recuerdo haber grabado esa escena con Dan Castellaneta y haber perdido mi pasión por esa grabación, y luego llorar de nuevo. Creo que incluso mis compañeros de equipo al final dijeron: 'Wow, Yeardley, qué gran grabación'. Creo que va a ser un gran episodio. La gente piensa que detrás del micrófono se puede hacer menos porque nadie ve mis lágrimas, pero para mí no sé separar estar frente a la cámara y estar frente al micrófono, por qué de alguna manera dar un poco de tu corazón. y alma a todo lo que sabes hacer solo porque nadie te ve físicamente?”
De hecho, Smith probablemente habla en nombre de todos los actores de doblaje que se han sentido marginados simplemente porque sus actuaciones son enteramente auditivas en lugar de visuales. La interpretación vocal requiere tanto talento como cualquier otro tipo de interpretación. Smith incluso bromeó sobre la cantidad de mocos que le produjo ese día y recordó que sus compañeros de reparto pidieron más pañuelos, “porque hay muchos mocos aquí”.
Los Simpson fue una serie agridulce en sus temporadas anteriores y, según los informes, los escritores se sentían incómodos con las constantes solicitudes de más emociones por parte del productor James L. Brooks. John Vitti fue el escritor acreditado de “Lisa's Substitute”, pero, según se informa, Brooks estuvo muy involucrado en el proceso de redacción del guión. Son episodios como este los que recuerdan a los espectadores que Los Simpson tienen alma. Bajo su amargura.
Crear el reemplazo de Lisa fue difícil y deliberado.
veinte televisiones
Según un artículo de 2022 de la revista GQBrooks no solo hizo eso Probablemente escribiría “el reemplazo de Lisa”. Pero también insistió en algunos detalles de producción. En particular, pidió a Yeardley Smith y Dustin Hoffman que grabaran sus líneas juntos en la misma habitación. El creador del programa, Matt Groening, quedó tan impresionado que, según se informa, dijo: “Nos dimos cuenta, mira lo que podemos hacer”.
Aunque “Los Simpson” fue un éxito casi tan pronto como debutó, “Lisa's Substitute” llegó demasiado pronto para convertirse en el concierto de culto que es hoy. Atrajo a celebridades, pero no con el mismo entusiasmo que en años posteriores. Además, todavía había algo de estigma asociado a la actuación de voz en 1991. Como dijo una vez Roger Ebert, hubo un momento en el que los actores cada vez más escasos no tenían más remedio que elegir entre voces de dibujos animados o voces de teatro. Como tal, Hoffman insistió Para ser aprobado bajo seudónimo. El nombre “Sam Etic” era un juego de palabras con la palabra “semita”, una vaga referencia a la herencia judía de Hoffman. Hoffman confesó más tarde Que inventó su apodo… y que podría haber sido más inteligente.
Para Vulture, Smith recordó haber sido trasladada en avión a Nueva York para trabajar con Hoffman y lo calificó como uno de los mejores días de su carrera. No sólo quedó impresionada de trabajar en la misma habitación con un actor de la talla de Hoffman, sino que también se sintió halagada de recibir orientación de Brooks, con quien rara vez trabajaba en persona. Rich Moore es el director acreditado del episodio, pero, al igual que con la escritura, Brooks también dirigió algo.
“Lisa's Substitute” sigue siendo uno de los episodios más emotivos del programa, y parece una reliquia anticuada de una serie de hace 35 años. Desde entonces, pocos episodios han sido tan devastadores.
Con la tecnología conectando a personas de todo el mundo, sentirse solo Todavía está muy extendido. Esta soledad es especialmente común entre las personas mayores. Los investigadores ahora están investigando si los asistentes de voz digitales, como Alexa de Amazon, pueden abordar la soledad en quienes enfrentan aislamiento social.
Elena Castro, Salud psicología “Nuestro estudio sugiere que los asistentes de voz pueden ofrecer un gran valor para ayudar a las personas mayores a abordar el aislamiento, un problema con claros efectos físicos y psicológicos”, señaló el investigador de tecnología de la Universidad de Oberta de Catalunya. Castro destacó que si bien estos dispositivos son prometedores, aún tienen limitaciones, especialmente a la hora de generar conversaciones adaptativas y emocionalmente receptivas.
Sin embargo, Castro enfatizó las preocupaciones sobre la seguridad de los datos y recomendó una cuidadosa consideración de las cuestiones éticas y de privacidad.
Soledad y salud pública
Organización Mundial de la Salud (de) Se estima que la soledad afecta hasta a un tercio de los adultos en las Américas, Europa y China. Esto se ha relacionado con mayores riesgos para la salud. Los enfoques tradicionales para afrontar la soledad suelen incluir entrenamiento personal en habilidades sociales, pero esto puede resultar un desafío para quienes tienen limitaciones sociales. Las herramientas basadas en inteligencia artificial, incluidos los asistentes de voz, brindan una alternativa que puede ayudar a las personas en áreas aisladas o a aquellas menos inclinadas a las comunicaciones en persona.
Explorando el impacto de los asistentes de voz
Asistentes de vozcomo Alexa y Google Assistant, se han vuelto populares en los hogares y se consideran potencialmente valiosos para ayudar a las personas mayores.
Castro el estudia Incluyó 13 artículos de investigación que analizan cómo estos dispositivos pueden ayudar a aliviar los sentimientos de soledad. Si bien el 85% de los estudios reportaron resultados positivos, Castro recomendó cautela y dijo: “Dado el número limitado de estudios y la diversidad de métodos, debemos interpretar los resultados con cuidado”.
Equilibrando la asistencia con la privacidad y las preocupaciones éticas
La privacidad es una cuestión importante para los asistentes de voz, que funcionan escuchando constantemente a los usuarios. Castro señaló que esto podría exponer a las personas mayores al riesgo de una recopilación de datos involuntaria. “Proteger la privacidad y educar a los usuarios sobre el manejo de datos es crucial para generar confianza”, señaló. Los expertos también advierten contra una dependencia excesiva de estos dispositivos, que pueden reducir la interacción social directa.
En el futuro, Castro imagina que los asistentes de voz ayudarán con el cuidado de las personas mayores, las actividades de apoyo, los recordatorios de medicamentos y la participación social, y que potencialmente se convertirán en una parte integral de las estrategias de salud pública que aborden la soledad.
La voz es nuestro principal medio de comunicación y el teléfono nos ha permitido comunicarnos utilizando la voz durante más de un siglo. La llamada telefónica tal como la conocemos ha evolucionado de analógica a digital, de fija a móvil y de una calidad de voz baja a natural. Sin embargo, aún faltaba un avance importante: cómo permitir una transmisión de audio auténtica e inmersiva directamente.
La introducción del códec IVAS (Servicios Inclusivos de Voz y Audio), que fue estandarizado por 3GPP en la versión 18 en junio de este año, representa un avance importante en la tecnología de voz. A diferencia de las llamadas de voz monofónicas tradicionales, IVAS permite la transmisión de audio inmersivo en 3D, brindando una experiencia de llamada más rica y realista. Esta innovación es posible con nuevos formatos de audio optimizados para la experiencia de audio espacial conversacional. Un ejemplo es el formato de audio espacial asistido por metadatos, MASA, que utiliza sólo dos canales de audio y metadatos para descripciones de audio espacial. Las llamadas de audio espacial permiten a los usuarios experimentar el audio como si estuviera sucediendo en la vida real, con funciones como el seguimiento de la cabeza.
A continuación exploraremos los desafíos de llevar audio 3D en vivo a los teléfonos móviles, los requisitos abordados en las comunicaciones espaciales y el nuevo códec IVAS, y el impacto revolucionario del audio 3D en vivo en las personas, los operadores móviles y Teléfonos inteligentes comerciales.
Kai Havokainen
Jefe de Gestión de Productos, Nokia Technologies.
Llevando las llamadas 3D a los teléfonos móviles
La última gran innovación en llamadas de voz fue el códec EVS, introducido en 2014 y reconocido por los consumidores como HD Voice+. Aunque mejoró enormemente la calidad de las llamadas, como todos los códecs anteriores, solo ofrecía una experiencia auditiva monoaural.
Con la introducción de la comunicación por voz 3D, el mayor salto en la tecnología de comunicación por voz en décadas, surge el desafío de crear una experiencia auténtica e inmersiva en las comunicaciones cotidianas. Si bien la tecnología de audio ha evolucionado dramáticamente (de analógico a digital, de fijo a portátil y de baja calidad a calidad de voz natural), recrear audio espacial, donde se percibe que los sonidos provienen naturalmente de todas partes, es mucho más complejo de recrear. en entornos móviles.
Este nivel de experiencia de audio inmersivo nunca ha sido tan fácil de lograr en entornos controlados como cines y… Juegos de vídeodonde el diseño de sonido es un elemento clave, pero reproducirlo en las llamadas móviles cotidianas presenta una serie de obstáculos técnicos que incluyen el procesamiento de audio espacial en tiempo real, limitaciones de hardware y garantizar la compatibilidad entre dispositivos.
Por lo tanto, el IVAS Voice Codec es el paso adelante más significativo en tecnología de voz para llamadas de voz en décadas.
Suscríbase al boletín informativo TechRadar Pro para recibir las principales noticias, opiniones, características y orientación que su empresa necesita para tener éxito.
Cómo afrontar y superar los desafíos de la comunicación espacial
Hubo muchos desafíos que superar para que Immersive Voice se convirtiera en una poderosa solución de audio espacial. Una cuestión importante es la reducción del ruido, que es crucial para mejorar la inteligibilidad del habla en entornos como conciertos o la naturaleza. Los métodos tradicionales de reducción de ruido a menudo solo filtran sonidos continuos, como el zumbido de un aire acondicionado o el ruido del tráfico, pero a menudo dejan otros ruidos de fondo. La interferencia del viento también plantea un desafío al introducir ruidos no deseados y provocar fluctuaciones en los niveles de sonido.
Sin embargo, los avances recientes en el aprendizaje automático y la reducción inteligente del ruido han abordado estos problemas. Por ejemplo, la tecnología Immersive Audio está diseñada para ajustar de forma inteligente la cantidad de reducción de ruido de fondo según el entorno circundante, además de brindar control a los usuarios, lo que les permite ajustar manualmente los niveles de reducción de ruido. Esto garantiza que se transmitan los sonidos esenciales y al mismo tiempo reduce el ruido de fondo no deseado.
Configuraciones de audio inmersivas con múltiples micrófonos Los oradores también enfrentan un obstáculo importante: el eco. Esto sucede cuando los micrófonos captan sonido cercano. Altavocesprovocando reacciones no deseadas. El problema es aún más difícil en entornos de audio espacial, ya que la posición y la cantidad de altavoces afectan la calidad del sonido y la capacidad del dispositivo para capturar audio espacial. Los métodos tradicionales de cancelación de eco acústico (AEC) a menudo no funcionan bien en estos entornos complejos. Para resolver este problema, se creó una solución de cancelación de eco acústico espacial basada en aprendizaje automático, que elimina el sonido del altavoz de la entrada del micrófono mediante una señal de referencia. Esto mejora la calidad del audio, especialmente para el audio espacial en aplicaciones de audio en tiempo real.
Presentamos el software de codificación IVAS
Para llevar audio espacial a las llamadas de teléfonos móviles, así como a los servicios over-the-top (OTT), el Proyecto de Asociación de Tercera Generación (3GPP) adoptó recientemente un nuevo estándar de codificación de audio. Desarrollado por cooperación De las 13 empresas, el estándar de códec IVAS está incluido en la versión 18 de 3GPP, basado en el códec ampliamente utilizado de Servicios de Voz Mejorados (EVS). Lo más importante es que el códec IVAS mantiene total compatibilidad con versiones anteriores, lo que garantiza una interoperabilidad perfecta con los servicios de voz existentes.
Una de las principales innovaciones durante la estandarización de IVAS fue la creación de un nuevo formato de audio paramétrico, Audio espacial asistido por metadatos (MASA), diseñado específicamente para dispositivos con factores de forma limitados, p. Teléfonos inteligentes. El códec IVAS integra un monitor incorporado que admite sonido binaural con seguimiento de cabeza y reproducción de múltiples altavoces utilizando el formato MASA.
Además, el SDK de Immersive Audio Client puede actuar como interfaz para IVAS, capturando audio espacial de los micrófonos del dispositivo y convirtiéndolo al formato MASA estándar. Esta tecnología permite experiencias de audio 3D verdaderamente inmersivas para diferentes tipos de llamadas de voz.
El poder del audio 3D en vivo: lo que significa para las personas, los operadores y las empresas
El nuevo audio 3D inmersivo revoluciona la experiencia de audio para consumidores, empresas e industrias. Para los consumidores, profundiza la participación en las interacciones con amigos y familiares al compartir sonidos locales, ya sea transmitidos o grabados, y brinda una inmersión total en experiencias sincronizadas del metaverso. Para las empresas, la comunicación por voz 3D abre nuevas posibilidades, empezando por funciones mejoradas. Experiencia del cliente A través de voz direccional para transformar la colaboración en equipo y la toma de decisiones. En entornos industriales, el análisis de voz puede impulsar procesos automatizados como el mantenimiento predictivo, optimizar las operaciones y mejorar la eficiencia.
Para permitir estas experiencias en diversas condiciones de red, los proveedores de servicios necesitan soluciones escalables que optimicen el rendimiento independientemente de las limitaciones de ancho de banda. El códec estándar 3GPP IVAS admite velocidades de bits que van desde 13,2 a 512 kbit/s, lo que garantiza una calidad de sonido envolvente ya sea que se utilice en redes concurridas o en entornos de transmisión de alta calidad. Esta escalabilidad permite a los proveedores brindar soporte a más usuarios y al mismo tiempo ofrecer experiencias de audio ricas.
De cara al futuro, se espera que el comportamiento de los usuarios basados en la voz siga evolucionando. Más allá de las llamadas tradicionales, las comunicaciones de audio espacial se expandirán para incluir mensajes casi sincrónicos a través de aplicaciones populares, personas que se envían clips de audio entre sí y un uso más amplio de llamadas grupales. Con la aparición de dispositivos y servicios de realidad extendida en diversas industrias, el alcance de la comunicación por voz se ampliará, con la inmersión como una característica distintiva. Un factor clave en este desarrollo será la estandarización e integración del códec IVAS en los últimos estándares avanzados 5G, lo cual es esencial para garantizar la interoperabilidad necesaria para llevar la conectividad 3D a cada teléfono con solo presionar un botón.
Este artículo se produjo como parte del canal Expert Insights de TechRadarPro, donde mostramos las mejores y más brillantes mentes de la industria tecnológica actual. Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: https://www.techradar.com/news/submit-your-story-to-techradar-pro
Google ha anunciado nuevas actualizaciones de Workspace para su plataforma de mensajería, Google Chat, que está disponible principalmente para todos los usuarios a través de Gmail. Estas características, que incluyen la posibilidad de mensajería por vídeo, tienen como objetivo mejorar la comunicación entre usuarios, ahorrar tiempo y hacerla más efectiva. La compañía también está aprovechando la función de mensajería de voz que introdujo a principios de este año en Google Chat, llevándola un paso más allá con capacidades adicionales.
Mensajes de vídeo
en un espacio de trabajo BlogGoogle destacó la introducción de la capacidad de mensajería de vídeo en Google Chat y reveló algunos casos de uso del mundo real. La compañía dice que puede ser utilizado por atención al cliente o miembros del equipo de ventas para compartir actualizaciones en video sobre nuevas funciones o cambios en la cuenta. También se afirma que es útil para compartir actualizaciones de toda la empresa o como proxy para una reunión en vivo a la que los miembros se perdieron.
Como cualquier otro mensaje de chat, esta función se puede utilizar en mensajes directos (DM), DM grupales y espacios, y se puede interactuar con ella citando, respondiendo o reaccionando. Los mensajes enviados o recibidos se almacenarán en la sección Medios de la pestaña Compartido.
Sin embargo, la función de mensajería de vídeo tiene ciertas limitaciones, la más notable de las cuales es su disponibilidad. Según Google, la mensajería de vídeo en Google Chat no está disponible en ChromeOS, Linux y Firefox. Si bien los usuarios pueden recibirlo en todas las plataformas, solo se puede enviar a través de la web. Esta función no está disponible en dispositivos móviles en este momento.
Transcribir mensajes de voz
En un blog posterior correoGoogle también anunció el lanzamiento de capacidades de transcripción de mensajes de voz en Google Chat. Después de su introducción, los usuarios ahora verán la transcripción automática de mensajes de voz en el chat web y móvil. Se puede ver haciendo clic en Novedades Mostrar texto La opción que aparece debajo del mensaje de voz. Alternativamente, los usuarios también pueden optar por ocultar los textos.
Google dice que las transcripciones de mensajes de voz se tratan como texto legible para los lectores de pantalla. Se ajustará a la configuración de idioma del dispositivo.