Google Se ha concedido una patente para un asistente robótico que puede utilizarse para hacer sugerencias a un usuario que lleva gafas inteligentes y adaptarlas en función de lo que el usuario está mirando o de sus instrucciones verbales. Si bien Google estaba trabajando anteriormente en un par de gafas inteligentes que se basan en tecnología de realidad aumentada (AR), la empresa se dice El año pasado abandonó sus gafas inteligentes AR “Project Iris” en favor de la construcción de dispositivos similares para socios OEM. Actualmente no está claro si la empresa lanzará un par de gafas de realidad aumentada basadas en la tecnología descrita en su última patente.
El Asistente de Google para gafas inteligentes puede identificar características ambientales que sean de interés para el usuario
en un documento (a través de 91Mobiles) Publicado en el sitio web de la Organización Mundial de la Propiedad Intelectual (OMPI) y titulado “Adaptación de las sugerencias del asistente presentadas en gafas computarizadas según los cambios en la mirada del usuario y/u otras entradas del usuario”, la compañía describe el uso de un asistente “automatizado”. que puede adaptarse a la entrada de audio y video que el usuario presenta con un par de gafas inteligentes.
El documento de patente de Google muestra Adaptive Assistant en acción (haga clic para ampliar) Fuente de la imagen: OMPI/Google
La compañía dice que el asistente automatizado podrá hacer sugerencias en la pantalla de las gafas inteligentes y los usuarios podrán seleccionar estas opciones utilizando tecnología que rastrea la “mirada” del usuario. Esto sugiere que el dispositivo tendrá algún tipo de seguimiento ocular que el asistente podrá utilizar.
Cuando el usuario mira hacia otra parte, el asistente podrá utilizar la cámara y el micrófono de las gafas inteligentes para “adaptar” dinámicamente sus sugerencias, en función del punto de vista del usuario y de las instrucciones verbales, respectivamente.
Google pone el ejemplo de un usuario que lleva gafas mientras explora una ciudad extranjera. El dispositivo hará sugerencias de restaurantes según la dirección de su mirada (Figura 2b). Los usuarios podrán convocar al asistente tocando las gafas o usando una frase de activación.
Según el documento, el Asistente también limitará la cantidad de sugerencias que aparecen en la pantalla de las gafas inteligentes, ya que demasiadas sugerencias pueden obstruir la visión del usuario. Estas sugerencias se pueden seleccionar basándose en gestos o mediante un comando hablado. La patente también indica que el asistente puede interactuar con otras aplicaciones del dispositivo.
La compañía también describe la capacidad de “descargar tareas computacionales” a un dispositivo servidor que permitiría a las gafas inteligentes “conservar recursos computacionales”, proporcionando de manera efectiva una duración adicional de la batería. Esto significa que el asistente puede estar alojado en el servidor o en las gafas inteligentes, mientras que las operaciones relacionadas con las operaciones del asistente pueden realizarse en cualquiera de los dos dispositivos.
Google Google está desarrollando una nueva función para su aplicación nativa Pixel Recorder para eliminar el ruido de fondo y permitir una reproducción de voz más clara al grabar audio en sus teléfonos inteligentes, según un informe. Fue detectado durante el proceso de desmontaje del APK de la aplicación de Android. La aplicación es exclusiva de la gama de dispositivos Pixel de Google, como la última serie Pixel 9, y ofrece funciones como duplicación y etiquetado de altavoces, con tecnología de inteligencia artificial (Amnistía Internacional).
Función de sonido claro en Pixel Recorder
en un un informeAndroid Authority, en colaboración con Assemble Debug, destacó que la función Clear Voice se descubrió después de desmantelar el APK de la versión 4.2.20241001.701169069 de la aplicación Recorder. Como sugiere el nombre, bloqueará el ruido de fondo y priorizará el contenido hablado cerca del teléfono.
El informe revela que internamente se lo denomina “hdmic” y está desactivado de forma predeterminada para nuevas grabaciones. Una inmersión más profunda en el código de la aplicación reveló cadenas que mencionan la función que dice “Reducir el ruido de fondo durante la grabación para una reproducción de voz más clara”.
Sin embargo, existen algunas advertencias. Para empezar, utiliza el micrófono interno del teléfono y no funciona con micrófonos externos. Además, no admite audio estéreo y solo admite audio mono.
Se informa que la función está inactiva en este momento, e incluso descargar la última versión de la aplicación Grabadora para dispositivos Pixel no parece activarla. Se dice que requiere un componente del lado del servidor para la activación.
Acceso directo a la aplicación de marcador
Google en junio Anunciar Una nueva actualización de la aplicación Grabadora que introdujo un acceso directo a la pantalla de inicio. Aparece como un círculo rojo sobre un fondo blanco, idéntico al botón de acción flotante (FAB) más grande. El nuevo acceso directo de grabación ahora se puede colocar en la pantalla de inicio para comenzar a grabar rápidamente. Se dice que su llegada proporciona un impulso a las capacidades de transcripción directa a través de su acceso rápido.
Tim Cook se sentó con Wired para una amplia entrevista
Enfatizó que Apple aún no ha considerado cobrar por las funciones de IA.
Cook arrojó algo de luz sobre el rendimiento del Vision Pro, aunque de forma indirecta
Amo Tim Cook. Ahora hace mucho tiempo manzana El director ejecutivo es generoso, inteligente y lo más parecido a una esfinge humana que puedas imaginar. Rara vez deja caer noticias importantes, ya sea de manera casual o cuando los medios lo cuestionan.
Cocinero no decepcionó Su última y amplia entrevista es con Steven Levy de Wired.. Uno de los mejores en el negocio, Levi acribilló a Cook con preguntas sobre todo, desde iPhone 16 Nuevo botón de control de cámara. inteligencia de manzanaLa empresa y su propio legado. Cook no dio exactamente la noticia, pero hubo áreas en las que reveló más sobre sí mismo, algunas de las decisiones estratégicas de Apple relacionadas con la IA y la realidad mixta, y lo que viene a continuación para el propio Cook.
Apple Intelligence, la marca de inteligencia artificial de Apple en la que Cook insiste que no es un juego de palabras, se ha ido implementando lentamente en dispositivos iPhone, iPad y Mac compatibles, y cada iteración se acerca un poco más a lo que Apple prometió durante junio. Conferencia mundial de desarrolladores 2024 Palabra clave. Cook no ha visto ninguna característica nueva, aunque tiene razón sobre la delgada línea entre utilidad y apropiación. Cook tiende a pensar que la IA es un asistente (como un copiloto, supongo) y no hace las cosas directamente por ti.
Sin embargo, la perspectiva de Cook sobre cobrar por funciones adicionales y quizás más potentes de AI Apple Intelligence fue más interesante. No es una discusión que tuvieron en Apple Campus.
“Nunca hablamos de cobrar por eso”, le dijo Cook a Levy. Ahora bien, eso no significa que esté fuera de la mesa, pero dado que Apple y Cook consideran que Apple Intelligence es similar a Multi-Touch en el iPhone, la IA probablemente será una característica que agregue valor a todos los demás productos y servicios que Apple cobra. para. Apple podría simplemente aumentar sus precios para cubrir el costo de desarrollar y respaldar las funciones de inteligencia de Apple.
Datos de Vision Pro
Era la manzana de mi madre. Visión Pro ventas. Este poderoso casco de realidad virtual y realidad mixta es sin duda el pináculo de las capacidades de electrónica de consumo de Apple, y la compañía te hace pagar un alto precio por él (3.500 dólares), lo que puede explicar la apatía del consumidor.
Cook no habló directamente sobre el desempeño de las ventas, pero sigue siendo optimista sobre los auriculares. Sin embargo, creo que pudo haber reconocido que los dispositivos portátiles caros no son para todos. Así es como Cook se lo describió a Levy:
Regístrese para ser el primero en enterarse de las ofertas imperdibles del Black Friday en la mejor tecnología y obtenga todo su contenido favorito de TechRadar.
“Es un producto de adopción temprana para personas que quieren hoy la tecnología del mañana”.
Cook insistió en que el ecosistema está prosperando, lo que puede ser una señal de la salud de la categoría de productos, pero luego añadió una noticia casi alentadora sobre lo que podría venir después.
Levi preguntó sobre Meta Orión y Gafas AR a presión. Estos dispositivos portátiles más ligeros y parecidos a gafas se centran en experiencias de realidad aumentada, y me preguntaba si la próxima versión de Vision Pro podría ir en esa dirección.
“Sí, es un progreso con el tiempo en términos de lo que sucede con los factores de forma”, dijo Cook a Levy.
Creo que el mercado no puede esperar para probar los siguientes factores de forma.
Después de cocinar
Algunos creen que el líder de los dispositivos Apple es John Ternos Probablemente será el próximo CEO de ApplePero para que Ternus intervenga, Cook tendrá que alejarse. Sin embargo, el actual CEO de Apple no pintó una imagen de alguien que se está quedando sin dinero. vapor O la persona que se ha comprometido menos con la marca.
La historia de amor entre Apple y Tim Cook sigue muy viva. Cook no está planeando su salida y le dijo a Levy que no “lo hará hasta que la voz en mi cabeza diga: 'Es el momento'.
Cook dijo que ama el trabajo y que no puede imaginar su vida sin él. En otras palabras, Tim Cook dirigirá el barco de Apple y construirá sobre su legado, que Cook quiere que sea saludable. “Tenemos investigaciones en curso”, dijo Cook a Levy. “Estamos haciendo lo mejor que podemos aquí, trabajando en cosas que han tardado años en realizarse”.
Creo que es probable que siga siendo Apple Silicon durante muchos años más.
Hume, con sede en Nueva York inteligencia artificial (AI) presentó el lunes una nueva herramienta que permitirá a los usuarios personalizar voces de inteligencia artificial. La nueva función, llamada Control de voz, tiene como objetivo ayudar a los desarrolladores a integrar estas voces en sus chatbots y otras aplicaciones basadas en inteligencia artificial. En lugar de ofrecer una amplia gama de sonidos, la empresa ofrece un control preciso sobre 10 dimensiones diferentes de sonidos. Al especificar los parámetros requeridos en cada dimensión, los usuarios pueden crear sonidos únicos para sus aplicaciones.
La empresa detalló la nueva herramienta de inteligencia artificial en un documento. Publicación de blog. Hume dijo que está tratando de resolver el problema para que las empresas encuentren la voz de IA adecuada que coincida con su identidad de marca. Con esta función, los usuarios pueden personalizar diferentes aspectos de la percepción de la voz y permitir a los desarrolladores crear una voz más asertiva, relajada y enérgica para aplicaciones basadas en IA.
El control por voz de Hume se encuentra actualmente en versión beta, pero cualquier persona registrada en la plataforma puede acceder a él. Los empleados de Gadgets 360 pudieron acceder a la herramienta y probar la función. Hay 10 dimensiones diferentes que los desarrolladores pueden ajustar, incluidas la sensualidad, la asertividad, la flotabilidad, la confianza, el entusiasmo, la relajación, la suavidad, la frescura y la rigidez.
En lugar de agregar personalización basada en reclamos, la compañía agregó un control deslizante que va de -100 a +100 para cada una de las métricas. La empresa afirmó que se adoptó este enfoque para eliminar la ambigüedad asociada con la descripción textual de la voz y proporcionar un control preciso sobre los idiomas.
En nuestras pruebas, descubrimos que cambiar cualquiera de las 10 dimensiones produce una diferencia audible en la voz de la IA, y la herramienta pudo separar correctamente las diferentes dimensiones. La compañía de IA afirmó que esto se logró desarrollando un nuevo “enfoque no supervisado” que preserva la mayoría de las características de cada sonido subyacente cuando se varían parámetros específicos. Vale la pena señalar que Hume no detalló la fuente de los datos obtenidos.
En particular, después de crear la voz de IA, los desarrolladores deberán implementarla en la aplicación configurando el modelo de IA para Empathic Voice Interface (EVI). Si bien la compañía no lo especificó, es probable que se haya utilizado el modelo EVI-2 para esta función experimental.
En el futuro, Hume planea ampliar la gama de sonidos básicos, introducir dimensiones interpretables adicionales, mejorar la preservación de las propiedades del sonido bajo modificaciones extremas y desarrollar herramientas avanzadas para analizar y visualizar propiedades del sonido.
Experimentos antrópicos para darle inteligencia artificial a Claude Toma el control de tu computadora Adquieren un tono nuevo, literalmente. El control por voz puede potencialmente cambiar la forma en que funciona su dispositivo. El asistente de desarrollo de IA se ha asociado con Hume AI y la nueva Empathic Voice Interface (EVI) 2 para que Claude comprenda las emociones detrás de nuestras palabras y responda de la misma manera.
Esto es más que simplemente igualar tus gustos en la conversación. Facilita la conexión entre lo que dices y cómo Cloud puede controlar tu computadora. Básicamente, EVI 2 convierte tu voz en texto y lo envía a la nube. Luego, Claude controla la computadora, mueve el mouse, hace clic en los botones e incluso toma capturas de pantalla. Luego, Claude utiliza un lenguaje sencillo para explicar el proceso, que es un texto que EVI convierte en un habla natural y humana. Es una conversación y una forma de completar tareas en la computadora sin usar mouse o teclado.
Hume quiere que la IA parezca más natural e intuitiva de usar. En lugar de escribir comandos o navegar por menús arcaicos, puede tener conversaciones fluidas y emocionalmente inteligentes con sus dispositivos.
Imagínese decirle a su computadora portátil: “Me siento un poco abrumado. ¿Puedes organizar mi lista de tareas pendientes?” Y haga que responda con una voz tranquila y con el equilibrio adecuado de empatía y competencia mientras le explica su lista y la pone en la pantalla frente a usted. Puedes ver cómo funciona en el vídeo a continuación.
control de voz
“Al integrar a Claude con EVI, hemos creado algo realmente especial. Las capacidades límite del lenguaje natural y la personalidad de Claude complementan la expresión y la comprensión empática de EVI, por lo que EVI puede 'imitar' las respuestas de Claude y crear conversaciones fluidas y conscientes del contexto que suenan notablemente humanas. “, explicó el fundador de Hume, Alan Quinn, en una publicación de blog: “Claude es muy elocuente. Tiene una personalidad realmente buena y la gente disfruta hablando con ella”.
Cada vez es más común dar interfaces de voz a asistentes de IA, ya sea ChatGPTModo de sonido avanzado o microsoftLa voz del copiloto. Los últimos modelos de inteligencia artificial permiten asistentes adaptativos que pueden responder cuando te interrumpen y cambiar de tema fácilmente, mucho más que los asistentes de voz anteriores de Amazonas o Google. Combine eso con el control de su propia computadora y, de repente, se abrirán nuevas perspectivas. La tecnología se ha vuelto más accesible para las personas con discapacidad o para quienes hacen otras cosas con las manos simultáneamente, lo que facilita la multitarea.
Naturalmente, tendrás que solucionar cualquier problema. El equivalente a una alucinación de IA podría ser desastroso si la IA también controla sus archivos y servicios de mensajería. Además, la privacidad se vuelve aún más importante cuando el equivalente digital de las pulsaciones de teclas y el historial del navegador pasa a formar parte de la historia de la IA. Sin embargo, este acuerdo entre Hume AI y Anthropic sigue siendo un gran paso para la personalización de la IA en lo que respecta al control por computadora.
Regístrese para ser el primero en enterarse de las ofertas imperdibles del Black Friday en la mejor tecnología y obtenga todo su contenido favorito de TechRadar.
WhatsApp El jueves lanzó una nueva función destinada a hacer que compartir mensajes de voz sea más conveniente. Ofrece mensajes de texto de voz en WhatsApp para Androide y iOS plataformas, lo que permite a los usuarios ver una transcripción de un mensaje de voz recibido de otras personas. Se dice que esta característica es útil mientras está en movimiento o en un ambiente ruidoso. Esta novedad se produce tras la reciente implementación de WhatsApp. Liberado Una etiqueta de borrador para mensajes no leídos en chats y un nuevo widget de pantalla de inicio para su aplicación iOS.
Textos de mensajes de voz de WhatsApp
en un blog correoWhatsApp ha aclarado que los textos de los mensajes de voz se generan en el dispositivo y nadie más puede escuchar ni leer el contenido de los textos. La compañía confirmó que los mensajes de voz aún están protegidos mediante el cifrado de extremo a extremo de la plataforma de mensajería instantánea.
La función debe activarse antes de su uso. Una vez que cambia, el texto aparece automáticamente debajo del mensaje de voz en el idioma seleccionado. Según la empresa, sólo el destinatario podrá ver una copia del mensaje de voz y no el remitente.
WhatsApp dice que actualmente solo admite inglés, portugués, español y ruso en la plataforma Android, mientras que su aplicación para iOS admite varios otros idiomas, incluidos árabe, chino, francés, alemán, italiano, japonés, noruego, tailandés y turco. y sueco.
Cómo utilizar esta función:
abrir WhatsApp Configuración > Chats
Cambiar Textos de mensajes de voz. Activar o desactivar y seleccionar el idioma deseado.
Mantenga presionado un mensaje de voz, luego toque copias.
Toque el ícono de expandir en el mensaje de voz para revelar más transcripciones.
WhatsApp dice que el texto puede tardar algún tiempo en aparecer. Si los usuarios encuentran el error “Texto no disponible”, puede deberse a un idioma de texto no compatible, ruido de fondo de palabras irreconocibles o un idioma de mensaje de voz no compatible. La compañía también recomienda precaución ya que las transcripciones de mensajes de voz pueden ser inexactas.
Fundada en Melbourne en la década de 1980, la empresa australiana Swann puede no ser un nombre muy conocido. Sin embargo, tiene una excelente reputación en la industria de la seguridad gracias a su amplia gama de cámaras de vigilancia inteligentes para interiores y exteriores. Hemos revisado varios de ellos aquí en TechRadar y, si bien no siempre son los más elegantes, tienden a ser algunos de los más confiables del mercado: están sólidamente construidos con software intuitivo y ofrecen un rendimiento decente (consulte nuestra guía para… Las mejores cámaras de seguridad para el hogar. Para nuestras recomendaciones más importantes).
el cisne 4k Parece que el timbre con vídeo no es una excepción. Visualmente es bastante similar a Timbre con vídeo inteligente de Yale Revisado recientemente. Esto significa que es más voluminoso que algunos timbres que existen, pero parece bien hecho.
La configuración es razonablemente sencilla. Una vez que el timbre esté completamente cargado mediante el puerto de carga USB-C, simplemente descargue la aplicación a su teléfono inteligente. Luego, utilizando el código QR en la parte posterior del dispositivo, puede vincular el dispositivo a su red Wi-Fi (solo compatible con redes inalámbricas de 2,4 GHz, no de 5 GHz).
Alternativamente, para aquellos que no quieran quitar el dispositivo para cargarlo cada pocas semanas y que tengan un poco de habilidad de bricolaje, es posible conectar el Swann a una fuente de alimentación de CA (red eléctrica) utilizando los terminales proporcionados. Sin embargo, no probamos esto y preferimos usar la batería recargable del dispositivo.
Un problema que tuvimos fue con el soporte de montaje en el que se inserta el timbre con video. Debido a que está hecho de metal, es un poco menos flexible para instalarlo en el umbral de una puerta victoriana, por ejemplo. Molduras de marco de madera – que si fueran de plástico. También es muy difícil instalar el tornillo a prueba de manipulaciones en la parte inferior del timbre, lo cual es útil si desea evitar que personas roben el dispositivo desde la puerta de entrada.
(Crédito de la imagen: Chris Price)
Por supuesto, cuando se trata de funciones, SwannBuddy 4K cumple con la mayoría de las casillas. Quizás lo más útil de todo sea el almacenamiento MicroSD integrado. Se suministra una tarjeta de 32 GB con el timbre como estándar, pero admitirá hasta 128 GB. Esto significa que no tienes que pagar una costosa suscripción mensual para almacenar vídeos como lo haces con otros modelos (aunque hay un plan de suscripción disponible si lo deseas).
Menos útil, pero con más probabilidades de acaparar los titulares, es SwannShield. Descrito de manera un tanto vulgar como un “asistente de voz basado en IA” por el fabricante, en realidad no es más que un montón de mensajes pregrabados por el momento, aunque todavía está en modo beta.
Básicamente, cuando alguien presiona el timbre con video de su propiedad, aparece una pantalla en su teléfono con una serie de opciones debajo de la imagen del video. Estas funciones incluyen una función Push to Talk para que pueda hablar con la persona en la puerta y una opción de Avisos de voz que muestra varios mensajes de voz pregrabados.
(Crédito de la imagen: Chris Price)
Una vez que alguien presiona el timbre, se puede escuchar un timbre desde el altavoz ubicado debajo del timbre con video, así como desde el pequeño timbre independiente que funciona con baterías. Está diseñado para colocarse en la habitación donde es más probable que escuche el timbre y presenta varias melodías, incluida una de un reloj de cuco y otra de un perro que ladra amenazadoramente (ideal para disuadir a los intrusos).
Por supuesto, un timbre con vídeo es mucho más que un simple dispositivo para hablar con la gente en la puerta. También se puede utilizar como cámara de seguridad estándar, grabando imágenes una vez que se activa el sensor de detección de movimiento. Capaz de distinguir entre diferentes tipos de movimiento (persona, mascota, automóvil, paquete, etc.), es posible almacenar videos por tipo, especialmente útil si desea saber cuándo se dejó un paquete en la puerta. Alternativamente, puedes almacenar videos en orden cronológico en la tarjeta MicroSD incorporada.
SwannBuddy4K: planes de suscripción
Incluye grabación en la nube durante 60 días, soporte prioritario, garantía extendida de 36 meses, seguro del dispositivo y ofertas exclusivas. Cuesta £3,99 por mes / £39,99 por año
SwannBuddy4K: precio y disponibilidad
¿Cuánto cuesta? $199 / £169 / AU$299
¿Cuándo estará disponible? Disponible desde marzo de 2024 (con SwannShield desde octubre de 2024)
¿Dónde está disponible? EE.UU./Reino Unido/Australia
Cuando se considera todo lo que ofrecen los timbres con video en términos de funcionalidad, realmente no son tan caros. Actualmente disponible en línea por alrededor de £129 (pero con un PVP de £169), SwannBuddy es un poco más caro que algunos de sus rivales, incluidos Timbre con vídeo inteligente de Yale (alrededor de £99).
Sin embargo, la gran ventaja es que, aunque puedes suscribirte al paquete de suscripción por £3,99 al mes o £39,99 al año si lo deseas (ver detalles arriba), no es necesario utilizar la cámara por completo.
En cambio, en la parte posterior del timbre con video, detrás de un panel de plástico, hay una ranura para tarjeta MicroSD con una tarjeta de 32 GB suministrada para almacenar sus grabaciones (el SwannBuddy admite hasta 128 GB). Otro beneficio es que el timbre se incluye como estándar, aunque a veces se vende por separado, aunque vale la pena señalar que un timbre que funciona con baterías no es lo mejor.
SwannBuddy4K: Diseño
Modelo robusto y bien construido.
Soporte de montaje metálico
Resistencia al agua IP65
El Swannbuddy 4K está fabricado en China y tiene una apariencia muy similar a otros timbres con video que hemos probado. Es resistente al agua (clasificación IP65) y ciertamente es una unidad bastante resistente: sólida en la mano y mide alrededor de 14 cm de largo, 5,5 cm de ancho y alrededor de 3 cm de grosor.
La cámara se ubica en la parte superior del dispositivo, mientras que en la parte inferior se encuentran el micrófono y el sensor de detección nocturna. En el medio está el botón del timbre que se ilumina en diferentes colores según su modo (por ejemplo, azul fijo mientras se carga y rojo cuando se graban imágenes). Debajo del botón del timbre hay un sensor infrarrojo pasivo (PIR) que detecta movimiento y un botón de altavoz que permite al usuario escuchar el timbre cuando lo presiona. Detrás de la cubierta de goma en la parte posterior de la unidad se encuentran la ranura para tarjetas MicroSD, los botones de configuración/reinicio y el puerto de carga USB-C. Alternativamente, se puede enchufar firmemente a una fuente de alimentación de CA.
(Crédito de la imagen: Chris Price)
Swan recomienda ajustarlo a la “altura del pecho”, entre 1,2 m y 1,6 m. Se proporciona un pequeño soporte de montaje de metal en el que se inserta el timbre. Sin embargo, esto no es excelente si intenta instalarlo en un ligero ángulo con respecto al umbral de la puerta, ya que no proporciona suficiente flexibilidad. Y aunque la cinta de doble cara proporcionada podría ser una alternativa, en realidad no es ideal para un dispositivo de este tamaño (también elimina pintura).
Para ayudar a evitar el robo del timbre, un tornillo a prueba de manipulaciones conecta la parte inferior del soporte al timbre con video. Sin embargo, nos resultó un poco difícil introducir datos cuando la cámara estaba montada en el marco de una puerta y tuvimos que mover el dispositivo a una superficie plana.
(Crédito de la imagen: Chris Price)
SwannBuddy4K: Rendimiento
Resolución 4K Ultra HD
audio bidireccional
Indicaciones de voz de SwannShield
Como la mayoría de los modelos Swann que hemos revisado, el SwannBuddy 4K no decepciona. Con instrucciones claras e intuitivas completas con comandos de voz, emparejar el dispositivo a la red Wi-Fi de su hogar es sencillo (aunque solo admite redes de 2,4 GHz). El software de la aplicación también es sencillo con menús bien diseñados.
Se proporcionan varias opciones para ayudarlo a personalizar su timbre con video, incluida una configuración de detección que le permite excluir de la grabación ciertas partes de la vista de la cámara. Esto es útil, especialmente si vive en una calle muy transitada y no desea registrar a los peatones ni a los automóviles que pasan. También se proporcionan configuraciones de sensibilidad ajustables y horarios de grabación para reducir el tiempo de grabación innecesario.
(Crédito de la imagen: Chris Price)
Al principio, pensé que la calidad de video del SwannBuddy 4K era bastante pobre, hasta que me di cuenta de que el dispositivo estaba predeterminado en modo de baja calidad. Sin embargo, en alta calidad 4K, la imagen es excelente incluso cuando se graba de noche. A diferencia de las cámaras de seguridad tradicionales que tienden a proporcionar más imágenes del paisaje, los timbres con vídeo están obviamente más orientados a la imagen. Sin embargo, el ángulo de visión sigue siendo de 165 grados, lo que es más que suficiente para la mayoría de entornos.
Una vez que alguien presiona el timbre, se envía una notificación a su teléfono inteligente informándole que está sonando el timbre de la puerta principal. Una vez que respondes, la aplicación activa la cámara en segundos para que puedas ver quién está en tu puerta. El software incluye muchas opciones, incluida una función “presionar para hablar” que le permite hablar directamente con cualquier persona en la puerta. Alternativamente, SwannShield le permite reproducir mensajes pregrabados para sus visitantes.
(Crédito de la imagen: Chris Price)
Para configurar esto, puede elegir entre uno de tres comportamientos (educado, interesado o desinteresado) con varios mensajes pregrabados disponibles, todos entregados con un acento australiano ligeramente espeluznante. ¡Incluso hay uno que le pide a la persona que abandone su propiedad porque la policía está en camino! Y si eso no funciona, siempre hay un botón de sirena para ahuyentarlos. Todo esto parece un poco hostil y probablemente no sea del todo apropiado para la mayoría de las interacciones.
¿Deberías comprar SwannBuddy4K?
Arrastra para desplazarte horizontalmente
describe
Notas
clasificación
valor
SwannBuddy no es el timbre con video más barato del mercado, pero viene con una ranura MicroSD de 32 GB (actualizable a 128 GB) para que no tengas que pagar una suscripción mensual.
4/5
diseño
La unidad está bien construida y es resistente, pero el soporte de montaje metálico y el tornillo a prueba de manipulaciones dificultan su instalación en algunas puertas con bordes decorativos.
3.5/5
actuación
SwannBuddy ofrece impresionantes imágenes de alta calidad, de día y de noche. Sin embargo, el asistente de voz SwannShield es un truco.
4/5
Puntuación media
Swann es un nombre confiable en la industria y, en general, este timbre con video no decepciona. Sin embargo, sería bueno ver más flexibilidad en lo que respecta a la instalación y mejoras realizadas en el asistente de voz SwannShield con el tiempo.
4/5
Cómpralo entonces
No lo compres entonces
SwannBuddy4K: también ten en cuenta
Arrastra para desplazarte horizontalmente
Celda de encabezado – columna 0
Timbre con vídeo Swan 4K
Timbre con vídeo y batería Ring Plus
Timbre con video inteligente y timbre con timbre de Yale
memoria
Micro SD de 32 GB (ampliable a 128 GB)
nadie
nadie
Precio de suscripción
Desde £3,99 al mes
Desde £4,99 al mes
Desde £3,50 al mes
Ángulo de visión
vista de 165 grados
Ver 150 grados
Ancho 154 grados
Conexión de red
Wi-Fi (2,4 GHz)
Wi-Fi (2,4 GHz)
Wi-Fi (2,4 GHz)
mi voz
audio bidireccional
audio bidireccional
audio bidireccional
video
Resolución 4K Ultra HD
Resolución Full HD de 1536p
Resolución Full HD de 1080p
fuerza
Red o batería
batería
Red o batería
Precio del equipo
£ 169 (timbre con video y timbre)
£ 129 (timbre con video), £ 139 (con timbre básico)
£ 129 (timbre con video), £ 29 (timbre)
Cómo probé SwannBuddy4K
Llevo tres semanas usando SwannBuddy 4K
Lo configuré yo mismo usando los accesorios proporcionados por el fabricante.
El timbre con vídeo está instalado en dos lugares de la puerta principal.
Tengo SwannBuddy 4K instalado en dos lugares de la puerta de mi casa. Primero, en el propio marco de la puerta y luego en el lateral del balcón que cubre el sistema de portero analógico existente. Durante las pruebas, varias personas llamaron a la puerta, aunque solo usé mensajes de voz pregrabados con personas que conocía.
En una ocasión, un amigo quedó tan sorprendido por la capacidad de respuesta de SwannShield que deliberadamente reprodujo un mensaje pidiéndole (con un firme acento australiano) que “abandona mi propiedad” antes de que sonara una fuerte sirena. ¡Pero luego vio el lado divertido cuando le expliqué que era un experimento para probar el producto!
Después de dos semanas en la puerta principal, llevé el timbre con video al interior para probarlo como cámara de seguridad en la oficina de mi casa. Durante este tiempo, noté que, aunque respondía muy bien al movimiento y grababa muchas imágenes, todavía quedaba aproximadamente un 50 % de carga en la batería después de tres semanas.
Monitorear los tiempos de las llamadas, optimizar los horarios de los agentes y los análisis justo a tiempo, sin mencionar la capacidad de ver todo el recorrido del cliente en tiempo real y en tiempo histórico, garantiza que los agentes tengan recursos y datos bajo demanda para manejar operaciones complejas. cliente Aplicaciones – beneficios inteligencia artificial (Inteligencia Artificial) en el servicio al cliente es enorme y sólo se ha logrado parcialmente.
valor Amnistía Internacional No solo reemplazar puestos de trabajo, sino realizar trabajos que mejoren los oídos, los ojos y la “voz” del call center, sus agentes, para que ambos puedan, en pocas palabras, hacer mucho mejor su trabajo de atender al cliente. Explica cómo encontrar el camino a través del ruido de la IA hacia las cuatro áreas donde la IA aportará el mayor valor a los centros de contacto y a los empleados.
Un estudio reciente de Deloitte, “2024 Global Contact Center Survey”, encontró que los innovadores de servicios están superando y estableciendo un nuevo estándar de oro: 1,6 veces en el logro de objetivos estratégicos, 4,6 veces en la mejora de la satisfacción del cliente y 2,5 veces en la satisfacción de los empleados. El informe define a los innovadores de servicios como aquellos que invierten en el uso de inteligencia artificial y análisis como impulsores clave.
El uso de la inteligencia artificial en centro de llamadas Puede contribuir significativamente a la gestión de la calidad y eliminar actividades tediosas asociadas con la gestión de la calidad cuando la revisa un ser humano. Por ejemplo, la IA puede rastrear si una llamada se realizó de acuerdo con todas las reglas, regulaciones y políticas de la empresa, y puede monitorear si el tono de voz fue correcto. Son correctos y pueden determinar si los datos de un cliente, ya sean financieros o no, se han almacenado de forma correcta y segura. Por supuesto, puede hacer todo esto a un ritmo mucho más rápido que los humanos y ayuda a gestionar mejor las operaciones diarias.
Pero existe un potencial aún mayor para aprovechar la IA (recopilar y analizar puntos de datos clave del centro de contacto) y luego integrar esos conocimientos en un panel en tiempo real para alertar automáticamente a los supervisores del centro de llamadas sobre cualquier actividad excepcional. El potencial continúa.
Arturo Nowakowski
CTO en ContactCenter4ALL.
Entonces, debes subirte al autobús de la IA, pero ¿cómo encontrar el camino a través del ruido de la IA?
Hay cuatro áreas clave en las que la IA está mejorando seriamente la habilitación del contacto con el cliente en los centros de contacto:
Suscríbase al boletín informativo TechRadar Pro para recibir las principales noticias, opiniones, características y orientación que su empresa necesita para tener éxito.
1. Los canales de texto impulsados por IA mantienen la flexibilidad como elemento central
Independientemente de la cantidad de agentes que trabajen en un centro de contacto, la IA puede ser una herramienta útil para condensar y analizar grandes cantidades de datos. Si cree que la IA se utilizará para reemplazar a los humanos, siga leyendo. Una nueva investigación sugiere que el 70% de los gerentes de centros de contacto creen que la IA significará que habrá más agentes en los próximos 10 años, no menos, y es probable que sus roles evolucionen. Así es como.
El uso y la necesidad de la IA pueden variar de un trabajo Por lo tanto, para las empresas es importante que una solución integral de centro de contacto mantenga la flexibilidad en el centro de las operaciones. La integración de la IA en canales de texto, como correos electrónicos, SMS, chat web y otros canales sociales, requiere diferentes niveles de flexibilidad. Por ejemplo, ¿querría el cliente utilizar la asistencia de IA para consultas por correo electrónico? ¿O simplemente prefieren la automatización? Correo electrónico ¿práctico?
La inteligencia artificial es capaz de responder preguntas sencillas. Que un cliente pregunte sobre el horario de atención de una empresa no garantiza la respuesta de un agente humano y, de hecho, sería simplemente una pérdida de tiempo y recursos del agente. En cambio, la IA puede responder a esta pregunta de forma rápida y eficiente, dejando que los humanos manejen consultas más complejas.
Pero el elemento humano permanece. La era de la personalización no ha muerto y, con estas consultas más complejas, la interacción humana todavía tiene un fuerte impacto en el recorrido del cliente. Aquí, la IA utiliza los datos del cliente para guiar las siguientes acciones en función de cada cliente individual. Puede dirigir las consultas de los clientes a la persona adecuada y brindar asistencia para estas solicitudes: piense en respuestas sugeridas, datos resumidos e historial de llamadas anteriores.
Todo contribuye a lo mejor. Experiencia del cliente Y experiencia de los empleados. Cuando los agentes están mejor equipados para manejar estas consultas, se sienten empoderados y su eficiencia aumenta, lo que infunde confianza y genera confianza tanto para los clientes como para los empleados.
…¡Y habla cualquier idioma!
Los servicios de transcripción y traducción dentro de la IA facilitan la comunicación global. Incluso si el agente y el cliente hablan idiomas diferentes, la IA integrada en estos canales de texto puede ayudarlos a comunicarse en el idioma preferido. Los beneficios son claros de ver, especialmente para los países que tienen varios idiomas: ¡Bélgica, por ejemplo, tiene cuatro!
Dirigir la consulta de un cliente al lugar y a la persona adecuados puede parecer una práctica estándar, pero es un componente fundamental del excelente recorrido del cliente. Los clientes siempre piden una solución rápida y sencilla. Aquí es donde ayuda el registro completo. Grabación de llamadas No es nuevo, pero el proceso se puede mejorar utilizando IA. La IA escuchará la llamada en curso y proporcionará al agente resúmenes y respuestas sugeridas. Está ahí para ayudar a los empleados y garantizar que tengan las herramientas, las respuestas y los datos adecuados para lograr la eficiencia.
Utilizando IA, el propósito de la llamada se puede analizar rápidamente. Ya sea para garantizar que se tenga en cuenta la correspondencia anterior (quizás un cliente envió un correo electrónico hace un tiempo, esto se agregará a su registro) o que el motivo del contacto se remita al departamento correspondiente del centro de contacto. Es importante que el agente adecuado tenga los medios para manejar la consulta al final de la llamada.
No es lo que dices, sino cómo lo dices.
Además, la IA también proporciona reconocimiento semántico para monitorear el tono de la llamada: escanea la conversación en busca de palabras específicas, emociones generales o el estado de ánimo del cliente, como si está un poco enojado, muy frustrado o incluso riendo. Por ejemplo. El sistema utiliza análisis de sentimientos para analizar casos de manera proactiva y brindar a los agentes sugerencias sobre cómo resolver problemas de manera rápida y efectiva, garantizando que el recorrido del cliente sea agradable en todo momento. Todo ello ayuda a entrenar mejor y más eficazmente.
No solo eso, el análisis de sentimientos también puede enviar alertas directamente al supervisor para darle la oportunidad de intervenir o utilizarlo en capacitaciones futuras para mejorar el flujo de trabajo de los empleados. Puede funcionar en varias pantallas, redes socialesDe hecho, el chat web funcionará en cualquier canal que utilicen los agentes y los clientes, para respaldar la capacitación adicional y la capacidad del agente para resolver el problema.
3. Informes históricos y en tiempo real: conocer el pasado le permite afrontar el futuro
Los informes brindan visibilidad de los procesos y eventos que pueden no ser visibles en una inspección rápida, algo especialmente importante en un centro de contacto virtual donde el servicio y los procesos se distribuyen en ubicaciones remotas.
Cuando se trata de operaciones diarias, la generación de informes dentro de un centro de contacto puede ser extremadamente beneficiosa cuando se combina con el uso de IA en tres áreas específicas: Se reduce el tiempo perdido al garantizar que los agentes humanos se concentren en los trabajos más importantes, los humanos. Los factores y las distracciones se monitorean y evalúan para reducir la duración de las llamadas y las horas pico. Los centros de llamadas pueden garantizar que haya suficiente personal durante los períodos de mayor actividad, enfocándose en cómo hacer que las llamadas sean más eficientes.
Para maximizar el valor de sus datos, los centros de contacto necesitan dos tipos de informes: informes históricos e información en tiempo real. Ambos son esenciales para resaltar y abordar con precisión los puntos débiles clave en el recorrido del cliente.
4. Un lugar seguro: mantenga los datos seguros con Microsoft Azure AI
Después de todo esto viene la importancia. protección No puede pasar desapercibido. Gen-AI requiere acceso a una amplia gama de datos y, en un centro de contacto, estos pueden ser datos personales de los clientes que deben mantenerse seguros. Si almacena datos de clientes, definitivamente necesita una pila de tecnología segura que mantenga esta información privada.
Por ejemplo, una solución integrada de forma nativa con microsoft Teams significa que toda la pila tecnológica, incluidos los modelos de IA, se basa en Microsoft. Por lo tanto, todos los datos se almacenan en Azure. Desbloquear la Inteligencia ArtificialPor lo tanto, todos los datos se conservan siempre en poder del cliente que alquila. El monitoreo de riesgos y seguridad, las evaluaciones de seguridad, los escudos en tiempo real y los mensajes del sistema de seguridad son solo algunas de las nuevas características que llegan a Microsoft Azure AI para ayudar a mantener seguras a las empresas. Tomemos como ejemplo un ciberataque. Si un ciberataque cumple ciertos criterios establecidos por el equipo de seguridad, la IA puede automatizar la respuesta y aislar los activos afectados. La IA generativa va un paso más allá al producir texto, imágenes y otros contenidos en el lenguaje natural original basándose en patrones en los datos existentes.
Mantener a los clientes seguros es una de las principales prioridades de Microsoft, razón por la cual la empresa invierte mil millones de dólares al año en seguridad, lo que incluye proteger su infraestructura Azure. También emplea a 3.500 expertos en ciberseguridad, incluidos 200 que buscan constantemente vulnerabilidades. En lo que respecta a cómo funciona la tecnología, la IA cifra automáticamente los datos enviados dentro del entorno de Azure. Luego, el monitoreo y la elaboración de perfiles de tráfico automatizados e inteligentes hacen que sea más fácil detectar y desviar amenazas, ya que el sistema sabe cuando algo parece fuera de lo común.
El poder de la IA, cuando se utiliza correctamente en el centro de contacto, se puede sentir en todo el espectro del centro de contacto. Comienza con empleados bien capacitados y capacitados, equipados con las herramientas y los datos necesarios para desempeñarse a un nivel muy alto. ¡Pueden responder las consultas de los clientes de forma rápida y correcta en cualquier idioma que hable el cliente!
Las operaciones de los centros de llamadas están optimizadas, ya sea para la duración de las llamadas y el monitoreo en las horas pico, y los centros de llamadas pueden usar IA para reducir los tiempos de espera y garantizar que haya más empleados trabajando durante los períodos pico. Un software de generación de informes eficaz brinda a los empleados acceso a información histórica y conocimientos en tiempo real para evaluar la gravedad de las consultas. ¡Sin mencionar que todos sus datos e información personal permanecen seguros!
Finalmente, todo contribuye a mejorar la experiencia del cliente, ya sea una resolución rápida, soluciones a la primera, tiempos de espera cortos o una llamada dirigida al departamento correcto, todo cae bajo el paraguas de la experiencia del cliente.
Y recuerde, la IA realiza mejor las tareas que consumen mucho tiempo para los humanos, dejando que los humanos hagan el trabajo que mejor saben hacer: el servicio al cliente.
Este artículo se produjo como parte del canal Expert Insights de TechRadarPro, donde mostramos las mejores y más brillantes mentes de la industria tecnológica actual. Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: https://www.techradar.com/news/submit-your-story-to-techradar-pro
WhatsApp sigue el ejemplo de iMessage y finalmente agrega soporte para mensajes de texto de voz. Esto permitirá que la aplicación muestre transcripciones de notas de audio cuando no puedas escuchar el audio en sí.
Meta beta ha estado probando la transcripción de mensajes de voz en WhatsApp durante más de un año antes de lanzarla al público.
Habilite la transcripción de mensajes de voz yendo a la configuración de WhatsApp
Sin embargo, el destinatario puede estar en un lugar público o ruidoso, lo que le dificulta escuchar la nota de voz en ese momento. Aquí es donde la transcripción de audio resulta útil, ya que proporciona una versión escrita del mensaje de audio recibido para que el destinatario pueda leer y comprender su contenido.
Para usar voz a texto en WhatsApp, obtenga la última versión en la App Store. Entonces ve a Configuración > Chats > Transcribir mensajes de voz Y habilite la función. A continuación, para transcribir una nota de voz, manténgala presionada y seleccione Traducir.
La función se está implementando gradualmente.
Avisos de whatsapp en anuncio Este mensaje se está implementando gradualmente, por lo que es posible que la función no aparezca inmediatamente en su teléfono. Por razones de privacidad, las transcripciones de mensajes de voz se generan completamente en el dispositivo y no afectan el cifrado de extremo a extremo de la nota de voz compartida.
En iPhone, la transcripción de mensajes de WhatsApp funciona en varios idiomas, incluidos inglés, español, francés, alemán, italiano, japonés, coreano, portugués, ruso, turco, chino, árabe, hebreo, sueco, tailandés y más.
En comparación, la función funciona en Android sólo en cuatro idiomas: inglés, portugués, español y ruso.
Meta está trabajando para agregar soporte para más idiomas en el futuro. Tenga en cuenta que es posible que el texto del mensaje no siempre sea exacto. Si la nota de voz contiene mucho ruido de fondo, el proceso de transcripción puede fallar.
Todo lo bueno tiene que llegar a su fin. A pesar de “Los Simpson”, que ya va por su 36ª temporada, incluyó un final falsoNever Ends, nos dice adiós uno de los principales actores del programa que lleva 35 años allí. Pamela Hayden, la voz detrás de personajes como Milhouse, Jimbo Jones y muchos otros, ha anunciado su retiro de la clásica serie animada. Su aparición final se transmitirá dentro de unos días. Entonces el espectáculo tendrá que continuar sin ella.
La última aparición de Hayden será en el episodio de esta semana titulado “Treehouse of Horror Presents: Simpsons Wicked This Way Comes”. El anuncio se realizó a través de un video tributo (que puedes ver a continuación). Presenta a Hayden compartiendo su amor por Milhouse en particular, así como también por algunos de los otros personajes a los que ha expresado en “Los Simpson” a lo largo de los años. de acuerdo a El tiempo de entregaFox comenzará a elegir nuevos actores para asumir sus papeles. Hayden dijo esto sobre su fallecimiento en un comunicado:
“Ha llegado el momento de colgar el micrófono, pero ¿cómo puedo despedirme de Los Simpson?… No fácilmente. Ha sido un honor y una alegría trabajar en un programa tan divertido, inteligente e innovador, y para dar voz a Milhouse, Jimbo Jones y Rod Flanders, Janie, Malibu Stacy y muchos más.
A medida que la serie ha ido envejeciendo, otros personajes y los actores detrás de ellos han tenido que ser reemplazados. Marcia Wallace, quien dio voz a la Sra. Krabappel, murió en 2013. Con Kerry Washington finalmente asumiendo el cargo de nueva maestra de Bart, Rachel Peyton.. La repentina muerte de Phil Hartman en 1998 marcó el final de muchos de sus personajes. Pero mientras Hayden se separa del programa, parece que los personajes a los que expresó permanecerán.
Pamela Hayden es la heroína anónima de Los Simpson
Decir que esto es un gran éxito sería quedarse corto. Si bien Dan Castellaneta (Homer), Nancy Cartwright (Bart) y Harry Shearer (Ned Flanders), así como el resto del elenco principal del programa, son celebrados regularmente, no se pueden subestimar las contribuciones de Hayden. Milhouse ha sido la fuente de algunos de los momentos más memorables de la serie, desde “It's All Coming to Milhouse” hasta “Thrillhouse”. Sin mencionar que es un personaje importante en algunos de los mejores episodios de Los Simpson en general.. Y este es sólo un personaje. Hayden también es responsable de momentos inolvidables para personajes como Rod Flanders, Jimbo y otros personajes que ha interpretado a lo largo de los años.
“Bart necesitaba alguien con quien hablar en la cafetería de la escuela. Lo llamábamos Milhouse porque ese es el nombre más malo que cualquier niño podría tener”, dijo el creador de Los Simpson, Matt Groening, en respuesta a la salida de Hayden. “Pamela nos hizo reír mucho con Milhouse, el desventurado niño con la nariz más grande de Springfield. Hizo que Milhouse fuera divertido y real, y la extrañaremos”.
El programa ha superado los cambios de audio antes, Como cuando Hank Azaria dejó de darle voz a Apu en Los Simpson Después de la presión de la gente, no estuvieron de acuerdo con que el personaje fuera un estereotipo indio obsoleto expresado por un hombre blanco. Pero reemplazar a Hayden parece ser, en el mejor de los casos, un gran desafío. En el peor de los casos, la serie podría correr el peligro de perder algunos personajes clave. ¿Quizás sea hora de deshacerse de él después de todos estos años? Por ahora, tenemos una última actuación de Hayden que esperar.
“Treehouse of Horror Presents: Simpsons Wicked This Way Comes” se transmite el domingo 24 de noviembre de 2024 por Fox.