Con rumores que sugieren manzanaEl asistente de voz de Siri puede recibir una actualización WWDC En 2024, recordaré los trece años que hemos pasado con Siri para ver qué ha mejorado, si es que ha habido algo. ¿Sigue siendo el asistente de voz de Apple el mejor o realmente necesita algunas mejoras importantes? En una prueba lado a lado con el mejor software de asistente de voz, Siri no fue el mejor y ni siquiera estuvo cerca. De hecho, quizás lo mejor te sorprenda.
Siri comenzó como una aplicación en 2010, pero Apple rápidamente compró el asistente de voz y comenzó a mejorarlo. Siri se integró completamente en iOS al año siguiente. En ese momento, pensamos en Siri (y Alexa) como herramientas para verificar el clima, configurar temporizadores y hacer preguntas simples, como ¿cuánto vale Oprah?
Cuando Siri se lanzó, no podía controlar muchas de las funciones de su teléfono, pero ahora tiene la capacidad de presionar botones por usted y encontrar configuraciones ocultas, si sabe cómo se llaman.
Siri aún puede calcular tu propina para la cena, pero ahora también puede ayudarte a encontrar tu propina reloj de manzana O dónde estacionaste tu auto. Puede encender las luces, ajustar el termostato y recordarle que complete la limpieza en seco cuando salga de casa.
Siri no es el único juego en la ciudad, aquí vienen Gemini y Bixby
Por supuesto, Siri no es el único asistente de voz que existe. Samsung Reemplazó al asistente S Voice más simple con Bixby en 2017. Bixby se presentó primero como una interfaz, luego como un amigo virtual y luego como un asistente.
Samsung lanzó Bixby como una interfaz de voz que puede controlar todos sus productos Samsung, incluidos su teléfono, televisor, lavadora y refrigerador. Esta promesa no se abandonó, pero se fue desarrollando lentamente.
Bixby no es tan inteligente como pensamos actualmente porque no utiliza un modelo de lenguaje grande (LLM) para comprender sus entradas o generar una respuesta. Siri tampoco, hasta donde sabemos.
Ambos asistentes podrían recibir una gran actualización pronto, ya que Samsung ha estado promocionando las funciones de Galaxy AI con cada lanzamiento de nuevo teléfono, y Apple ya ha insinuado que la IA llegará a sus productos a lo grande, tal vez en la WWDC 2024.
Si no desea esperar a que un asistente de LLM obtenga respuestas, deberá… Google Pixel con Géminis a bordo. Gemini es un programa LLM de Google y, cuando descargas la aplicación en tu teléfono Android, ofrece reemplazar a Google Assistant, el antiguo asistente de voz de Google. Gemini todavía usa el Asistente de Google para algunas de sus funciones, pero también usa otras aplicaciones y funciones de Google.
Prueba: 25 aplicaciones para asistentes de voz
Probé a Siri, Bixby y Gemini entre sí en los mejores teléfonos de cada fabricante: el Apple iPhone 15 Pro Max, el Samsung Galaxy S24 Ultra y el Google Pixel 8 Pro.
Hice una lista de 25 tareas que esperaba que completara la IA y escribí un guión simple para cada tarea para poder expresar mi solicitud exactamente de la misma manera en todas ellas. Por ejemplo, cuando pregunté: “¿Va a llover?” A Siri, no le pregunté a Bixby: “¿Va a llover?”.
En cada prueba di ☑️ cuando el asistente de voz me dio un buen resultado como esperaba, y tengo detalles cuando me dio un mal resultado ya sea información inexacta o simplemente respuesta incorrecta.
Continúe leyendo para obtener detalles sobre el rendimiento de los teléfonos, o puede crear el suyo propio. Ir directamente a la prueba y resultados..
Siri estaba en el medio y Bixby era el mejor
Siri no era la mejor, pero tampoco era tan poco confiable como Gemini de Google. De 25 tareas, Siri completó 13 sin ningún problema, pero me dio una mala respuesta a siete de mis solicitudes.
Por ejemplo, cuando le pedí a Siri que jugara Archer en Netflix, me sugirió que viera programas completamente diferentes en Apple TV Plus. Cuando pedí “escanear el código QR”, encontré información en la web sobre códigos QR, pero Gemini y Bixby sabían que la cámara estaba abierta.
Lo peor de todo es que no había nada que Siri pudiera hacer que Géminis no pudiera hacer. Todo lo que Siri podía hacer, Bixby también podía hacerlo, y Bixby no estaba interesado en eso. Si le preguntabas: “Activa el punto de acceso Wi-Fi”, Siri se encogía de hombros, hasta que me di cuenta de que Apple lo llamaba “punto de acceso personal” y funcionaba. Con Bixby, puedo decir “punto de acceso Wi-Fi” o “punto de acceso personal” y Bixby lo activa. Independientemente de lo que Samsung llame un “punto de acceso portátil”, Bixby fue lo suficientemente inteligente como para entender todo lo que le pregunté.
Les pedí a los teléfonos que “iniciaran la grabación de pantalla” y solo Bixby puede hacerlo. El iPhone proporcionó una página web de soporte de Apple para aprender a verificar el registro yo mismo.
Pedí a los teléfonos que “tradujeran esto al español” y Bixby me preguntó qué traductor prefería y luego comencé a escuchar. Géminis me pidió que escribiera mi respuesta o presionara el botón nuevamente. Siri no entendió. Ingles a español: La Habla, amigos iPhone.
Bixby no sólo es mejor, es mucho mejor que Siri
Algunas de las capacidades de Bixby son realmente impresionantes. Pedí a los teléfonos que me mostraran fotos de mi hijo con su nombre. Bixby abrió la aplicación Galería y me mostró fotos de mi bebé. Tanto Siri como Gemini me mostraron sugerencias en la web de personajes de películas con ese nombre, a pesar de que mi hijo estaba etiquetado imágenes de google Y fotos de Apple.
¡Le pedí a Bixby que silenciara todas las notificaciones y funcionó! ¡Se han ido todos! Gemini al menos abrió mi configuración de notificaciones cuando le pregunté, pero Siri simplemente dijo: “Lo siento, me temo que no puedo hacer eso”.
En cualquier caso, Bixby fue el mejor asistente de voz. No hubo casi nada que ella no pudiera hacer en las 25 tareas que le encomendé.
No siempre fue perfecto. Le pregunté cuántas cucharaditas había en ¾ de taza y me dijo “alrededor de 36”, pero eran exactamente 36 cucharaditas; No es necesario redondear. Le pregunté sobre el patrimonio neto de Oprah y ella me dio una breve biografía de la web, pero cuando hice clic en ella, tenía sus números de dinero adentro.
El único error fue cuando pregunté cuándo jugarían los Orioles a continuación. Al momento de escribir este artículo, están jugando esta noche, pero Bixby se saltó toda la serie que juegan contra los Azulejos y pasa a la serie contra los Bravos la próxima semana. Me había perdido el juego.
¿Qué pasa con Gemini, el asistente que realmente usa IA?
Google Gemini fue el peor del grupo. Obtuviste la menor cantidad de respuestas correctas y la mayor cantidad de respuestas incorrectas. Pedí a los teléfonos que “me recordaran que debía ir a la tintorería cuando saliera de aquí”, y Bixby y Siri me ayudaron con recordatorios basados en la ubicación. Google Gemini dijo: “No puedo ayudarte con eso porque solo soy un modelo de lenguaje”.
Géminis no pudo ayudarme a jugar “Archer” en Netflix. No pude encontrar el mio reloj de píxeles 2 automáticamente, aunque Siri encontró mi Apple Watch y Bixby encontró mi Galaxy Watch. Gemini no pudo ayudarme a encontrar dónde estacioné mi auto, a pesar de que mi Pixel 8 Pro estaba conectado al estéreo. No puedo iniciar la grabación de pantalla.
Cuando le pedí a Pepito que reiniciara el teléfono, dijo “ok” y luego no hizo nada.
La única vez que Géminis fue mejor fue al conseguir el título de los Orioles de Baltimore. Empecé preguntando: “¿Cuándo es el próximo partido de los O?” Como cualquiera que haya crecido cerca de Baltimore. Google Gemini fue el único asistente de voz que pudo entender mi pregunta. Bixby pensó que estaba diciendo “oh, juego” y se rindió. Siri me regaló mi primer partido de fútbol de la Universidad Estatal de Oklahoma, en tres meses.
Pruebas y resultados
la demanda | Géminis (Google Pixel 8 Pro) | Siri (Apple iPhone 15 Pro Max) | Bixby (Samsung Galaxy S24 Ultra) |
“Llama a mi madre” | ☑️ | ☑️ | ☑️ |
“Envía un mensaje de texto a XXXX que llego tarde” | ☑️ | ☑️ | ☑️ |
“Programe un corte de pelo para el sábado al mediodía”. | ☑️ | ☑️ | ☑️ |
“Pon el termostato a 72” | ☑️ | ☑️ | ☑️ |
Encender/apagar la linterna | ☑️ | ☑️ | ☑️ |
“¿Quién es el director ejecutivo de Amazon?” | ☑️ | ☑️ | ☑️ |
“Recuérdame que vaya a la tintorería cuando salga de aquí”. | No: “No, no puedo ayudarte con eso porque solo soy un modelo de lenguaje”. | ☑️ | ☑️ |
“¿Va a llover este fin de semana?” | ☑️ | No: “Sí, sábado” (el pronóstico del sábado indica lluvia y sol) | ☑️ |
“¿Cuándo es el próximo partido de los O?” | ☑️➕(Se entiende que las “O” significan los Orioles de Baltimore) | No: apertura de la temporada de fútbol americano del estado de Oklahoma, 30 de agosto | No: Los Orioles lo entendieron, pero dieron la fecha equivocada |
“Reproducir lista de reproducción Spotify Discover” | No: “Claro, usaré YouTube Music”. | ☑️ | ☑️ |
“Ejecuta Archer en Netflix” | No: “Todavía no puedo ayudar con Netflix, pero todavía estoy aprendiendo”. | No: “El Informante”, “Traidor” y “El Cristal Oscuro” se recomiendan para Apple TV | ☑️ |
“Pon el cronómetro en 15 minutos… ¿cuánto tiempo te queda?” | ☑️ | ☑️ | ☑️ |
“¿Dónde está mi reloj?” | No: “Comprueba la aplicación Find My en tu teléfono para localizar tu reloj” | ☑️ | ☑️ |
“¿Cuánto es el 20% de 98? [pause] 75?” | ☑️➕ Entiendes mi punto 98.75 | ☑️ Pero no entendí que la pausa significa un punto decimal. | ☑️ Pero no entendí que la pausa significa un punto decimal. |
“¿Cuántas cucharaditas hay en 3/4 de taza?” | ☑️ | ☑️ | ☑️ “Casi” |
“¿Cuál es el patrimonio neto de Oprah?” | ☑️ y las fuentes mencionadas | ☑️ y las fuentes mencionadas | No: currículum ofrecido, sin patrimonio neto |
“Activar punto de acceso Wi-Fi” | ☑️ | No: no entendí hasta que dijiste “punto de acceso personal” | ☑️ |
“Cuéntame un chiste” | ☑️ | ☑️ | ☑️ |
“Reiniciar mi teléfono” | No: “Está bien”, y luego no pasa nada. | ☑️ | ☑️ |
“¿Dónde estacionaste mi auto?” | No: “No tengo información sobre dónde aparcar el coche”. | ☑️ | ☑️ |
“Iniciar grabación de pantalla” | No: “La grabación de pantalla no es compatible” | No: “Puedes aprender a grabar tu pantalla en Apple.com/…” | ☑️ |
“Traducir al español” | ☑️ | No: “Lo siento, no entiendo”. | ☑️ |
“Silenciar todas las notificaciones” | No: abre notificaciones en la aplicación Configuración | No: “Lo siento, me temo que no puedo hacer eso”. | ☑️ |
“Escanea el código QR” | ☑️ | No: en su lugar, explica los códigos QR | ☑️ |
“Muéstrame fotos de [my son’s name]” | No: “Hay demasiadas fotos [my son’s name]Aquí hay algunos…” | No: “Aquí hay algunas fotos de [my son’s name] Desde la web” | ☑️ |
Los resultados finales: | ☑️ = 16 | ☑️ = 16 | ☑️ = 23 |
Análisis final: Siri tiene mucho trabajo por hacer
Los resultados fueron claros: Bixby superó a Siri y Gemini, demostrando ser el asistente de voz más capaz y versátil. Si bien Siri se destacó en tareas básicas, la capacidad de Bixby para controlar la configuración del teléfono, buscar fotografías personales y comprender un lenguaje preciso lo distingue.
A pesar de sus orígenes en la IA, Gemini tenía problemas con la funcionalidad básica y carecía del conocimiento contextual de sus competidores. A medida que el panorama de los asistentes de voz continúa evolucionando, es de esperar que Apple desarrolle Siri hasta que sea tan útil y capaz como Bixby, y tal vez Bixby finalmente gane algo de respeto fuera del Samsung Galaxy.