Microsoft negó el miércoles las acusaciones de que utiliza datos de clientes de aplicaciones Microsoft 365, incluidos Word y Excel, para entrenar modelos de inteligencia artificial.
La respuesta se produjo después de que algunos usuarios señalaran en las redes sociales que la compañía estaba pidiendo a los usuarios que optaran por no participar en su función Connected Experiences, que, según dijeron, se estaba utilizando para capacitación. Amnistía Internacional Modelos.
“Estas acusaciones no son ciertas. microsoft “Los datos de los clientes de las aplicaciones empresariales y de consumo de Microsoft 365 no se utilizan para entrenar modelos de lenguaje grandes subyacentes”, dijo un portavoz de Microsoft en un comunicado enviado por correo electrónico a Reuters.
El portavoz agregó que Connected Experiences permite funciones como coautoría y almacenamiento en la nube, y no tiene nada que ver con la forma en que la empresa entrena sus grandes modelos lingüísticos.
Las conversaciones en las redes sociales indican que a la gente todavía le preocupa que sus datos se utilicen para entrenar modelos de IA sin permiso.
manzanaSegún se informa, Anthropic y otras importantes empresas de inteligencia artificial han entrenado modelos de inteligencia artificial con datos de cientos de miles de… YouTube Un nuevo informe afirma que varias empresas de inteligencia artificial han utilizado un conjunto de datos disponible públicamente llamado Pile que contiene el texto sin formato de los subtítulos de los vídeos sin imágenes de vídeo. Los datos se recopilaron de creadores populares de YouTube como MrBeast, Marques Brownlee y PewDiePie, así como de creadores indios de YouTube como CarryMinati, BB ki Vines y Ashish Chanchlani.
Muchos modelos de IA se entrenan en vídeos de YouTube
Proof News realizó un estudio investigación Los investigadores han descubierto que los datos de subtítulos de hasta 173.536 vídeos de YouTube se tomaron de más de 48.000 canales. Según el informe, EleutherAI, un laboratorio de investigación de inteligencia artificial sin fines de lucro, seleccionó este conjunto de datos. Posteriormente fue utilizado por empresas como Apple, antrópico, Nvidia, Salesforce y más. Cabe señalar que el Laboratorio de Inteligencia Artificial publicó una investigación papel Resalte los detalles del conjunto de datos.
EleutherAI creó un almacén de datos de 800 GB llamado Pile y lo puso a disposición del público para aquellos que querían entrenar modelos de IA pero no podían permitirse grandes conjuntos de datos. La mayor parte del conjunto de datos se tomó de fuentes disponibles públicamente, como Wikipedia en inglés, libros electrónicos y más. Sin embargo, también contenía subtítulos de todos los vídeos recopilados en un conjunto de datos llamado Subtítulos de YouTube.
El informe afirmaba que Pile se utilizó para entrenar el modelo de IA OpenELM de Apple, según la descripción del artículo de investigación. fuerza de ventas, NVIDIALos informes también indican que el conjunto de datos se ha utilizado en artículos de investigación sobre modelos de inteligencia artificial publicados por Anthropic.
La portavoz de Anthropic, Jennifer Martinez, dijo a la publicación en un comunicado: “The Pile incluye un subconjunto muy pequeño de traducciones de YouTube. Los términos de YouTube cubren el uso directo de su plataforma, que es diferente del uso del conjunto de datos de Pile. En cuanto a posibles violaciones de los derechos de YouTube, términos de servicio. Tenemos que remitirlo a los autores de Pile”.
Vale la pena señalar los términos de servicio de YouTube. Prohibido Nadie podrá acceder a los vídeos de la plataforma utilizando medios automatizados como bots, botnets o scrapers. Las traducciones de YouTube entrarán en la categoría de scraping. Un portavoz de Google dijo a Proof News en una respuesta por correo electrónico que el gigante tecnológico ha tomado “medidas a lo largo de los años para evitar el scraping abusivo y no autorizado”. Sin embargo, no se hicieron comentarios sobre el uso de datos por parte de las empresas de IA.
En una publicación en el sitio web
Apple obtiene datos para inteligencia artificial de varias empresas
Alguien recopiló cantidades masivas de datos/texto de videos de YouTube, incluido el mío.
Apple técnicamente está evitando la “falla” aquí porque no es la empresa la que realiza la limpieza.
Aunque este conjunto de datos fue recopilado y distribuido públicamente, puede haber otros casos de recopilación de datos en plataformas como YouTube. A medida que las empresas de inteligencia artificial se esfuerzan por encontrar más datos para entrenar sus grandes modelos lingüísticos, los datos de compras pueden seguir cayendo en áreas legales grises similares.
Mystic Dan, ganador del Derby de Kentucky Entrenado por Bob Baffert, Moth entrará por las puertas de salida uno al lado del otro en la edición número 149 del Preakness Stakes el sábado. Los caballos terminaron cuarto y quinto respectivamente en la carrera de nueve caballos.
Pero la noticia más importante es que, por primera vez desde 2012, el ganador del Derby no figura como favorito del Preakness. Muth, con 8-5, es el favorito de la mañana, con Mystik Dan en segundo lugar con 5-2. En 2012, tendría otra opción que fue la segunda opción de Bodemeister de Baffert. Sin embargo, I'll Have Another ganó el partido de vuelta de la Triple Corona, superando tarde a Bodemeister para ganar por un cuello.
Mystik Dan ganó el Derby de Kentucky de manera histórica, superando a Sierra Leone y Forever Young en la primera sesión fotográfica de tres caballos desde 1947. Pero la victoria de Mystik Dan se produjo sin el mejor caballo de Baffert debido a la suspensión prolongada del entrenador en Churchill Downs. Baffert, seis veces ganador del Derby, fue suspendido de la pista durante dos años después de que el ganador del Derby, Medina Spirit, diera positivo por un ungüento tópico cuyo uso no está permitido el día de la carrera. El caballo fue eliminado como ganador del Derby y al entrenador se le prohibió asistir a Churchill durante dos temporadas. Pero en julio, los funcionarios de la pista optaron por extender la sentencia de Baffert por un año más, argumentando que no se había disculpado por su participación en el tratamiento del caballo.
Todo esto dejó a Moth en la mira. Los propietarios podrían haber transferido el caballo a otro entrenador, pero decidieron quedárselo con Baffert. Una vez que ganó el Derby de Arkansas y acumuló suficientes puntos para ser elegible para el Derby, los propietarios solicitaron una orden judicial que le permitiera ingresar al campo. Esto finalmente fue rechazado por el Tribunal de Apelaciones de Kentucky, dejando a Muth al margen del Derby.
Sin embargo, Pimlico reintegró a Baffert al final de la temporada de la Triple Corona de 2022. Hace un año, en un día trágico, ganó el Preakness Stakes con National Treasure, negándole al ganador del Derby, Mage, la Triple Corona. En la carrera de preparación del Preakness, otro caballo, Havnameltdown, tuvo que ser sacrificado tras un colapso.
Ahora Baffert, sin duda la cara más reconocible de la industria, vuelve a jugarse la Triple Corona una vez más. Aunque es conocido por sus victorias en el Derby, en realidad tiene más éxito en Baltimore, donde posee un récord de ocho coronas en el Preakness Stake.
Muth y Mystik Dan se han enfrentado cara a cara. En marzo, Muth ganó el Derby de Arkansas con Mystik Dan terminando tercero, superando a Muth por 6 cuerpos. Moth no ha vuelto a correr desde entonces. Baffert también tiene un segundo caballo en el campo de nueve caballos, Imagination, que terminó noveno.
Mientras tanto, el entrenador Kenneth McPeek y Mystic Dan llegan a Baltimore después de correr por la barandilla para ganar el Derby. Un tiro de 18 a 1 selló la victoria sobre Sierra Leona. McPeek, un nativo de Kentucky que ganó el Preakness en 2020, esperó hasta finales de la semana pasada para anunciar oficialmente que Mystik Dan correría en el Preakness. Se unió a Just Steel y Mugatu como los únicos subcampeones del Derby.
McPeek es uno de los mejores en el negocio de las carreras de caballos, la cría y el entrenamiento de caballos. Fue él quien sugirió cruzar a Sayidaty, una yegua casi retirada, con Goldencents, quien produjo a Mystic Dan.
Ese amor por el deporte se extendió a los sitios de redes sociales del Derby después de que el ex centro de los Philadelphia Eagles, Jason Kelce, sospechara, sin ninguna evidencia, que Secretary se estaba dopando debido a su famoso gran corazón. El jugador retirado de la NFL sacó a relucir el tema en su podcast con su hermano Travis, luego duplicó su opinión sobre X, lo que provocó una respuesta rápida de los amantes de los caballos e incluso de la hija de la propietaria de Secretary, Penny Tweedy.
McPeek recurrió a X para invitar a Jason a echar una “mirada interna” al deporte, sugiriendo que trajera a Travis y “su novia, olvidé su nombre”.
Jason, esta es una invitación a Baltimore para conocer a Mystic Dan. @pimlicoRC antes @PreaknessStakes Me encantaría darte una mirada interna a nuestro deporte, trae a tu hermano. @tkelce Y su novia olvidó su nombre 🤣 https://t.co/NYQG7mAgdd