El centro educativo británico Mumsnet presentó una demanda contra Abierto AIalegando que violó la ley de derechos de autor al utilizar sus datos para entrenar sus modelos de IA, incluidos aquellos que potencian… chat gbtEs la primera demanda de este tipo presentada contra OpenAI en el Reino Unido, pero es uno de un número creciente de casos similares que se están difundiendo internacionalmente y que acusan a OpenAI de extraer ilegalmente información para sus modelos sin permiso. Mumsnet afirma que sus foros albergan más de seis mil millones de palabras y que OpenAI ha utilizado estas palabras para enseñar a sus modelos de IA sobre paternidad y temas relacionados.
“Dicha extracción no autorizada constituye una clara violación de nuestros términos de uso, que establecen claramente que ninguna parte del sitio puede distribuirse, extraerse o copiarse para ningún propósito sin nuestro consentimiento expreso”, explicó la cofundadora de Mumsnet, Justine Roberts, en una carta a Sitio web de Mumsnet. correo En el sitio web, “los estudiantes de LLM están creando modelos como ChatGPT para brindar respuestas a cualquier pregunta potencial, lo que significa que ya no necesitamos buscar soluciones en otra parte. Están construyendo estos modelos utilizando contenido recopilado de los sitios web que se están preparando para reemplazar”.
La denuncia legal cita el momento de la recopilación de datos como otro punto de discordia, ya que esencialmente ocurrió antes de que los sitios web prestaran mucha atención a si las empresas de inteligencia artificial estaban extrayendo sus datos. Mumsnet afirma que inicialmente organizaciones de investigación de terceros realizaron la mayor parte de esta extracción de datos.
Mumsnet se ha acercado a OpenAI para obtener la licencia de su contenido, escribió Roberts, señalando que la plataforma tiene una colección enfocada de escritos de mujeres que difiere de la mayoría del contenido en línea. Pero OpenAI declinó, citando interés en “conjuntos de datos a los que no se puede acceder fácilmente en línea”, según Roberts.
Raspado de restos
Mumsnet no es el único que expresa quejas sobre la extracción de datos por parte de OpenAI y ahora es parte de un grupo cada vez mayor de empresas que demandan a OpenAI por el asunto. por ejemplo, El Authors Guild ha presentado una demanda contra OpenAI, afirmando que se habían utilizado libros con derechos de autor para entrenar modelos de IA, al igual que un grupo de académicos que afirmaron que OpenAI había robado sus artículos de manera similar. Reuters y New York Times Ambos han presentado una demanda contra OpenAI No se trata solo de minería de datos, sino también de la afirmación de que ChatGPT genera respuestas con contenido muy cercano a sus artículos protegidos por derechos de autor. Creative Commons incluso presentó una demanda contra el desarrollador de IA, alegando que la empresa utilizó contenido con licencia Creative Commons para entrenar sus modelos de IA de maneras que violaban los términos de las licencias.
OpenAI ha defendido sus prácticas como uso legítimo. En el Reino Unido, la empresa respondió a una consulta de la Cámara de los Lores reconociendo que debe utilizar material protegido por derechos de autor para entrenar sus modelos de IA y que debe hacer más para apoyar a los creadores de contenido, pero aún mantiene que lo que está haciendo es legal. Si bien este es el primer caso de OpenAI en el Reino Unido sobre este tema, Getty Images tiene un caso similar Acudir a los tribunales del país contra la empresa Stability AI por su inteligencia artificial generadora de imágenes.
El resultado de la demanda de Mumsnet y otros casos puede sentar un precedente sobre cómo las empresas de inteligencia artificial manejan el contenido protegido por derechos de autor y puede afectar las regulaciones y prácticas de concesión de licencias en el futuro. Los esfuerzos para equilibrar la innovación en IA con los derechos de propiedad intelectual están lejos de estar resueltos y probablemente no lo estarán durante mucho tiempo.
Para ser justos, Mumsnet no está en contra de los programas LLM ni de la IA como concepto. De hecho, Mumsnet utilizó modelos OpenAI para crear un programa de IA. robot de chat Se llama MamásGPT El año pasado, MumsGPT solo estaba disponible para los ejecutivos de Mumsnet cuando se anunció y no se ha mencionado desde entonces, por lo que es posible que ya no esté disponible, pero la idea era ofrecerlo como una herramienta de investigación e incluso como algo que los responsables políticos puedan utilizar en desarrollar regulaciones sobre la crianza de los hijos. Roberts no mencionó a MumsGPT, pero enfatizó que existen posibles usos positivos para la IA en su explicación de la demanda.
“Pero si a los LLM se les permite robar contenido de editores y comunidades como Mumsnet, corren el riesgo de destruirlos”, escribió Roberts. “Sabemos que enfrentarse a un gigante multinacional como OpenAI, con sus ingresos de 3 mil millones de dólares, no es una tarea fácil frente a los enormes recursos que nos brindarán, pero este es un tema demasiado importante como para simplemente ignorarlo, no solo para Mumsnet. pero en cada sitio web aparece “Es para recibir noticias, consejos o simplemente para preguntar si no estoy siendo razonable”.