¿Hasta qué punto los motores de la IA pueden abastecerse «gratuitamente» de los derechos de autor de la información que ofrecen a sus usuarios?
La IA va a ser de uso público, pero usará contenido privado; en buena fe la IA debería ser gratis como lo es internet y quien no quiera que su información sea captada por las «arañas» de información que gestionan las enormes bases de datos de toda la red no va a tener más remedio que codificarla o restringir su acceso para que solo puedan acceder a ella sus clientes previo abono.
Recuerdo perfectamente como si fuera ayer cuando sucedía lo mismo al empezar la red a ser utilizada hasta por los niños, todos querían estar en ella, pero pronto se dieron cuenta de que lo que era un gran avance tecnológico de la información iba a ser su tumba mercantil.
¿Quién iba a comprar prensa de cualquier tipo, libros, manuales, gráficos, informes, trabajos, comprar y vender si se podía hacer por internet y gratis? Con la IA ¿Quién va a contratar los servicios de nadie si un bot va a dar respuesta a las preguntas que se le hagan con todo lujo de detalles, desde una definición a una tesis doctoral, desde un gráfico de Bolsa a los planos de una edificación? The New York Times ya ha demandado judicialmente a Microsoft, en función de la sentencia podría haber movimientos sísmicos en este sector que ha tenido un espectacular año. Esta editorial entiende que es punible la invasión masiva de la propiedad intelectual tanto de empresas como de profesionales.
CNBC (TRADUCCIÓN AUTOMÁTICA) The New York Times el miércoles presentó una demanda contra Microsofty OpenAI, creador del popular chatbot de IA ChatGPT, acusando a las empresas de infracción de derechos de autor y de abusar de la propiedad intelectual del periódico para entrenar grandes modelos lingüísticos.
Microsoft invierte y suministra OpenAI, proporcionándole acceso a la tecnología de computación en la nube Azure de la empresa.
El editor dijo en una presentación ante el Tribunal de Distrito de EE. UU. para el Distrito Sur de Nueva York que busca responsabilizar a Microsoft y OpenAI por los “miles de millones de dólares en daños legales y reales” que cree que se le deben por la “copia ilegal”. y el uso de las obras excepcionalmente valiosas de The Times”.
El Times dijo en un comunicado enviado por correo electrónico que “reconoce el poder y el potencial de GenAI para el público y el periodismo”, pero añadió que el material periodístico debe utilizarse con fines comerciales con el permiso de la fuente original.
“Estas herramientas se crearon y continúan utilizando periodismo independiente y contenido que sólo está disponible porque nosotros y nuestros pares lo informamos, editamos y verificamos a un alto costo y con una experiencia considerable”, dijo el Times.
“La ley de derechos de autor establecida protege nuestro periodismo y contenido”, añadió el Times. “Si Microsoft y OpenAI quieren utilizar nuestro trabajo con fines comerciales, la ley exige que primero obtengan nuestro permiso. Ellos no lo han hecho.”
“Respetamos los derechos de los creadores y propietarios de contenidos y estamos comprometidos a trabajar con ellos para garantizar que se beneficien de la tecnología de inteligencia artificial y de los nuevos modelos de ingresos”, dijo un representante de OpenAI en un comunicado. “Nuestras conversaciones en curso con el New York Times han sido productivas y han avanzado de manera constructiva, por lo que estamos sorprendidos y decepcionados con este acontecimiento. Tenemos la esperanza de encontrar una manera mutuamente beneficiosa de trabajar juntos, como lo estamos haciendo con muchos otros editores”.
Un representante de Microsoft no respondió a las solicitudes de comentarios.
El Times está representado en el proceso por Susman Godfrey, la firma de litigios que representó a Dominion Voting Systems en su demanda por difamación contra Fox News que culminó en un acuerdo de 787,5 millones de dólares.
Susman Godfrey también representa al autor Julian Sancton y a otros escritores en una demanda separada contra OpenAI y Microsoft que acusa a las empresas de utilizar materiales protegidos por derechos de autor sin permiso para entrenar varias versiones de ChatGPT.
‘Infracción masiva de derechos de autor’
The Times es una de las numerosas organizaciones de medios que buscan compensación por parte de las empresas detrás de algunos de los modelos de inteligencia artificial más avanzados, por el presunto uso de su contenido para entrenar programas de inteligencia artificial.OpenAI es el creador de GPT, un modelo de lenguaje de gran tamaño que puede producir contenido similar al humano en respuesta a las indicaciones del usuario. Utiliza información por valor de miles de millones de parámetros, que se obtiene de datos web públicos hasta 2021.
Los editores de medios y creadores de contenido están descubriendo que sus materiales son utilizados y reinventados por herramientas de inteligencia artificial generativa como ChatGPT, Dall-E, Midjourney y Stable Diffusion. En numerosos casos, el contenido que producen los programas puede parecerse al material original.
OpenAI ha intentado disipar las preocupaciones de los editores de noticias. En diciembre, la compañía anunció una asociación con Axel Springer, la empresa matriz de Business Insider, Politico y los medios europeos Bild y Welt, que licenciaría su contenido a OpenAI a cambio de una tarifa.
Los términos financieros del acuerdo no fueron revelados.
En su demanda del miércoles, el Times acusó a Microsoft y OpenAI de crear un modelo de negocio basado en una “infracción masiva de derechos de autor”, afirmando que los sistemas de inteligencia artificial de las empresas se “utilizaron para crear múltiples reproducciones de la propiedad intelectual del Times con el fin de crear el GPT”. modelos que explotan y, en muchos casos, retienen grandes porciones de la expresión sujeta a derechos de autor contenida en esas obras”.
A los editores les preocupa que, con la llegada de los chatbots generativos de IA, menos personas hagan clic en sitios de noticias, lo que resultará en una reducción del tráfico y de los ingresos.
El Times incluyó numerosos ejemplos en la demanda de casos en los que GPT-4 produjo versiones alteradas del material publicado por el periódico.
En un ejemplo, la presentación muestra que el software de OpenAI produce un texto casi idéntico a un artículo del Times sobre prácticas crediticias abusivas en la industria del taxi de la ciudad de Nueva York.
Pero en la versión de OpenAI, GPT-4 excluye un contexto crítico sobre la suma de dinero que ganó la ciudad vendiendo medallones de taxis y recaudando impuestos sobre las ventas privadas.
En su demanda, el Times dijo que los modelos GPT de Microsoft y OpenAI “compiten directamente con el contenido del Times”.
Los modelos de IA también limitaron las oportunidades comerciales del Times al alterar su contenido. Por ejemplo, el editor alega que los resultados de GPT eliminan enlaces a productos presentados en su aplicación Wirecutter, una plataforma de reseñas de productos, “privando así al Times de la oportunidad de recibir ingresos por referencias y apropiándose de esa oportunidad para los demandados”.
El Times también alegó que los modelos de Microsoft y OpenAI producen contenido similar al generado por el periódico, y que el uso de su contenido para capacitar a LLM sin consentimiento “constituye un aprovechamiento gratuito de los importantes esfuerzos y la inversión de capital humano del Times para recopilar esta información. ”
El Times dijo que los LLM de Microsoft y OpenAI “pueden generar resultados que recitan el contenido del Times palabra por palabra, lo resumen detalladamente e imitan su estilo expresivo”, y “atribuyen erróneamente información falsa al Times” y “privan al Times de suscripciones, licencias y publicidad”. , e ingresos de afiliados ”.