La firma de IA Anthrope ha ganado una victoria legal clave en una batalla de derechos de autor sobre cómo las compañías de inteligencia artificial usan material con derechos de autor para capacitar a sus modelos, pero la lucha está lejos de terminar.
El juez de distrito de EE. UU. William Alsup descubrió que el uso de libros con derechos de autor de Anthrope para capacitar a su chatbot Claude califica como “uso justo” bajo la ley de derechos de autor de EE. UU., En un fallo el lunes por la noche.
“Al igual que cualquier lector que aspirara a ser escritor, los LLM de Anthrope entrenaron en trabajos para no correr por delante y replicarlos o suplantarlos, sino para girar una esquina dura y crear algo diferente”, dijo el juez de distrito estadounidense William Alsup en su fallo.
Pero el juez también criticó a la firma respaldada por Amazon y Google por construir y mantener una “biblioteca central” masiva de libros pirateados, llamando a esa parte de sus operaciones una clara violación de derechos de autor.
“No Talleut” de la Ley de Derechos de Autor
El caso, presentado en agosto pasado por los autores Andrea Bartz, Charles Graeber y Kirk Wallace Johnson, acusado Anthrope de construir Claude utilizando millones de libros pirateados descargados de sitios notorios como la biblioteca Genesis y el espejo de la biblioteca pirata.
La demanda, que busca daños y una orden judicial permanente, alega que Antropía “construyó un negocio multimillonario al robar cientos de miles de libros con derechos de autor”, para entrenar a Claude, su familia de modelos de IA.
Alsup dijo que el entrenamiento de IA puede ser “extremadamente transformador”, señalando cómo las salidas de Claude no reproducen ni regurgitan las obras de los autores, sino que generan un nuevo texto “ortogonal” a los originales.
Los registros judiciales revelan que Anthrope descargó al menos siete millones de libros pirateados, incluidas copias de las obras de cada autor, para reunir su biblioteca.
Los correos electrónicos internos revelaron que los cofundadores antrópicos buscaron evitar el “trabajo legal/práctica/comercial” de los libros de licencias, mientras que los empleados describieron el objetivo como crear una colección digital de “todos los libros del mundo” para mantenerse “para siempre”.
“Sin embargo, no hay ningún tallo de la Ley de Derechos de Autor para las compañías de IA”, dijo Alsup, y señaló que mantener una biblioteca permanente de obras robadas, incluso si solo se usara algunos para capacitar, “destruye el mercado de publicación académica” si se permite.
El fallo del juez William Alsup es la primera decisión sustantiva de un tribunal federal de los Estados Unidos que analiza y aplica directamente la doctrina del uso justo específicamente para el uso de material con derechos de autor para capacitar a los modelos de IA generativos.
El tribunal distinguió entre copias utilizadas directamente para la capacitación de IA, que se consideraron de uso justo, y las copias pirateadas retenidas, que ahora estarán sujetas a otros procedimientos legales, incluidos daños potenciales.
Casos de derechos de autor de IA
Si bien se han presentado varias demandas, incluidos casos de alto perfil contra OpenAi, Meta y otras, esos casos todavía están en etapas tempranas, con mociones para desestimar pendientes o descubrimientos en curso.
Operai y Meta, se enfrentan demandas de grupos de autores que alegan que sus obras con derechos de autor fueron explotadas sin consentimiento para capacitar modelos de idiomas grandes como ChatGPT y LLAMA.
The New York Times demandó a Openai y Microsoft en 2023, acusándolos de usar millones de artículos sin permiso para desarrollar herramientas de IA.
Reddit también demandó recientemente a Anthrope, alegando que raspó la plataforma de Reddit más de 100,000 veces para entrenar a Claude, a pesar de afirmar que se ha detenido.