• 03/10/2025 11:52

Un giro judicial favorable a OpenAI sobre derechos de autor

Tiempo estimado de lectura: 6 minutos, 20 segundos

Diego Fierro Rodríguez

Diego Fierro Rodríguez

Diego Fierro Rodríguez

El 7 de noviembre de 2024, el sistema judicial estadounidense experimentó un curioso giro a favor de OpenAI, la empresa responsable de ChatGPT, al desestimar una demanda presentada por los medios de comunicación Raw Story y AlterNet. Los demandantes atribuían a OpenAI la utilización sin permiso de miles de artículos periodísticos protegidos por derechos de autor para entrenar su modelo de lenguaje grande (en adelante, LLM). Este caso, que involucró un cuestionamiento sobre los límites del uso de contenidos protegidos por derechos de autor en el entrenamiento de modelos de inteligencia artificial (en adelante, IA), subraya las tensiones que existen en la intersección entre la innovación tecnológica y los derechos de propiedad intelectual, dos conceptos que han tenido que coexistir cada vez más a medida que la IA avanza y se integra en los procesos productivos y creativos.

La resolución emitida por la juez federal McMahon del distrito sur de Nueva York ha generado un debate profundo sobre las implicaciones de la utilización de datos protegidos en el entrenamiento de IA, especialmente cuando estos datos provienen de fuentes que dependen de la propiedad intelectual como su principal fuente de ingresos. McMahon desestimó la demanda bajo el argumento de que los demandantes no habían logrado demostrar un perjuicio concreto que justificara la acusación de uso indebido de sus materiales. En su decisión, la juez señaló que lo que estaba en juego no era necesariamente el uso de los artículos de prensa como tal, sino el hecho de que estos contenidos se utilizaban para desarrollar una tecnología sin que los propietarios de esos artículos recibieran compensación alguna. En consecuencia, la demanda fue desestimada por falta de pruebas suficientes que mostraran un daño real e inmediato.

Sin embargo, a pesar de la desestimación, el conflicto legal entre OpenAI y los medios de comunicación no ha terminado. Los abogados de Raw Story y AlterNet han manifestado su intención de modificar la demanda y volver a presentarla, añadiendo las pruebas necesarias que podrían respaldar las alegaciones de perjuicio económico. Esto pone de manifiesto que, aunque OpenAI haya ganado una victoria momentánea, las disputas legales sobre la propiedad intelectual en el contexto de la IA están lejos de resolverse. Más aún, la resolución judicial plantea cuestiones que podrían tener implicaciones más amplias, no solo para OpenAI, sino para toda la industria de la IA, que ha recurrido al uso de grandes volúmenes de datos para entrenar sus modelos sin siempre contar con el consentimiento expreso de los titulares de los derechos.

Para comprender la magnitud de la decisión judicial y las implicaciones de este fallo, es necesario situarlo en el contexto más amplio de las demandas que OpenAI y otras compañías de IA han enfrentado por el uso de materiales protegidos por derechos de autor. En el caso específico de OpenAI, los medios de comunicación han afirmado que, al utilizar sin autorización sus artículos para entrenar modelos de lenguaje como ChatGPT, se estaría cometiendo una infracción a la propiedad intelectual, privándolos de la oportunidad de generar ingresos derivados del uso de sus contenidos. En este sentido, la acusación tiene un fundamento sólido en la teoría del derecho de autor: la protección de los derechos de los creadores de contenido sobre sus obras es esencial para garantizar su capacidad de obtener una compensación por su trabajo intelectual. Sin embargo, el fallo de McMahon no consideró suficiente el argumento de que el uso de estos artículos podría haber reducido los ingresos que los medios obtienen de su propio trabajo, ya que los demandantes no lograron probar un daño tangible y cuantificable.

El problema que subyace a este caso es que la IA, como ChatGPT, se nutre de vastos corpus de datos para desarrollar su capacidad de generar respuestas precisas y contextualmente relevantes. Estos datos, en su mayoría, provienen de textos disponibles públicamente en internet, que pueden incluir artículos de noticias, investigaciones académicas, blogs, entre otros. Si bien muchos de estos contenidos están protegidos por derechos de autor, la manera en que OpenAI los ha utilizado es objeto de debate. En su defensa, la empresa ha sostenido que el uso de estos artículos no constituye una infracción porque no están siendo reproducidos ni distribuidos de forma directa, sino que son parte de un proceso de aprendizaje que no tiene como objetivo la explotación comercial directa de los contenidos. Este argumento podría ser válido desde la perspectiva de la «transformación» del contenido, ya que los textos no se reproducen tal cual, sino que se utilizan como parte de un proceso de entrenamiento que genera un nuevo modelo predictivo.

No obstante, la argumentación jurídica subyacente en este caso plantea una cuestión crucial: ¿hasta qué punto las tecnologías emergentes, como la IA, deben tener acceso libre a los contenidos protegidos por derechos de autor para poder desarrollarse y evolucionar? Este dilema abre un debate más amplio sobre el alcance de los derechos de propiedad intelectual en el contexto de la IA. La pregunta de si las tecnologías que dependen de grandes volúmenes de datos para entrenarse deberían pagar por acceder a esos datos es uno de los grandes desafíos legales y éticos que enfrenta la industria. De hecho, los medios de comunicación, que han sido los principales actores en este conflicto, argumentan que el uso de sus contenidos sin compensación económica vulnera sus derechos económicos, ya que les impide monetizar el acceso a sus artículos de manera adecuada.

Hay que reseñar que Enrique Dans, con un artículo titulado «La inteligencia artificial generativa sintetiza, no copia» y publicado en su blog el pasado día 9 de noviembre de 2024, afirma lo siguiente:

«Frente a muchos que creen que la inteligencia artificial generativa, como Chat GPT o Midjourney, es algo inmoral porque supuestamente roba a los artistas con cuyas obras se entrenó, alegando que no hay nada nuevo en todo lo que generan y que se basan en datos extraídos de Internet sin el consentimiento de los creadores, hay que alegar que en ningún caso esos algoritmos obtienen suficiente información de ninguna fuente específica como para ser considerados un robo. Desde una perspectiva legal, la ley de derechos de autor requiere que cualquier infracción no solo muestre similitudes sustanciales con una obra original, sino que además, el supuesto infractor debe haber tenido acceso a la obra original. Y si bien es obvio que tuvieron acceso a las obras originales, no parece que ningún arte producido por ese procedimiento sea como tal un robo.

Desde sus orígenes con el Estatuto de la Reina Ana, los fundamentos básicos de las leyes de protección de derechos de autor dependen de la copia y de la distribución, y esos procesos no se están produciendo en el caso de la inteligencia artificial generativa. Todo contenido recién creado se basa, por supuesto, en contenido anterior en cierta medida, pero aquí no hablamos únicamente de una cuestión de nivel de similaridad, que es extremadamente pequeño al diluirse entre la enorme magnitud de los datos empleados, sino también de los métodos utilizados, que en ningún caso constituyen ni una copia, ni una distribución. Si la inteligencia artificial es un robo, todas las obras de arte desde la Edad de Piedra lo es. Los escritores y artistas de hoy fueron influenciados por los de ayer, e influirán en los de mañana.

Dejémonos de tonterías y de intentar elevar los derechos de autor a modo de protección contra absolutamente cualquier cosa: todo lo que está en internet a disposición pública, es decir, cualquier página a la que una persona puede legítimamente acceder, puede también ser accedida, y de hecho lo es, por procedimientos automáticos para su indexación, pero también para su consulta y, a partir de ahí, para el entrenamiento de cualquier algoritmo, del mismo modo que es accedida por una persona. En ningún caso puede pretenderse que una persona, cuando accede a una página, lleva a cabo una copia en su memoria, del mismo modo que no puede pretenderse que viola derecho de autor alguno cuando cuenta a otra persona lo que vio. El algoritmo está exactamente en el mismo caso.»

Expuesto lo anterior, el planteamiento de Enrique Dans no tiene largo alcance o, por lo menos, no puede frenar todas las controversias jurídicas que se pueden suscitar. El día 1 de noviembre de 2024, OpenAI hizo un esfuerzo por mitigar los problemas legales mediante el lanzamiento de una nueva función, ChatGPT Search, que permite a los usuarios realizar consultas y obtener respuestas basadas en artículos de noticias actualizados. Este nuevo servicio es un intento claro por parte de OpenAI de proporcionar información precisa y actualizada, al mismo tiempo que establece un modelo de asociación con los medios de comunicación que podría facilitar la obtención legal de los derechos de los contenidos utilizados. Esta función refleja una tendencia creciente entre las empresas tecnológicas para buscar soluciones legales que les permitan utilizar contenido protegido sin infringir los derechos de los creadores, lo que indica una posible evolución hacia un modelo de negocio más respetuoso con los derechos de propiedad intelectual.

En cuanto a las cuestiones sobre competencia comercial, las mismas no constituyen un fenómeno exclusivo de OpenAI. Otras compañías tecnológicas, como Meta, la empresa matriz de Facebook e Instagram, también han comenzado a buscar acuerdos con los medios de comunicación para evitar conflictos legales relacionados con el uso de contenidos protegidos. A finales de octubre de 2024, Meta anunció un acuerdo con Reuters para permitir que su chatbot de IA vincule directamente con artículos de noticias de la agencia. Este tipo de asociaciones refleja el cambio de paradigma en la industria de la IA, en la que se reconoce la necesidad de cumplir con las leyes de propiedad intelectual sin obstaculizar el desarrollo de nuevas tecnologías.

El fallo de la juez McMahon en el caso de OpenAI, por lo tanto, representa una victoria temporal para la empresa, pero también pone en evidencia las complejidades jurídicas que acompañan al uso de propiedad intelectual en el contexto de la IA. Este incidente subraya la necesidad urgente de revisar y adaptar las normativas sobre derechos de autor a los desafíos que presentan las tecnologías emergentes. A medida que la IA continúa su avance, será necesario encontrar un equilibrio entre la protección de los derechos de los creadores de contenido y el fomento de la innovación tecnológica. Si no se logra este equilibrio, es posible que surjan nuevos conflictos legales que pongan en riesgo el desarrollo de tecnologías clave para la economía digital del futuro.

En resumidas cuentas, la disputa entre OpenAI y los medios de comunicación es solo uno de los muchos casos que surgirán en los próximos años a medida que las tecnologías de IA sigan avanzando. La regulación adecuada de estos nuevos modelos de negocio, que dependen de grandes cantidades de datos para entrenarse y ofrecer sus servicios, será crucial para definir el futuro de la propiedad intelectual en la era digital. Los juzgados y juzgados y tribunales deberán desempeñar un papel fundamental en la configuración de un marco legal que permita la innovación sin sacrificar los derechos de los creadores, y el resultado de este caso podría marcar un precedente importante para la resolución de futuras disputas.

La entrada Un giro judicial favorable a OpenAI sobre derechos de autor se publicó primero en Lawyerpress NEWS.


Artículo de Redacción publicado en https://www.lawyerpress.com/2024/11/13/un-giro-judicial-favorable-a-openai-sobre-derechos-de-autor/