OpenAI se encuentra enfrentando una demanda legal relacionada con ChatGPT y su inteligencia artificial. Dos autores estadounidenses han presentado una demanda colectiva acusando a la empresa de violar la legislación de derechos de autor al utilizar sus novelas para entrenar los modelos GPT que impulsan las aplicaciones de IA de OpenAI.
La demanda fue presentada en un Tribunal Federal del Norte de California y alega que OpenAI obtuvo ilegalmente el contenido de los libros, respaldando esta afirmación con pruebas concretas.
El argumento principal de la demanda es que una gran parte de los datos utilizados para el entrenamiento de los modelos provienen de obras protegidas por derechos de autor, incluyendo las novelas de los autores Tremblay y Wad.
El documento legal sostiene: "Se ha utilizado una amplia variedad de material para entrenar modelos de lenguaje extenso. Sin embargo, los libros siempre han sido un componente fundamental en la construcción de conjuntos de datos. Los libros proporcionan los mejores ejemplos de escritura de formato largo y alta calidad".
Los abogados que representan a los escritores presentaron ejemplos concretos, como una publicación de OpenAI que menciona que GPT-1 se basó en una colección de 7.000 libros no publicados de BookCorpus. Según la demanda, este mismo BookCorpus es objeto de controversia, ya que los libros provienen de Smashwords.com, una plataforma que ofrece libros gratuitos, algunos de los cuales están protegidos por derechos de autor.
Los autores acusan a OpenAI de haber copiado estos libros en el conjunto de datos sin obtener el consentimiento, crédito o compensación debidos a los autores.
Como resultado, los escritores demandantes reclaman una indemnización por los daños ocasionados, alegando que OpenAI se ha beneficiado al utilizar material con derechos de autor sin autorización.