El activista que acorrala a la inteligencia artificial en los juzgados: “Es la lucha de nuestras vidas”

Matthew Butterick parece un tipo muy normal. Viste una gorra de beisbol, gafas de pasta transparente y una cazadora deportiva de colores. A su espalda hay dos teclados y sintetizadores vintage que le dan un toque bohemio al sótano de su casa de Los Ángeles, que es también su oficina. “Tengo una colección de más de veinte”, dirá luego en videollamada con EL PAÍS. Nada en esta escena invita a pensar que Butterick es abogado. Menos aún que alguien tan alejado del clásico estereotipo del traje y la corbata tiene a gigantes como Microsoft, OpenAI y Meta conteniendo el aliento.

El estadounidense ha iniciado una auténtica cruzada legal contra la inteligencia artificial (IA) generativa. En 2022 registró la primera demanda de la historia de este campo contra Microsoft, una de las compañías que desarrollan este tipo de herramientas (GitHub Copilot). Hoy coordina cuatro demandas colectivas (class actions) que reúnen pleitos interpuestos por programadores, artistas y escritores y que, de prosperar, pueden obligar a las empresas responsables de aplicaciones como ChatGPT o Midjourney a indemnizar a miles de autores. O incluso pueden llevarlas a tener que retirar sus algoritmos y volver a entrenarlos con bases de datos que no infrinjan derechos de propiedad intelectual. “Esta es, para muchos de nosotros, la lucha de nuestras vidas”, asegura. Los primeros resultados de sus esfuerzos podrían llegar en cuestión de meses.

El periódico The New York Times emprendió hace unos días la misma senda que Butterick y ha demandado a OpenAI y Microsoft por haber usado sin su consentimiento millones de artículos del rotativo para entrenar sus algoritmos. Es el primer medio de comunicación que toma esta medida. “No puedo comentar el caso porque no he leído la demanda”, dice en tono serio. “Nosotros fuimos los primeros en demandar a Meta y OpenAI por entrenar modelos lingüísticos con material protegido por derechos de autor. No nos ha sorprendido que otros lo hayan hecho posteriormente. Mi socio Joe Saveri y yo siempre hemos considerado nuestros casos y otros litigios como una parte de una conversación global emergente sobre cómo la IA generativa coexistirá con la creatividad humana. Esta carrera acaba de empezar”, añade.

2023 ha sido el año en el que el mundo ha conocido el potencial de la IA generativa, la que es capaz de producir textos, imágenes o música aparentemente original. Este último matiz es importante: los algoritmos que hacen esto posible se aplican sobre gigantescas bases de datos compuestas por miles de millones de documentos, ya sean textos, ilustraciones o piezas de música. Todos esos trabajos, sin los que los sistemas automáticos serían totalmente inútiles, tienen un autor detrás al que no solo no se le compensa por usar su obra, sino que puede quedarse sin empleo a medida que las herramientas de IA generativa se vayan sofisticando.

Butterick identificó ese peligro en el verano de 2022, meses antes de la irrupción de ChatGPT. Nacido en Ann Arbor (Michigan), este estadounidense de 53 años se ha ganado la vida principalmente como diseñador de tipografías, programador y escritor. “Al igual que a muchos otros creadores y artistas, me ha quedado claro que mi trabajo está sentenciado. Ahora forma parte de los datos de entrenamiento de muchos sistemas de IA generativa. El siguiente paso es prescindir de nosotros”, cuenta.

El primer producto que puso en alerta a Butterick fue GitHub Copilot, de Microsoft, una herramienta de software asistida con IA que se entrena con una gran cantidad de software de código abierto. Su lanzamiento sembró la duda entre la comunidad de programadores, recuerda. La diferencia entre Butterick y el resto de afectados es que él decidió tomar cartas en el asunto. Hasta el punto de desempolvar la licenciatura en Derecho que obtuvo en la Universidad de California en Los Ángeles (UCLA) hace 15 años.

“Tras hablar con afectados, concluí que este sistema es una violación de las licencias de código abierto y que no es una herramienta benigna. Está diseñado para reemplazar a los programadores de código abierto, y así lo expresé en mi blog”, apunta. “Joseph Saveri, un abogado que conozco y que es fanático de mi trabajo tipográfico, contactó conmigo y me dijo: ‘Sabes, la observación que estás planteando sobre GitHub Copilot es bastante interesante’. En ese momento yo no era abogado en ejercicio, así que Joe y yo nos embarcamos en una investigación y nos convencimos de que realmente ahí había un caso”.

En noviembre de 2022, Butterick y Saveri presentaron en el Distrito Norte de California una demanda contra Microsoft, dueña de GitHub Copilot, en la que denuncian que viola los acuerdos de licencia abierta. Fue el primer litigio sobre IA generativa.

La ilustradora Karla Ortiz, junto a los abogados Matthew Butterick (a su derecha) y Cadio Zirpoli antes de testificar en el Subcomité de Propiedad Intelectual del Senado de EE UU el pasado mes de julio.Chip Somodevilla (Getty Images)

Pero el de los programadores no era el único colectivo que veía peligrar su trabajo. Tras presentar la demanda, un grupo de artistas visuales abordó a la pareja de abogados. “Nos dijeron: caramba, eso suena parecido al problema que tenemos nosotros. ¿Les interesaría aceptar nuestro caso?” Así se gestó el proceso que abrieron en enero de 2023 contra Stability AI (desarrolladores de Stable Diffussion), Midjourney y Deviant Art, las principales herramientas de IA generativa aplicada a la ilustración. En noviembre, presentaron enmiendas solicitadas por el juez. El proceso sigue adelante, igual que el de Copilot.

El tercer colectivo al que representan Butterick y Saveri son los autores de libros. En julio, registraron dos demandas colectivas contra OpenAI y Meta por incluir en su conjunto de datos de entrenamiento libros escritos por los demandantes, entre los que se encuentran Richard Kadri, Sarah Silverman y Christopher Golden.

Una amenaza muy real

La ilustradora Karla Ortiz se dio cuenta del tsunami que se le venía encima a ella y sus colegas de profesión en el verano de 2022. Esta puertorriqueña de 38 años puede considerarse una profesional de éxito. Ha trabajado para la mayoría de los grandes estudios cinematográficos de Hollywood, incluyendo Marvel Studios, HBO y Universal Pictures, así como para productoras de videojuegos como Blizzard y Ubisoft. De sus pinceles han salido personajes clave de taquillazos como Thor: Ragnarok, Doctor Strange o Jurassic World. Pero ni siquiera alguien de su caché se siente a salvo.

Ortiz empezó a investigar las herramientas de IA generativa aplicadas a la ilustración y no tardó en reconocer trazos de colegas suyos en los dibujos que producía la herramienta. “Me horrorizó ver que estas plataformas usan tu nombre, para que los usuarios puedan demandar tu estilo, y cogen tu trabajo para generar imágenes que se parecen a las tuyas”, explica por videollamada desde su estudio de San Francisco. “En ese momento empiezo a preocuparme mucho. Soy miembro de la junta directiva de la Asociación de Arte Conceptual de Estados Unidos, que reúne a artistas que trabajamos para la industria del cine y los videojuegos. Decidimos movilizarnos”.

Ortiz y otros dos compañeros se convirtieron en los demandantes en la demanda colectiva presentada en enero de este año por Butterick y Saveri contra Stability AI, Midjourney y DeviantArt. Su causa ganó vuelo cuando en julio la llamaron a testificar ante el Subcomité de Propiedad Intelectual del Senado de EE UU para hablar sobre legalidad y ética de la IA. “Eso hubiera sido inconcebible un año antes. Los senadores se están tomando en serio que a los creadores se les quiten sus obras sin su consentimiento, sin compensación y sin crédito”, apunta Butterick, que acompañó a su cliente al Capitolio.

“Para los ilustradores, una fuente de ingresos tradicionalmente importante es poner en imágenes las ideas de productores y directores para que las muestren a los estudios. Esa actividad ha quedado literalmente borrada por la IA generativa”, asegura. “Mi trabajo está en riesgo. Consiste en mostrar ideas, y eso ahora lo hacen muy bien las máquinas. Los artistas no podemos competir contra esas herramientas. Nunca me había preocupado el futuro de mi carrera hasta ahora”.

La IA llega a los juzgados

El impulso generado por las demandas colectivas interpuestas por Butterick y su colega ha abierto el camino a más demandas. A principios de año, Getty Images demandó a Stability AI por usar sin permiso imágenes de su archivo. En septiembre, otros dos grupos de escritores presentaron denuncias contra OpenAI. Los superventas George R. R. Martin, John Grisham y Jonathan Franzen están entre ellos. En octubre, varios sellos discográficos, incluyendo Universal Music Group, demandaron a Anthropic, empresa creada por extrabajadores de OpenAI, por entrenar sus algoritmos con materiales protegidos por derechos de autor. Los sindicatos de actores de Hollywood no han litigado, pero estuvieron de huelga durante meses para mejorar sus condiciones salariales y obtener garantías que les protejan contra la inteligencia artificial. The New York Times acaba de demandar a OpenAI y Microsoft por usar millones de artículos del rotativo en el entrenamiento de ChatGPT.

Butterick y Saveri saben que es ahora o nunca. Esta ola de demandas dice básicamente que la IA generativa es ilegal. Cuando esta tecnología esté plenamente asentada, será más difícil ir contra las empresas que la desarrollan. Pero como los tribunales concluyan que el entrenamiento de los algoritmos es ilegal, el golpe a las big tech puede ser mayúsculo. Tendrían que empezar de nuevo y rehacer las bases de datos. También sería desastroso para ellas tener que licenciar esas bases de datos, negociando pagos a cambio de permisos de cada fuente de la que han bebido.

¿Es demasiado optimista pensar en ese desenlace? “Eso ya ha ocurrido antes”, responde Butterick con una sonrisa. “La FTC [el regulador de EE UU] ha investigado a empresas que usaban modelos basados en datos privados e hizo que eliminaran sus bases de datos y los algoritmos y modelos construidos con ellos”, explica. Cambridge Analytica, la consultora que usó datos de más de 80 millones de usuarios de Facebook para influir en las elecciones presidenciales de 2016, fue la primera empresa en sufrir, en 2019, la nueva política de la FTC, bautizada como “destrucción algorítmica”.

En la UE, el Reglamento Europeo de Inteligencia Artificial, cuyo texto definitivo todavía no es público, pero del que ya hay acuerdo político, fija la obligación de que los modelos fundacionales cumplan la normativa comunitaria de derechos de autor. Habrá que esperar a ver la letra pequeña del reglamento para ver cómo se ejecuta.

Butterick ha aparcado durante casi un año la escritura, el diseño y la programación para centrarse en las litigaciones que tiene abiertas. Lo hace porque cree que es lo correcto, pero no solo por eso. “Tengo la firme convicción de que si no detengo mi trabajo habitual y me uno a estos casos, no me va a quedar nada. Cuando presentamos la primera demanda, la de Copilot, la gente nos miraba como si fuéramos unos locos o unos luditas”, subraya el estadounidense. “Ha pasado apenas un año y ya nadie duda del tremendo efecto que tiene la IA generativa en las profesiones creativas. Esto acaba de empezar. Tenemos que fijar salvaguardas para que esta tecnología no acabe con todo”.

Puedes seguir a EL PAÍS Tecnología en Facebook y X o apuntarte aquí para recibir nuestra newsletter semanal.

Suscríbete para seguir leyendo

Lee sin límites

El activista que acorrala a la inteligencia artificial en los juzgados: “Es la lucha de nuestras vidas” | Tecnología

Una amenaza muy real

La IA llega a los juzgados

Suscríbete para seguir leyendo

Por Marina Cifuentes

El activista que acorrala a la inteligencia artificial en los juzgados: “Es la lucha de nuestras vidas” | Tecnología

Una amenaza muy real

La IA llega a los juzgados

Suscríbete para seguir leyendo

Por Marina Cifuentes

Beneficios comprobados del ejercicio físico en el sistema cardiovascular

Arroz como fuente accesible de vitaminas B para una nutrición óptima

Cómo adaptar tu cuerpo a la dieta cetogénica paso a paso

La tecnología háptica como pilar de las experiencias inmersivas actuales