Según ha explicado esta organización en un comunicado, la base de datos retirada contenía numerosos contenidos textuales –entre ellos, libros, prensa o subtítulos– que habían sido comprimidos para facilitar su uso en el entrenamiento de modelos de inteligencia artificial (IA). Esto se debe a que los sistemas de IA necesitan muchos datos y materiales para poder funcionar y replicar las capacidades humanas.

Además, el director de BREIN, Bastiaan von Ramshort, aseguró que muchos de los contenidos editoriales que se estaban utilizando incluían una cláusula de reserva de derechos de autor: «Se buscó en el conjunto de datos el texto “no se puede reproducir nada de esta publicación” y se obtuvieron más de 10.000 resultados». Por tanto, el uso de estos materiales vulnera los derechos de propiedad intelectual de sus autores y editores.

Próximos pasos

El usuario que se encargó de recopilar y compartir este archivo ilícito firmó una declaración en la que prometía no volver a infringir la ley –según ha informado la propia organización– y, además, proporcionó información sobre quiénes recibieron ese archivo de datos.

BREIN está investigando ahora qué modelos de IA utilizaron estos contenidos sin autorización y se pondrá en contacto con quienes estén pudiendo usar de forma ilícita estos materiales.

© de la imagen: Shutterstock