Preguntas frecuentes sobre Minería de Textos y Datos

FESABID | 8 JUNIO 2023

¿Qué es la minería de texto y datos?

Es una técnica de tratamiento de grandes cantidades de datos, habitual en universidades, centros científicos y empresas orientadas a la innovación.
Sirve para analizar textos y datos ya existentes, e identificar patrones, pautas, tendencias, con los que generar nueva información y conocimiento.
La minería puede realizarse mediante la extracción de patrones y frecuencias, estableciendo asociaciones y correlaciones, formulando clasificaciones, agrupaciones, detectando valores atípicos. Incluye datos estadísticos, visuales y sonoros.

¿Dónde se regula?

En los artículos 2, 3, 4 y 7 de la Directiva Europea de Derechos de Autor en el Mercado Único Digital (Directiva 2019/790), y en la transposición de esos artículos en la legislación española, mediante los artículos 66 y 67 del Real Decreto-Ley 24/2021, que se encuentra actualmente en proyecto de ley, en el Congreso de los Diputados.
Es deseable que, tras ese proyecto de ley, se incorpore en la Ley de Propiedad Intelectual, en la Ley de la Ciencia, y en otros textos legales que tienen incidencia en universidades, centros científicos y empresas orientadas a la innovación.

¿Qué significa que sea un “límite”?

La Ley de Propiedad Intelectual reconoce ciertos límites a los derechos de autor, para garantizar el equilibrio entre esos legítimos derechos, y los derechos de la sociedad a tener acceso a la información, la cultura, el progreso científico y la educación.
La minería de textos y datos es uno de esos límites: el titular de los derechos no puede oponerse porque el interés general lo permite.

El nuevo límite a la minería de texto y datos tiene una especial repercusión en el entorno de la investigación pero, ¿qué se considera investigación científica?

La ley no define este concepto y la Directiva Europea de Derechos de Autor en el Mercado Único Digital (Directiva 2019/790, DEMUD) únicamente aclara que incluye tanto las ciencias naturales como las humanas. También añade que los organismos de investigación tienen como principal objetivo la investigación científica.
En este sentido, la DEMUD enumera qué considera como organismos de investigación: universidades y otros centros de educación superior y sus bibliotecas, entidades como los institutos de investigación y los hospitales que llevan a cabo investigaciones. Se precisa que sus actividades no deben tener ánimo de lucro o los beneficios deben revertir íntegramente en las investigaciones científicas, o bien, la investigación debe fundamentarse en una misión de interés público. En el caso de que colaboren empresas, estas no deben tener acceso preferente a los resultados.

¿Están obligadas las bibliotecas, archivos y museos a autorizar la realización de minería de textos y datos sobre recursos de titularidad de la propia institución, como repositorios o catálogos bibliográficos?

En general, sí. Debe autorizarse en el caso de usuarios de organismos de investigación e instituciones responsables del patrimonio cultural con fines de investigación científica no comercial.
En el caso de otros usuarios legítimos con otros fines, la institución puede autorizarlo o no. También se pueden establecer ciertas condiciones mediante sistemas de lectura automática o mediante firma de condiciones de uso u otros.

Con vistas a la realización de actividades de minería de textos y datos, ¿qué se ha de tener en cuenta en las licencias de suscripción de bases de datos?

En el caso de organismos de investigación o a instituciones responsables del patrimonio cultural y que realicen actividades de minería de textos y datos con fines de investigación científica en interés público o sin finalidad comercial, se debe velar porque las medidas de seguridad no anulen el ejercicio de la excepción y no vayan más allá de lo necesario para garantizar la seguridad e integridad de las redes (por ejemplo, sí se admitiría la validación de la dirección IP de los usuarios autorizados o de su autenticación, pero no medidas para el control de la investigación).
Para cualquier otro usuario legítimo de obras protegidas por derechos de autor, incluidas las bases de datos y programas de ordenador, deberíamos comprobar si permiten la realización de actividades de minería de textos y datos y en qué condiciones.

¿Cómo debemos actuar si nos suspenden el acceso a una base de datos suscrita porque se han realizado actividades de minería de textos y datos?

Debemos comprobar quién ha realizado las actividades y para qué fines.
En el caso de organismos de investigación o a instituciones responsables del patrimonio cultural y que realicen actividades de minería de textos y datos con fines de investigación científica en interés público o sin finalidad comercial, deberíamos ponernos en contacto con los proveedores de la base de datos para aclarar que la actividad realizada está amparada por la legislación y solicitar la reactivación inmediata del acceso al recurso.
En otros casos debemos revisar el contenido de la licencia para ver si se permiten las actividades de minería de textos y datos o no, y comprobar las condiciones para ver si el uso realizado está o no permitido. En el caso de no cumplimiento con las condiciones, debería actuarse de acuerdo a lo establecido para los incumplimientos de licencia (desde la opción más básica: negarse a aceptar esa cláusula antes de firmar el contrato, hasta la más extrema: iniciar un proceso de demanda civil en los juzgados).

¿La institución a la que pertenecen los investigadores que han minado contenidos suscritos puede conservar el dataset resultante de la actividad de minería?

El contenido protegido por derechos de autor únicamente puede conservarse con fines de verificación científica del proyecto cuando corresponda a organismos de investigación o a instituciones responsables del patrimonio cultural y que realicen actividades de minería de textos y datos con fines de investigación científica en interés público o sin finalidad comercial. La conservación no implica que se pueda publicar los datos reproducidos o extraídos en la minería de textos y datos.
En el caso de otros usuarios legítimos con otros fines, los datos podrán conservarse el tiempo necesario para la finalidad por la cual se realizan las actividades de minería de textos y datos, siempre que no haya reserva por parte de los titulares de los derechos.