Datos de investigación: Gestión, planificación y difusión

ca | es | en

¿Qué son los datos de investigación?

Los datos de investigación son los datos recogidos, utilizados o generados durante el proyecto de investigación.

Definición

"hechos, observaciones o experiencias en función de los cuales se construyen o se ponen a prueba un argumento o una teoría. Los datos pueden ser numéricos, descriptivos, auditivos o visuales; en bruto, resumidos o analizados; experimentales u observacionales."
Fuente: Proyecto LEARN

Clasificación y ejemplos

  • Contenido: datos numéricos, tabulares, textuales, audiovisuales, sonoros, multimedia, computacionales o de secuenciación genómica, entre otros.
  • Formato: hojas de cálculo, imágenes, mapas, encuestas, ficheros de audio, grabaciones sonoras y audiovisuales o texto estructurado, entre otros.
  • Método: 
    • Observacionales: datos capturados en tiempo real, no repetibles.
    • Simulaciones: datos generados por modelos predictivos.
    • Experimentales: se recogen haciendo experimentos.
    • Derivados o de referencia: datos que derivan de otros datos, pueden ser datos crudos o procesados.
  • Naturaleza: digitales (creados digitalmente) o no digitales (encuestas en papel, datos recogidos en hojas de campo, etc.).
  • Recurso:
    • Datos primarios: se recogen por primera vez y, por lo tanto, tienen carácter original.
    • Datos secundarios: datos que ya han sido recogidos por otra persona, que ya han pasado por algún tipo de procesamiento, normalmente estadístico y que otro alguien ha creado con un objetivo específico.
  • Procesamiento:
    • Datos crudos: datos primarios no procesados.
    • Datos procesados: cualquier modificación de los datos crudos, como limpieza de datos, modificación o cálculos.

Fuente: CSUC

Gestión de datos de investigación

La Gestión de los Datos de Investigación (GDI), en inglés RDM (Research Data Management), incluye la recopilación, organización, documentación, almacenamiento y preservación de los datos utilizados durante un proyecto de investigación.

Con una buena GDI, entre otras ventajas, se realiza un uso eficiente de los recursos disponibles y se ahorra tiempo, además de mejorar la visibilidad, impacto y el perfil del personal investigador. 

 

Gráfico con el circuito: Recopilación de datos, Procesamiento de datos, Estudio y análisi de datos, Publicación y acceso a datos, Conservación de datos, Reutilización de datos, Ideas de investigación, Planificación y diseño de datos de investigación, Recopilación de datos

Descárgate el gráfico con el circuito de gestión de datos de investigación. Fuente: CSUC

Datos de investigación en abierto: estrategia europea FAIR

¿Por qué publicar los datos en abierto?

Publicar los datos de investigación en abierto permite garantizar el acceso, de forma libre y universal, a estos datos, así como una correcta preservación, explotación, reproducción, difusión, visibilidad e impacto de los mismos. También permite cumplir con los requisitos de los organismos financiadores.

 Publicar los datos en abierto es una obligación para el personal investigador que quiera acceder a fondos de investigación de diferentes programas y organismos, como por ejemplo los que se encuentran en el marco Horizon Europe (2021-2027).


Estos datos en abierto deben seguir los principios FAIR (Findable, Accessible, Interoperable, Reusable), que implican facilitar la reproducción, réplica y reutilización de los datos, y se aplican a los diferentes repositorios, como CORA.RDR (Repositori de dades de recerca) o Zenodo, entre otros.

Findable (Encontrables). Descubiertos con los metadatos (campos para describirlos) y se identifican y localizan mediante un mecanismo de identificación estándar. Accessibe. Siempre disponibles y que puedan obtenerse. Aunque los datos estén restringidos, los metadatos estarán abiertos. Interoperable. Analizables sintácticamente y comprensibles semánticamente, permitiendo el intercambio y la reutilización de datos entre investigadores, instituciones, organizaciones o países. Reusable. Suficientemente descritos y compartidos con las licencias menos restrictivas, permitiendo la reutilización más àmplia posible y la integración menos pesada con otras fuentes de datos.

Descárgate el documento ¿Qué significa que los datos sean FAIR?

Datos de carácter personal

Los datos personales identifican o pueden identificar a personas concretas de forma directa o indirecta. Ejemplos: un nombre, un número de identificación, datos de localización, un identificador online o uno o varios elementos propios de la identidad física, fisiológica, genética, psíquica, económica y cultural, etc. 

Si tu proyecto incluye datos personales, solicita la revisión ética consultando a la Comisión Institucional de Revisión Ética de Proyectos (CIREP-UPF).