User Tools

Site Tools


rd:tail:index

TAIL pages

Project Reference

PTDC/EEI­ESS/1672/2014

Project Title

TAIL­ Research data management from creation to deposit and sharing

Highlights

Public Summary

For publication - In English

Research data management (RDM) is currently a concern for both researchers and funding agencies. On the researchers' side, there is a growing awareness of the value of the data created or collected in research contexts: papers with associated data get more citations, while valuable data attracts collaboration. Funding agencies, on the other hand, are establishing the mandates for data curation plans and data sharing as part of call regulations.

But research data management still has to be established as an integral part of research projects. This is already the case in areas such as the life sciences, where big projects such as the human genome have been built on custom databases from the start. Small research groups in the so-called long-tail of science lack the technology to address data management, but they have the potential to generate very large amounts of valuable and unique data in their domains.

Results in RDM require the concern with both technological and conceptual issues. The technological problems have to do with storage, but also with the interfaces for organizing, describing and depositing data. Conceptual problems have to do with description. Data stored in an infrastructure, no matter how solid, will be useless without the organization and description that only data creators can provide, and that will allow other domain experts to reuse the data.

The goal of the project is to bridge the gap between the data mandates which research groups are faced with and the available tools, workflows and description models. By the end of the 3-year project, there will be a panel of research groups that have successfully managed the datasets they were creating and who also reaped the benefits of having their data published, findable and cited. Such success stories are still lacking in the community and their lessons are invaluable for the progress of research data management. The project findings will be followed by the participating university, who will take part in the test of the adopted tools, with the goal of adopting them in stable supporting services.

The project team includes a group from INESC TEC who has preliminary work in the development of a data curation environment and in the design of ontology-based metadata models for research data, as well as in the EPOS and WindScanner.eu European infrastructures. The group from the University of Porto have a strong interest in the results of the project as the management of research data is part of their mission at the university level. The group from InBIO has been involved in the definition of metadata standards for the biodiversity domain and is now leading the Portuguese consortium for the LifeWatch European e-Science infrastructure for biodiversity and ecosystem research.

For publication - In Portuguese

A gestão dos dados de investigação (RDM) preocupa neste momento tanto os investigadores como as agências de financiamento. Do lado dos investigadores, há a consciência do valor dos dados criados ou reunidos em contexto de investigação: os artigos com dados associados têm mais citações, e dados valiosos atraem a colaboração. As agências de financiamento, por seu lado, estão a estabelecer os mandatos para planos de curadoria e partilha de dados como parte dos seus regulamentos.

No entanto a gestão dos dados ainda tem de se estabelecer como parte integrante dos projetos de investigação. Isto já acontece em áreas como as ciências da vida, em que projetos como o do genoma humano foram construídos com bases de dados dedicadas desde o início. Os grupos pequenos na chamada cauda longa da ciência não têm ainda a tecnologia para gerir os seus dados, mas têm potencial para gerar grandes quantidades de dados valiosos e únicos.

Os resultados em RDM requerem a consideração de questões tecnológicas e conceptuais. Os problemas tecnológicos têm a ver com armazenamento, mas também com as interfaces para organizar, descrever e depositar os dados. Os problemas conceptuais têm a ver com a descrição. Os dados armazenados numa infra-estrutura, por muito sólida que seja, serão inúteis sem a organização e descrição que só os criadores podem fornecer e que permitirá a outros especialistas do domínio reutilizá-los.

O objetivo do projeto é fazer a ponte entre os mandatos de dados com que os grupos de investigação se confrontam e as ferramentas, fluxos de trabalho e modelos de descrição. No final deste projeto de 3 anos, teremos um painel de grupos de investigação que terão gerido com sucesso os dados que estiveram a criar e que também colheram os benefícios de terem os seus dados publicados, pesquisáveis e citados. Estas histórias de sucesso faltam na comunidade e as suas lições são essenciais para o progresso na gestão dos dados de investigação. Ao longo do projeto, haverá serviços nas universidades participantes a acompanhar o teste das ferramentas adotadas, tendo em vista o seu uso em serviços estáveis de suporte aos investigadores.

A equipa do projeto inclui um grupo do INESC TEC que tem trabalho preliminar no desenvolvimento de um ambiente de curadoria de dados e no desenho de modelos de metadados para dados de investigação baseados em ontologias, e que tem participado nos trabalhos das infra-estruturas europeias EPOS e WindScanner.eu. O grupo da Universidade do Porto tem muito interesse nos resultados do projeto, uma vez que a gestão dos dados faz parte da sua missão na universidade. O grupo do InBIO está envolvido na definição de normas de metadados para a biodiversidade e lidera o consórcio português para e infra-estrutura europeia LifeWatch no domínio da investigação em biodiversidade e ecossistemas.

Publications

Meetings

TAIL 6-month meeting
6-month meeting, INESC TEC 2017-01-11

TAIL 18-month meeting
18-month meeting, INESC TEC 2018-03-13

TAIL 32-month meeting
32-month meeting, INESC TEC 2019-01-22

rd/tail/index.txt · Last modified: 2019/11/26 15:55 by Cristina Ribeiro