Desafios na adoção dos metadados PROV em repositórios científicos
- Ciência da Informação Express CIE
- 19 de mar.
- 2 min de leitura
por Ciexpress
O estudo Família PROV e repositório de dados no contexto do Re3data, de autoria de Felipe Ivo da Silva e Felipe Augusto Arakaki, investiga a adoção dos padrões de metadados da Família PROV em repositórios de dados de pesquisa listados no Research Data Repositories Information (Re3Data). A pesquisa analisou um total de 3.302 repositórios, dos quais apenas oito adotam esses padrões, evidenciando desafios na gestão de dados científicos.

A metodologia adotada consistiu na busca e análise de repositórios de dados na base Re3Data, com a categorização das instituições que utilizam metadados PROV. Os dados foram coletados e analisados qualitativamente, visando compreender a distribuição geográfica e a adoção dos padrões de proveniência nos repositórios de dados.
Os resultados indicaram que, apesar da importância da proveniência para a rastreabilidade, integridade e reutilização dos dados ao longo do tempo, a adoção dos padrões PROV é extremamente baixa. Apenas oito repositórios, de países como Estados Unidos, Alemanha, Noruega e Holanda, utilizam esses metadados, destacando a necessidade de ampliação do uso dessas práticas.
Entre os padrões de proveniência identificados, destacam-se prov:wasGeneratedBy e prov:wasDerivedFrom, que permitem rastrear a origem e as transformações dos dados. A presença desses padrões foi observada apenas nos repositórios TROLLing e DataverseNO, enquanto os demais repositórios analisados não apresentaram uso explícito desses metadados.
A baixa adoção dos padrões PROV sugere desafios institucionais e técnicos que dificultam sua implementação. Fatores como a falta de diretrizes claras e a ausência de políticas institucionais voltadas à gestão da proveniência dos dados podem estar entre os motivos dessa baixa adesão.
A pesquisa destaca a necessidade de esforços para incentivar a implementação dos metadados PROV nos repositórios de dados científicos. O suporte de instituições como o Digital Curation Centre (DCC) pode ser fundamental para promover a conscientização e a adoção dessas práticas no contexto da Ciência Aberta.
Em conclusão, o estudo reforça a relevância dos padrões de proveniência para a qualidade e confiabilidade da pesquisa científica. A ampliação do uso dos metadados PROV pode contribuir significativamente para a transparência e a reprodutibilidade dos dados, beneficiando pesquisadores e instituições em todo o mundo.
Para acessar o texto na íntegra:
SILVA, Felipe Ivo da; ARAKAKI, Felipe Augusto. Família PROV e repositório de dados no contexto do Re3data. Ciência da Informação Express, Lavras, v. 6, 2025. DOI: https://doi.org/10.60144/v6i.2025.136.
*Texto elaborado com apoio de Large Language Model ChatGPT.
Comments