1 / 32

M08_Citacao_Dados_port

IDRC u2013 Open research data initiative [109059-013] supported this study.<br>Su00e9rie integrante do curso sobre datasets<br>Material traduzido por Jose Dutra O Neto, Ildeberto A Rodello<br>Apoio: IDRC u2013 Open research data initiative [109059-013]

989212
Download Presentation

M08_Citacao_Dados_port

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Tutoriaisnagestão de dados Módulo 08: Citação dos dados Citação de dados definida, benefícios da citação de dados, exemplos e práticas recomendadas para citação de dados . CC image by adesigna on Flickr,

  2. Tópicos a seremabordadosnesta aula • Citação de dados no ciclo de vida dos dados • Definições: O que é citação de dados? • Benefícios da citação de dados • Colaborando para apoiar a citação de dados • Como citar dados • Como obter um identificador persistente para um dataset • Melhores práticas recomendadas para oferecer suporte à citação de dados CC image by cybrarian77 on Flickr,

  3. Objetivos de aprendizagem • Após concluir esta lição, o participante será capaz de:: • Definir citação de dados • Descrever os benefícios da citação de dados • Identificar papéis de autores / gerentes de dados, editores de dados e editores de periódicos no suporte à citação de dados • Reconhecer elementos de metadados úteis para citação de dados • Reconheça localizadores de dados persistentes comuns e descreva o processo como obter um • Resuma as melhores práticas para dar suporte à citação de dados

  4. O ciclo de vida dos dados

  5. Definições • Citação de dados • “A prática de fornecer uma referência aos dados da mesma maneira que os pesquisadores rotineiramente fornecem uma referência bibliográfica aos recursos impressos”1 • “Uma prática fundamental subjacente ao reconhecimento de dados como uma produção primária de pesquisa e não como um subproduto da pesquisa” 1 • Autor dos dados • “Indivíduo envolvido em pesquisa, educação ou outras atividades que geram dados digitais que são posteriormente agregados a uma coleção de dados”2 • Identificador persistente • Um código alfanumérico único compatível com a Web que aponta para um recurso (por exemplo, dataset) que será preservado a longo prazo (por exemplo, ao longo de várias gerações de hardware e software) • Deve direcionar para a versão mais recente disponível do recurso ou para os metadados que permitem o acesso a versão ou formato desejado

  6. Benefícios da citação de dados • Curto prazo • Facilita a descoberta da relação entre os dados e as publicações, facilitando a validação e a evolução a partir de trabalhos anteriores • Facilita avaliações do impacto de datasets com base no número de publicações que os citam • Ajuda os pesquisadores a reutilizar os dados de outras formas além da originalmente utilizada CC image by futureatlas.com on Flickr,as “Citation Needed”

  7. Benefícios da citação de dados • Longo prazo • Promove a disponibilidade dos dados no futuro • Facilita a procura dos dados relevantes para um problema específico • Permite o reconhecimento de esforços acadêmicos dentro das áreas de conhecimento e nas organizações • Aumenta a transparência da pesquisa científica CC image by gruntzooki on Flickr

  8. Princípios da citação de dados • Importância - Os dados devem ser considerados produtos legítimos e como produto de pesquisas passíveis de citação. • Crédito e atribuição - As citações de dados devem facilitar o reconhecimento do crédito acadêmico e a atribuição normativa e legal para todos os colaboradores dos dados • Evidência - Na literatura acadêmica, quando utilizarmos os dados não podemos esquecer de sua citação. • Identificação única - Uma citação de dados deve incluir um método persistente de identificação que seja acionável por máquina, único globalmente e amplamente utilizado por uma comunidade. https://www.force11.org/datacitation

  9. Princípios da citação de dados • Acesso - As citações de dados devem facilitar o acesso aos dados, metadados, código e outros materiais de acordo com as necessidades dos homens e das máquinas que irão processar os dados. • Persistência - identificadores, dados e metadados exclusivos devem persistir além da vida útil dos dados que os descrevem. • Especificidade e verificação - As citações de dados devem facilitar a identificação, acesso e verificação dos dados específicos. • Interoperabilidade e flexibilidade - Os métodos de citação de dados devem ser flexíveis, mas devem permitem a interoperabilidade entre as comunidades. https://www.force11.org/datacitation

  10. Como citar dados • Semelhante a citar um artigo ou livro publicado • Forneça as informações necessárias para identificar e localizar o trabalho citado • Use os padrões de citação de dados amplamente aceitáveis que ​​ainda não foram estabelecidos; usar padrões adotados por periódicos acadêmicos relevantes, repositório de dados ou organização profissional • Em "Alcançando acessibilidade humana e por máquina de dados citados em publicações acadêmicas" Starr et al. (2015) começaram a estabelecer diretrizes de implementação em todas as áreas de conhecimento1 • doi: 10.7717/peerj-cs.1

  11. Informações necessárias para uma citação • Autor / Pesquisador Principal / Criador dos Dados • Data de lançamento / ano de publicação - ano de lançamento • Título da fonte de dados - título formal do dataset • Version/Edition Number – the version of the dataset used in the study • Númeroda versão ou edição - a versão do conjunto de dados usado no estudo • Formato dos dados - formato físico dos dados • Produtor de dados de terceiros - refere-se aos dados acessados ​​de um repositório de terceiros • ARepositório- o local que contém o dataset

  12. Informações necessárias para uma citação • Localizador ou identificador - inclui identificadores de objeto digital (DOI), identificadores, chave de recurso de arquivamento (ARK) etc. • Data e hora de acesso - quando os dados são acessados ​​online • Subconjunto de dados usados - descrição baseada na organização do dataset “mãe” • Editor ou Colaborador - referência a uma pessoa que compilou dados ou executou funções no processo de criação e disponibilização dos dados • Local da publicação - cidade, estado e país do repositório dos dados • Dados em um trabalho maior - refere-se ao uso de dados de uma compilação ou suplemento de dados (como publicado em um artigo revisado por pares)

  13. Exemplos de formatos de citação de dados • DataCite:Criador (ano da publicação): título. Editor. Identificador • Dryad:Autor (Data da publicação do artigo) Dados de: artigo. Repositório Digital da Dríade. doi: número DOI CC image by Paxsimius on Flickr

  14. Exemplos de formatos de citação de dados • Parceiros de informação de ciências da terra (ESIP) 1 : • Elementos de citação obrigatórios: Autor. Data de lançamento. Título. Versão. Repositório. Localizador / Identificador. Data e hora do acesso. • Elementos opcionais de citação: Subconjunto Usado; Editor, Compilador ou outra função importante na criação do dataset • Exemplo de umacitação: • Zwally, H. J., R. Schutz, C. Bentley, J. Bufton, T. Herring, J. Minster, J. Spinhirne, and R. Thomas. 2011. GLAS/ICESat L1A Global Altimetry Data, Version 33. [Indicate subset used]. Boulder, Colorado USA. NASA National Snow and Ice Data Center Distributed Active Archive Center. doi: http://dx.doi.org/10.5067/ICESAT/GLAS/DATA121. [Date Accessed].

  15. Exemplos de formatos de citação de dados • Aliança de Dados de Pesquisa (RDA): • O Grupo de Trabalho da RDA sobre Citação de Dados (WG-DC) 1 visa reunir um grupo de especialistas para discutir as questões, requisitos, vantagens e desvantagens das abordagens existentes para citar subconjuntos de dados. • As recomendações finais do WG-DC foram publicadas em “Citação de dados em evolução de dados” em 201522. • Elementos de citação recomendados: identificação de consulta e armazenamento persistentes de consultas com a versão dos dados; registro de data e hora, um subconjunto específico pode ser recuperado reexecutando a consulta. • Exemplo de citação: • Stefan Proell (2015) “Austria Facts” created at 2015-10-07 10:51:55:0, PID[ark:12345/qmZi2wO2vv]. Subset of CIA: “The CIA World Factbook”, PID[ark:12345/cLfH9FjxnA].

  16. Quais são exemplos de identificadores persistentes? A persistent identifier should be included in the citation: • DOI (Digital Object Identifier) • Globally unique, alphanumeric string assigned by a registration agency to identify content and provide a persistent link to its location. • May be assigned to any item of intellectual property that is defined by structured metadata • Examples:10.1234/NP5678, 10.5678/ISBN-0-7645-4889-4; 10.2224/2004-10-ISO-DOI • ARK (Archival Resource Key) • URL designed to support long-term access to information objects • Can refer to digital, physical, or intangible objects or living beings and groups • Example: http://ark.cdlib.org/ark:/13030/tf5p30086k

  17. Quais são exemplos de identificadores persistentes? More persistent identifiers: • UUID (Universally Unique Identifier) • ‘practically unique’ identifiers that can be generated by distributed systems but later combined into a single database without needing to resolve identifier (ID) conflicts • 32 hexadecimal digits, displayed in five groups separated by hyphens, in the form 8-4-4-4-12 for a total of 36 characters • Example: 550e8400-e29b-41d4-a716-446655440000 • Researcher identifier: ORCID (Open Researcher & Contributor ID) • Central registry of unique identifiers for individual researchers to address author name ambiguity • Transparent linking mechanism between ORCID and other author ID schemes

  18. Como obter um DOI para umdataset • Contact organization/institution that can create DOIs • Organization hierarchy • 20+ services registered through DataCite include • California Digital Library’s EZID • ANDS Cite My Data Service • DataCite Canada

  19. Como obter um DOI para um dataset • Provide data and necessary citation profile (metadata) • DataCite: creator, title, publisher, publication year • Dublin Core: creator, title, publisher, date • ERC: who, what, when • Additional information: owner, owner group, co-owners • Receive DOI to be used for citation purposes

  20. Esforço colaborativo • Requires participation of a variety of individuals and institutions • Journal publishers • Data publishers/repositories • Data authors • Data managers • Data users • Professional organizations CC image via Wikimedia Commons (Masur, derivative of Al Maghi)

  21. Colaborando com editores • Os autores e gerentes de dados devem • Escolha o repositório apropriado para publicação de seus dados • Use padrões comuns para dados e metadados • Trabalhe os dados para atingir o padrão necessário para publicação • Obter informações de citação do editor e incluí-las em artigos associados de acordo com os padrões de citação da revista • Inclua citações para quaisquer datasets anteriores usados ​​na pesquisa • Notificar o editor (ex: repositório) sobre os artigos associados

  22. Colaborando com editores • Osrepositórios de dados devem: • Garantir que dados e metadados permaneçam acessíveis, robustos e utilizáveis ​​por um longo período • Atribuir identificadores persistentes e únicos para que os dados sejam acessíveis • Tornar as informações de citação de dados facilmente localizáveis ​​pelos usuários de dados Image courtesy of https://pixabay.com/en/collaboration-collaborator-book-1106196/ • Os editores de periódicos devem • Fornecer orientações claras sobre como e onde os datasets devem ser citados • Responda às necessidades de autores, agências de financiamento e repositórios de dados • Alertar os editores ao publicar um documento que cite um datasets

  23. Melhores práticas recomendadas para o suporte à citação de dados • Para dar suporte ao acesso aos seus dados (ex: dados ambientais): • Use ferramentas que suportam a criação de metadados para datasets • Morpho • Metavist (USDA Forest Service) • Mermaid (NOAA) • Use palavras-chave padronizadas para descrever os seus dados • Biocomplexity Thesaurus (USGS) • Global Change Master Directory (NASA) • Use um identificador persistente como DOI ou ARK

  24. Melhores práticas recomendadas para o suporte à citação de dados • Trabalhar com editores de periódicos e repositórios de dados para arquivar dados durante o processo de publicação • Permite que as informações sobre como acessar o seu conjunto de dados sejam publicadas juntamente com seu artigo • Nota: Data repositories typically offer to embargo archived data for a pre-determined time period after publication • Os repositórios de dados geralmente oferecem a opção de embargo dos dados (onde não são públicos por um período após a publicação) • Permite que a citação de artigos / DOI seja incluída no dataset • Incentivar outros autores de dados a citar os dados e a disponibilizar seus próprios dados para reutilização pro outros pesquisadores: • Forneça informações completas acerca da citação para os dados, sempre que você publicar pesquisas que utilizem os dados de outro autor • Armazenar os seus próprios dados em um repositório público que suporte a busca e reutilização de dados • Atualizar os seus datasets arquivados nos repositórios quando novas versões mais recentes estiverem disponíveis

  25. Citação de Software Científico “A citação de software é uma área em evolução. Uma pesquisa na web sobre 'como citar software' e suas variantes mostra que essa é uma pergunta popular. As respostas podem ser classificadas de maneira geral nos formatos de citação recomendados pelos periódicos, formatos de citação recomendados / exigidos pelos fornecedores de software e, o mais controverso, a visão de que o software não é algo a ser citável. ” - Mike Jackson, Software Sustainability Institute Image courtesy of https://pixabay.com/en/code-programming-hacking-html-web-820275/

  26. Citação de Software Científico Por que citar software? • O próprio software pode ser considerado um dado ou um produto resultante de uma pesquisa • As conclusões de um estudo não se baseiam apenas em dados, mas no software usado para suportar a análise dos dados. • A citação de software é essencial para permitir replicar os resultados. • Atribua os devidos créditos aos autores do software. Quando citar software? • O software tipo “padrão” (por exemplo, Word, Excel) e as linguagens de programação não precisam de citações formais. • Faça citações para os programas especializados / personalizados quando seu uso impactar diretamente nos resultados.

  27. Exemplos de informações necessárias para citações de software Semelhante à citação de dados, as citações de software devem incluir: • Título / Nome do Software • Autor / Desenvolvedor - se conhecido • Data de Lançamento / Ano • Número da versão - a versão do software / programa usado • Descritor - o texto “[programa de computador]” (incluindo colchetes) é frequentemente incluído na citação • Nome e local do editor - se aplicável • URL - se o software estiver disponível online, forneça o URL • DOI - se houver algum para o software, cite-o

  28. Exemplos de citação de software • Software purchased off-the-shelf1: Product Name. Version. Release Date. Publisher. Location. • SuperScience. 1.2. December 2012. Research Software. Edinburgh, UK. • Software downloaded from the web1: Product Name. Version. Release Date. Publisher. Location. DOI or URL. Download Date. • OGSA-DAI REST. 4.2.1. December 2012. OGSA-DAI Project. http://sourceforge.net/projects/ogsa-dai. 27/04/2012. • Software provided by a researcher1: Product Name. Author. Location. Contact Details. Received Date. • BestFFTroutine ever file. Fred Bloggs, EPCC, The University of Edinburgh, UK. Fred.bloggs@epcc.ed.ac.uk. 27/04/2012. • AMA Format2: • Epi Info [computer program]. Version 3.2. Atlanta, GA: Centers for Disease Control and Prevention; 2004. • APA Format3: • Hayes, B. et al. (2003). OTSoft: Optimality Theory Software (Version 2.1) [Software]. Available from http://www.linguistics.ucla.edu/people/hayes/otsoft/

  29. Recursos para a citação de software • The Software Sustainability Institute:http://www.software.ac.uk/ • Working towards Sustainable Software for Science Practice and Experiences (WSSSPE):http://wssspe.researchcomputing.org.uk/ • NSF Workshop on Supporting Scientific Discovery through Norms and Practices for Software and Data Citation and Attribution:https://softwaredatacitation.org/Pages/home.aspx • Software Carpentry and Data Carpentry:http://software-carpentry.org/ and http://www.datacarpentry.org/

  30. Recursos • Australian National Data Service (ANDS), Data Citation Awareness Guide. Accessed April 9, 2015 at http://ands.org.au/guides/data-citation-awareness.html. • Ball, A. & Duke, M. (2011). How to Cite Datasets and Link to Publications. DCC How-to Guides. Edinburgh: Digital Curation Centre. Accessed April 9, 2015 at http://www.dcc.ac.uk/resources/how-guides. • CODATA-ICSTI Task Group on Data Citation Standards and Practices. (2013). Out of Cite, Out of Mind: The Current State of Practice, Policy, and Technology for the Citation of Data. Data Science Journal, 12: CIDCR1 - CIDCR75. Accessed April 9, 2015 at http://dx.doi.org/10.2481/dsj.OSOM13-043. • Costello, M. J. (2009). Motivating Online Publication of Data. BioScience, 59(5): 418-427. Accessed April 9, 2015 at http://www.bioone.org/doi/full/10.1525/bio.2009.59.5.9. • CrossCite DOI Citation Formatter. Accessed April 9, 2015 at http://crosscite.org/citeproc/. • Data Citation Principles Glossary. FORCE11. Accessed April 9, 2015 at Accessed April 9, 2015 at https://www.force11.org/node/4770.

  31. Recursos • Data Citation Synthesis Group. (2014). Joint Declaration of Data Citation Principles. Martone, M. (ed.). San Diego, CA: FORCE11. Accessed April 9, 2015 at https://www.force11.org/datacitation. • Duke, C. S. & Porter, J. H. (2013). The Ethics of Data Sharing and Reuse in Biology. BioScience 63: 483-489. Accessed April 9, 2015 at http://dx.doi.org/10.1525/bio.2013.63.6.10. • ESIP Federation Interagency Data Stewardship/Citations/Provider Guidelines. Accessed April 9, 2015 at http://bit.ly/data_citation. • Hakala, J. Persistent identifiers – an overview. Accessed April 9, 2015 at http://metadaten-twr.org/2010/10/13/persistent-identifiers-an-overview/. • Starr J, Castro E, Crosas M, Dumontier M, Downs RR, Duerr R, Haak LL, Haendel M, Herman I, Hodson S, Hourclé J, Kratz JE, Lin J, Nielsen LH, Nurnberger A, Proell S, Rauber A, Sacchi S, Smith A, Taylor M, Clark T. (2015) Achieving human and machine accessibility of cited data in scholarly publications. PeerJ Computer Science 1:e1 https://doi.org/10.7717/peerj-cs.1 • Jackson, Mike. 2012. How to cite and describe software. Software Sustainability Institute. http://www.software.ac.uk/how-cite-and-describe-software?mpw. Accessed May 12, 2016.

  32. The full slide deck may be downloaded from: http://www.dataone.org/education-modules Suggested citation: DataONE Education Module: Data Citation. DataONE. Retrieved Nov12, 2012. From http://www.dataone.org/sites/all/documents/L09_DataCitation.pptx Copyright license information: No rights reserved; you may enhance and reuse for your own purposes. We do ask that you provide appropriate citation and attribution to DataONE.

More Related