310 likes | 324 Views
Projeto species Link. Objetivos originais e resultados alcançados . Objetivo (Fase 1) – Concepção 1999. resolver o problema da integração dos dados históricos contidos nas coleções biológicas, tornando-os amplamente disponíveis para a comunidade científica e educacional.
E N D
Projeto speciesLink Objetivos originais e resultados alcançados
Objetivo (Fase 1) – Concepção 1999 • resolver o problema da integração dos dados históricos contidos nas coleções biológicas, tornando-os amplamente disponíveis para a comunidade científica e educacional. • desenvolver aplicativos que façam uso dos dados integrados, visando criar ferramentas acessíveis a um público mais amplo.
Objetivos principais • Implementar uma rede distribuída de informação sobre biodiversidade para o Estado de São Paulo, explorando as novas tecnologias e melhor conectividade (Internet 2) para a integração de bases de dados heterogêneas e independentes. As bases de dados a serem integradas incluirão 12 coleções biológicas do Estado de São Paulo, a rede Species Analyst e o SinBiota; • A proposta previa a repatriação de dados de subcoleções específicas fora do estado de São Paulo (no Brasil e no exterior)
Objetivos principais • (2) Integrar ferramentas de modelagem de nicho ecológico e de previsão de distribuição geográfica de espécies ao sistema, utilizando dados da rede distribuída descrita no item (1)
Objetivos principais • (3) Desenvolver aplicativos que façam uso dos dados integrados na rede de informação distribuída descrita no item (1) e dos modelos matemáticos de distribuição no item (2) para dar suporte à comunidade científica, educacional, tomadores de decisão e formuladores de políticas ambientais.
Requisitos esperados da rede • Disponibilidade: a rede deve estar disponível, em funcionamento sempre; • Tolerância a falhas: a rede deve ser capaz de operar quando alguns nós não estiverem funcionando; • Desempenho e Robustez: a rede deve ser capaz de processar e responder em um tempo razoável um grande número de solicitações simultâneas; • Descoberta de novos nós: a rede deve ter mecanismos automáticos ou manuais para inclusão de novos nós; • Independência de plataforma: o software deve operar em ambientes computacionais heterogêneos; e, • Escalabilidade: a rede deve ter capacidade para aumentar o número de nós, sem que seja necessário desenvolver novos componentes de software.
Estratégia adotada • software: livre e/ou de código aberto • hardware: intel based • protocolo de comunicação: participar do desenvolvimento do DiGIR • modelo de dados: adotar e participar da discussão do modelo DarwinCore • sistema on-line de acesso livre e aberto • autonomia plena às coleções com relação à escolha do software de gerenciamento e à disponibilização dos dados (entrada, correção, saída e controle de dados sensíveis feitos pela coleção)
Estratégia Coleções: • Pressuposto Inicial: cada coleção dispunha de um software de gerenciamento e o papel do CRIA seria o de entender o sistema e, com a mínima interferência possível, conectá-lo à rede. • Constatação: a grande maioria das coleções não tinha sistema de gerenciamento implementado e nem equipe de apoio para dar suporte a esse trabalho. • Resultado: foi necessário oferecer suporte com relação à escolha do software de gerenciamento do acervo e serviços como importação dos dados, configuração do computador, etc.
Estratégia repatriação de dados • A proposta original previa a implementação de bolsas para a digitalização de acervos no exterior, de interesse do país. • No entanto as grandes coleções no exterior passaram a digitalizar e disponibilizar seus dados na Internet • Optamos por investir mais no desenvolvimento de tecnologia de integração de dados ao invés de "trazer" esses dados para um servidor central. • Deu-se prioridade a bolsas para auxiliar as coleções na digitalização de seus acervos
Modelagem • desenvolvimento do GARP (Genetic Algorithm for Rule-set Production)em colaboração com a Universidade de Kansas • vinda do Town Peterson e Arthur Chapman • produção de alguns trabalhos colaborativos • Com a experiência adquirida durante o projeto a equipe do CRIA concluiu que para tornar a ferramenta de modelagem mais útil e principalmente mais acessível aos pesquisadores, seria necessário o desenvolvimento de um ambiente que automatizasse partes do processo - openModeller
Proposta para a Fase 2 • Ampliação da rede para 33 coleções biológicas do Estado de São Paulo. • revisão do esquema de metadados do portal DiGIR; • desenvolvimento de ferramentas para o monitoramento da rede; • desenvolvimento de interface para visualização geoespacial dos resultados; • desenvolvimento de ferramentas de apoio à limpeza e correção de dados; e, • disponibilização on-line de dicionários de nomes e bancos de dados de localidade e coletores. • Nota: o desenvolvimento de um ambiente computacional para modelagem não foi aprovado
Padronização • ferramentas de data cleaning • trabalho com coletores (botânica) • houve uma breve discussão sobre padronização de nomes de estados na lista
Resultados • Monitoramento • Data Cleaning • Perfil das Coleções • Informação on-line
Respostas ao questionário - Ácaros • Software: Biota (1), Excel (1), Excel-Biota (1) • Plano digitalização: • (1) espécimes já identificados (2) organismos em estudo (pós) na conclusão dos trabalhos • 1o. Organização em fichários • 1o. Material já organizado • Sugestões: • associação parasito – hospedeiro • treinamento biota
Respostas ao questionário - Aranhas • Software: Excel (1) • Plano digitalização: • Não, tendência organização dos lotes por família • Sugestões: • erros na digitação por falta de treinamento, sem uma noção da estrutura de dados = erros (p.ex. falta de padronização dos nomes das localidades) • Bolsista é bom mas o ideal é a existência de um técnico no quadro funcional
Respostas ao questionário - Entomológica • Software: Access, Excel • Plano digitalização: • Não, sim • Problema apontado: • não existe na universidade a função de curador • Sugestões: • ferramenta para gerenciar referências bibliográficas • ferramenta que permitisse pesquisar organismos relacionados a determinadas espécies • ferramentas de distribuição temporal dos espécimes • elaboração de um manual explicando passo-a-passo como configurar o programa que filtra • Estudar junto à Fapesp a possibilidade da criação de bolsas para digitação de acervos para dar continuidade aos trabalhos
Respostas ao questionário - Abelhas • Software: Excel-Access • Plano digitalização: • sim: esquema inicial dos campos,vinculação das tabelas, relacionamento dos campos • Sugestões: • CRIA tivesse uma participação mais efetiva na escolha do software • Elaboração de um programa ‘único’ pelo CRIA • minicurso pré início digitação • Maior flexibilidade para inclusão de novos campos
Respostas ao questionário – Mamíferos, aves, ... • Software: Biota, Access • Plano digitalização: • inclusão seguindo a ordem crescente da numeração • criação de 2 bancos de dados (roedores, aves), definição de prioridades por ‘grupo’ (roedores, peles taxidermizadas, ... • Sugestões: • treinamento Access • extensão do prazo para a digitalização do acervo • cursos temas relacionados ao CRIA e coleções para crescimento profissional dos bolsistas • treinamento bolsistas software de gerenciamento
Respostas ao questionário - Peixes • Software: Biota • Plano digitalização: • sim: plano geral elaborado em 2000 auxílio pesquisa Fapesp • Sugestões: • treinamento prévio do bolsista na rotina da coleção (responsabilidade da coleção)
Respostas ao questionário – Anfíbios e Répteis • Software: Access, Excel-Biota • Plano digitalização: • digitalização do acervo já tombado, correção e refinamento, tombamento de outra coleção, digitalização, ... • reorganização da coleção, substituição de etiquetas apagadas, conferência dos livros de registro, inserção de novos exemplares, digitação, disponibilização no speciesLink • Sugestões: • CRIA poderia contribuir mais com a escolha do software • desenvolvimento de um banco de dados brasileiro, em português • trabalhar mais para aprimorar o gazetteer • Falta visibilidade ao projeto (comunidade científica e sociedade) • ferramenta que organize os dados em gráficos (no. de exemplares e táxons, listas de espécies por tipo de habitat) • Treinamento programa Biota
Respostas ao questionário - Herbários • Software: Excel-Brahms (2), Excel, Brahms • Plano digitalização: • (1) digitalização campos mínimos; (2) imagens digitais de cada espécime; (3) digitação de todos os campos • Banco em dbase para Excel, padronização formato e campos, inclusão de novos campos (coordenadas geográficas) • Digitalização por famílias • Digitalização seguindo a ordem alfabética por famílias com verificação de “ruídos”. Durante o processo a planilha foi simplificada. Os dados serão completados em uma segunda etapa. • Sugestões: • continuar com o suporte CRIA via extensão do projeto ou realização de outro projeto • Ampliar a divulgação da rede speciesLink • Mais treinamento no uso do software de gerenciamento (Brahms) • Ter listas de referência (atualização de nomes e autores de espécies) • Desenvolver outros layers no speciesMapper (hidrografia, vegetação, ...) • Na busca ‘grupo taxonômico’ não está claro – exemplos explicativos poderiam auxiliar o usuário. Gênero é um grupo taxonômico mas tem que ser buscado em nome científico... • Incluir um sistema de ‘help’ e exemplos nas ferramentas
Respostas ao questionário - Herbários • Software: proprietário • Plano digitalização: • Prioridade a materiais recém incluídos e daqueles solicitados para empréstimo (informatização antes de sair do acervo) • Sugestões: • treinamento: uso das ferramentas speciesLink, programa de gerenciamento das coleções, divulgação das experiências na implantação de experiências de informatização com modelos de construção de planilhas, programas para inserção de dados, etc. • ferramenta infoxy: problema de precisão das bases (país, estado, município) • Enriquecer o geoLoc com informações sobre a localização dos rios, serras e outros acidentes geográficos • Treinamento ferramentas speciesLink (openModeller) • Previsão de mais equipamentos de informática para as coleções em projetos futuros
Respostas ao questionário – Herbários, Algas • Software: proprietário, Brahms (2), Lantana-Brahms, Access • Plano digitalização: • contratação de empresa de digitação • escolha de famílias com boa confiabilidade na identificação das espécies • designação de um funcionário para digitação junto com alunos e bolsistas para assegurar uma continuidade mínima • Sugestões: • elaboração de um manual • à Fapesp: a bolsa deveria ser concedida ao orientador ou coordenador e não ao candidato – cada substituição é um processo novo • Treinamento Brahms • Seria importante contar com pessoas fixas e não bolsistas • Problema da bolsa TT onde o tempo é descontado caso o aluno faça pós • O CRIA não deveria ‘esquivar’ do papel de sugerir o melhor software a ser utilizado • Curso software de gerenciamento
Respostas ao questionário - xilotecas • Software: Excel • Plano digitalização: • sim • Problema: • IPT: os projetos que não trazem receita não estão sendo priorizados por causa da necessidade de cumprir metas de desempenho financeiro • Sugestões: • treinamento Brahms
Respostas ao questionário - microrganismos • Software: Excel, proprietário • Plano digitalização: • digitalização de acordo com o número de entrada do microrganismo • Sugestões: • treinamento nas ferramentas speciesLink
Uso de ferramentas • 24 coleções responderam o questionário • 11 não responderam • data cleaning: 20 • speciesMapper: 15 • geoLoc: 13 • spOutlier: 13 • Conversor: 10 • openModeller:0 • Banco de coletores e infoxy: 1 resposta espontânea (não foi incluída nas opções)