1 / 26

Anton Güntsch Botanischer Garten und Botanisches Museum Berlin-Dahlem

Mobilisierung von primären Biodiversitätsdaten: Das BioCASe Protokoll und seine Anwendung in internationalen Netzwerken. Anton Güntsch Botanischer Garten und Botanisches Museum Berlin-Dahlem Abt. Biodiversitätsinformatik u. Labors. Primäre Biodiversitätsdaten. Wissenschaftliche Namen Taxa

lucio
Download Presentation

Anton Güntsch Botanischer Garten und Botanisches Museum Berlin-Dahlem

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Mobilisierung von primären Biodiversitätsdaten: Das BioCASe Protokoll und seine Anwendung in internationalen Netzwerken Anton Güntsch Botanischer Garten und Botanisches Museum Berlin-Dahlem Abt. Biodiversitätsinformatik u. Labors

  2. Primäre Biodiversitätsdaten • Wissenschaftliche Namen • Taxa • Autoren • Referenzen • Sammlungsdaten • Metadaten

  3. Biologische Sammlungen • Naturhistorische Sammlungen (Museen, Universitäten) • Lebendsammlungen (z.B. Botanische und Zoologische Gärten, Bakterienstämme) • DNA Banken • Multimedia Sammlungen • Beobachtungsdatenbanken • …

  4. Nutzen von biologischen Sammlungen • Belege ( z.B. für Namensgebung) • Ausbildung • Kommerzieller Nutzen • Umweltmonitoring • Historische und gegenwärtige Verbreitungen von Organismen • Voraussage von Verbreitungen • …

  5. Sammlungs-Objektdaten • Wer • Wann • Wo • Was

  6. Sammlungsdaten im Jahr 2000

  7. Schaffung eines globalen Netzwerks • Global Biodiversity Information Facility (GBIF) • Biological Collection Access Service for Europe (BioCASE)

  8. Spezifikation auf 2 Ebenen • Protokoll-Ebene abstrakte Anfragesprache für heterogene Datenquellen • Datenebene Spezifikation eines Datenschemas

  9. BioCASe Protokoll • Spezifikation der Struktur von Anfragen und Antworten im Netzwerk.

  10. BioCASe - <capabilities> <?xml version="1.0" encoding="UTF-8"?> <requestxmlns="http://www.biocase.org/schemas/protocol/1.3" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.biocase.org/schemas/protocol/1.3 http://www.bgbm.org/biodivinf/schema/protocol.xsd"> <header> <sendTime>2001-09-11T09:30:47-05:00</sendTime> <source>198.14.7.54</source> <type>capabilities</type> </header> </request>

  11. BioCASe - <scan> <?xml version="1.0" encoding="UTF-8"?> <request xmlns="http://www.biocase.org/schemas/protocol/1.3" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.biocase.org/schemas/protocol/1.3 http://www.bgbm.org/biodivinf/schema/protocol.xsd"> <header> <sendTime>2001-09-11T09:30:47-05:00</sendTime> <source>198.14.7.54</source> <type>scan</type> </header> <scan> <requestFormat>http://www.tdwg.org/schemas/abcd/1.2</requestFormat> <concept>/DataSets/[…]/ScientificNameAtomized/Botanical/Genus</concept> </scan> </request>

  12. BioCASe - <search> <request> <header> [...] <type>search</type> </header> <search> <requestFormat>http://www.tdwg.org/schemas/abcd/1.2</requestFormat> <responseFormat start="0" limit="50">http://www.tdwg.org/schemas/abcd/1.2</responseFormat> <filter> <and> <like path="/DataSets/DataSet/[...]/TaxonIdentified/NameAuthorYearString">Abies*</like> <or> <like path="/DataSets/[...]/TaxonIdentified/HigherTaxa/HigherTaxon">Pinace*</like> <and> <like path="/DataSets/DataSet/[...]/GatheringSite/Country/CountryName">*Russia*</like> <greaterThan path="/DataSets/DataSet/[...]/ISODateTimeBegin">2002-04</greaterThan> </and> </or> </and> </filter> <count>false</count> </search> </request>

  13. Access to Biological Collection Data • Datendefinition für alle biologischen Sammlungen (lebend, konserviert, Beobachtungen). • Behutsamer Umgang mit kontrollierten Vokabularen und regulären Ausdrücken. • Strukturierte Elementbeschreibungen. • Variable Atomisierung.

  14. Strukturierte Elementbeschreibung <xs:element name="FullScientificNameString" type="String"> <xs:annotation> <xs:documentation>Concatenated scientific name, preferrably formed in accordance with a Code of Nomenclature, i. e. a monomial, bionomial, or trinomial plus author(s) or author team(s) and - where relevant - year, or the name of a cultivar or cultivar group, as fully as possible. </xs:documentation> <xs:appinfo> <sea:FullName>Full scientific name</sea:FullName> <sea:Audience>BioCASE</sea:Audience> <sea:Audience>CODATA TDWG</sea:Audience> <sea:Reviewer/> <sea:ExistingStandard>Darwin Core 2: Scientific Name.</sea:ExistingStandard> <sea:Content/> <sea:Example>Acipenser gueldenstadti Linnaeus 1758</sea:Example> <sea:Rule/> <sea:EditorialNote/> </xs:appinfo> </xs:annotation> </xs:element>

  15. Variable Atomisierung (1)    <site> <country>Afghanistan</country> <place>Tangi Gharuh</place> <lat>34.16</lat> <long>69.48</long> </site> <date> <day>21</day> <month>8</month> <year>1952</year> </date>   

  16. Variable Atomisierung (2)    <site> <text> BRASIL, Rio Grande do Sul: Parque Nacional dos Aparados da Serra, Itaimbezinho (mun. Cambará do Sul). Nas casca de árvore da mata: junto ao canyon. Alt. 1200 m. </text> </site> <date> <text> 16 Apr. 1993 </text> </date>   

  17. Datasets Dataset Collection Metadata (description of dataset, contact information, intellectual property rights,... ) Collection Unit Data (observation or specimen records) Dataset ... ABCD - Überblick

  18. Collection Metadata ABCD - Metadaten Original source incl. collection identifier (Source ID) Dataset derivation (data propagation history) • Supplier information (organisation, contact) • Intellectual Property Rights (IPR) • Acknowledgements, Disclaimer, URL etc.

  19. Datasets Dataset Collection Metadata (description of dataset, contact information, intellectual property rights,... ) Collection Unit Data (observation or specimen records) Dataset ... ABCD - Überblick

  20. Collection Unit Data Unit state domain (physical state-specific subtypes) Specimen unit Observation unit ABCD - Unitebene Unit identifier (ID), IPR, Acknowledgements,... Identifications Unit collection domain (domain-specific subtypes) Gathering event and site characteristics + Digital images, Associations, Assemblages, Measurements, Facts,...

  21. Verfügbare Software • PyWrapper • BioCASe Configuration-Tool • BioCASe Query-Tool • UnitLoader: API für BioCASe-konforme Anfragen • User-Interface Software • SchemaViewer, SchemaProcessor, etc.

  22. Eingesetzt von … • BioCASE • GBIF-D • GBIF-International • Species2000 - EuroCAT • Euro+Med • BioCASE Metadata Network • AlgaTerra

  23. GBIF-D & BioCASE Prototyp

  24. Provider Domain Internet Portal Domain Client CORM Query XML http ! JDBC SQL User interface client (Servlet) Unit Data ? Java API ResponseXML http GBIF-D & BioCASE Prototyp Unit wrapper BioCASE protocol Config.files UnitLoader C

  25. BioCASe-Statistik (Stand: 4/2005) • > 65 Provider Installationen weltweit • > 150 Datenbanken abfragbar • > 5.000.000 Datensätze zugreifbar

  26. Vielen Dank! www.biocase.org

More Related