1 / 33

RusDML Ein digitales Archiv russischer mathematischer Zeitschriften

RusDML Ein digitales Archiv russischer mathematischer Zeitschriften. DMV-Jahrestagung 2006 Minisymposium 29 – Information, Kommunikation und Bibliotheken für die Mathematik. Gliederung. Die Idee von RusDML Relevanz der russischen mathematischen Zeitschriften Lizenzen

emi-boyer
Download Presentation

RusDML Ein digitales Archiv russischer mathematischer Zeitschriften

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. RusDMLEin digitales Archiv russischer mathematischer Zeitschriften DMV-Jahrestagung 2006 Minisymposium 29 – Information, Kommunikation und Bibliotheken für die Mathematik

  2. Gliederung • Die Idee von RusDML • Relevanz der russischen mathematischen Zeitschriften • Lizenzen • Inhaltliche Erschließung • Die Umsetzung von RusDML • RusDML-Application Profile • RusDML-Workflow • RusDML-Tool • Transliteration • RusDML-Archiv • Zugänge zum RusDML-Archiv • Fazit

  3. RusDML – Die Idee • Relevanz der russischen Mathematik (Indiz: Übersetzungszeitschriften) • Aufbau eines digitalen Archivs bedeutender russischer Mathematikzeitschriften • Vorbereitung des russischen Teils der World Digital Mathematics Library (WDML) • Erschließung durch Metadaten aus dem Zentralblatt MATH • Zusätzlich Verbesserung der Metadaten des Zentralblatt MATH und Verlinkung auf Artikel in RusDML

  4. Ein russisch-deutsches Projekt • Partner: • TU Berlin (Projektleitung) • SUB Göttingen • TIB Hannover • GPNTB Moskau • Förderung durch DFG (09/2004-07/2007) und RFBR • Partner außerhalb der Projektförderung: • Russische Akademie der Wissenschaften, Moskau • Steklov Institut für Mathematik, Moskau RusDML im Internet: www.rusdml.de

  5. Lizenzen (1) • Ursprüngliche Planung: • Digitalisierung aller mathematischer Publikationen aus Russland und Staaten früheren Sowjetunion • Kernarchiv mit ca. 70 Zeitschriften • Später Erweiterung auf Monographien, Sammelwerke und bei VINITI deponierte Artikel • Aktueller Stand: • Lizenzen für 10 Zeitschriften, darunter: • Algebra i logika (1962-2004) • Sibirskij matematiceskij zurnal (1960-1999) • Matematiceskij sbornik (1866-1992) • Das Steklov Institut hat Lizenzen für Matematiceskie zametki und Trudy matematiceskogo instituta steklova

  6. Lizenzen (2) • Gegenstand der Lizenzvereinbarung (Beispiel Sibirskij matematiceskij zurnal): • Digitalisierung und elektronische Wiederveröffentlichung (freier Zugang über das RusDML-Archiv) • Lizenzgeber erhält eine voll funktionsfähige Kopie der digitalisierten Version seiner Zeitschrift zur eigenen Verwendung (Integration in das Archiv der bereits elektronisch erzeugten neueren Jahrgänge) • Lizenzgeber erhält das Recht, die digitalisierte Fassung z.B. auf CD-ROM zum Verkauf anzubieten (der freie Zugang über das RusDML-Archiv bleibt davon unberührt)

  7. Lizenzen (3) • Einwerbung weiterer Lizenzen schwierig: • Verlage/Herausgeber wollen jetzt doch selbst digitalisieren • Rechte für freien Zugriff würden kostenpflichtige Vermarktung behindern • Konsequenz für RusDML: • Technische Infrastruktur für Import extern erstellter Digitalisate gewinnt an Bedeutung

  8. Inhaltliche Erschließung • Erfolgt nicht im Rahmen des Projekts, sondern durch • Übernahme der Klassifikation nach MSC vom Zentralblatt MATH • Eintragung der Notationen nach UDK (Universale Dezimal-Klassifikation) in die Metadaten (durch GPNTB) • Übertragung vorhandener englischer oder russischer Schlagwörter • Durch Verlinkung auf den Eintrag im Zentralblatt MATH ist ggf. auch das Abstract verfügbar

  9. RusDML – Die Umsetzung • RusDML-Application Profile • RusDML-Workflow • RusDML-Tool • Transliteration • RusDML-Archiv • Zugänge zum RusDML-Archiv

  10. RusDML-Application Profile (1) • Application Profile (AP): Dokumentation / Definition des für eine lokale Anwendung benötigten Sets an Metadatenelementen • Verständigung unter den RusDML-Projektpartnern auf ein Kernset von Metadatenelementen = RusDML AP • Kategorien der RusDML-Metadatenelemente sind: • Identifier: Article • Journal (identifier, journal title, publisher ...) • Volume • Issue • Article: Structure (author, pages ...) • Article: Content (article title, abstract, classifications ...)

  11. RusDML-Application Profile (2)

  12. RusDML-Application Profile (3) Die aktuelle Version des RusDML-AP ist online abrufbar: http://arbeit.hilses.de/rusdml/

  13. Administration Produktion Entwicklung TIFF-Header erstellen (7) Exportschnittstellen PURL-Generierung Imagehandling im Workflow Normierung der Zeitschriftentitel (5) Pflege der Erfassungstools Bibl. Aufnahme in lokalen OPAC (4) ZDB-Aufnahme (3) Bestandsaufnahme gedruckte Version (2) Lizenz: Einwerben und Verwalten (1) Metadaten Transliterieren (15) Erfassung der Strukturdaten (16) Erfassungtools für Metadaten Scannen der Images (8) Qualitätskontrolle(9) Workflowverwaltung programmieren Korrektur des Zen- tralblattimports (17) Endkontrolle eines Bandes (18) Generierung der SICI (für Artikel) (19) Import kyrillische Metadaten (14) Datenexport in METS mit Images (20) Prüfung / Korrektur bibliogr. Daten (13) Import in lokale Re- positories/DMS (21) Aufbereitung / Import Zentralblattdaten (12) Rückmeldung der PURLs (22) Vollständigkeitsprü- fung Artikelebene (11) Application Profile erstellen Imagenachbearbeitung (10) Importfilter für Importformate Projektleitung/-partner Projektpartner 1 SUB SUB Anlegen eines Prozesses im Workflowtool, für je- den Band (6) SUB SUB Imaging SUB SUB SUB/GDZ SUB SUB/GDZ SUB / GDZ SUB SUB Metadatenproduktion TIB/UB TUB TUB TUB SUB SUB TIB/UB GPNTB Ablaufplan des kooperativen Workflows im Projekt RusDML (in Klammern die Nummer des Arbeitsschrittes) TUB TIB/UB SUB Import in Repositories SUB SUB Eigenleistung SUB + TUB + TIB/UB SUB RusDML-Workflow (1): Allgemeine Übersicht

  14. Der kooperative RusDML-Workflow TU Berlin (Zentralblatt) • Projektmanagement • Erstellung der bibliographischen Metadaten (Zentralblatt MATH) SUB Göttingen • Tool-Entwicklung • Scannen (GDZ) • Erstellung der Strukturmetadaten • Online-Präsentation (Suchmaschine) TIB/UB Hannover • Metadaten-Bearbeitung • Transliteration GPNTB Moskau • Erstellung der russischen (kyrillischen) Metadaten

  15. RusDML-Workflow (3): Arbeitsschritte 1-10 I) Vorbereitende Tätigkeiten (verschiedene Partner) 1) Lizenzeinwerbung (TU Berlin, GPNTB Moskau) 2) Bestandsaufnahme der gedruckten Version (jeweiliger Standort, Koordination SUB Göttingen, GPNTB) 3) ZDB-Aufnahme (TIB Hannover) 4) Bibliothekarische Aufnahme für den lokalen OPAC (SUB, GPNTB) 5) Normierung der Zeitschriftentitel (TIB) II) Anlegen eines Prozesses und Digitalisierung (SUB) 6) Anlegen eines Prozesses auf Bandebene 7) TIFF-Header erstellen 8) Scannen der Images 9) Qualitätskontrolle 10) Imagenachbearbeitung

  16. RusDML-Workflow (4): Arbeitsschritte 11-22 III) Import von Metadaten in das Tool (TUB und GPNTB) 11) Prüfung der Vollständigkeit auf Artikelebene der Zentralblattdaten (TUB) 12) Import / Lieferung der Zentralblattdaten (TUB) 13) Prüfung und Korrektur der bibliographischen Daten im Tool (TUB) 14) Import / Lieferung der russischen Metadaten (GPNTB) IV) Metadatenbearbeitung und -ergänzung (SUB, TIB, TUB) 15) Metadaten transliterieren (TIB) 16) Erfassung der Strukturmetadaten (SUB) 17) Korrektur des Zentralblattimports (TUB) 18) Bandweise Endkontrolle und Freigabe aller Metadaten (TIB) V) Abschluss und Onlinestellung (SUB, bzw. lokal alle Partner) 19) Automatische Generierung der SICI (SUB) 20) Export der Daten in XML/METS-Format inklusive der Images (SUB) 21) Import in die lokalen DMS bzw. Repositories (GPNTB, SUB, TIB) 22) Rückmeldung der neu hinzugekommenen PURLs

  17. RusDML-Tool (1) • Organisation des komplexen Workflows mit Hilfe des im Rahmen des Projektes entwickelten Softwarepakets (RusDML-Tool) • Im Folgenden eine kurze Skizze des Tools • Anforderungen an das Softwarepaket und • Aufgaben, die mit Hilfe des Tools erledigt werden

  18. RusDML-Tool (2): Anforderungen • Plattform-Unabhängigkeit, da Partner weltweit auf das Tool zugreifen müssen • Einsatz von Java-Technologie stellt die Plattformunabhängigkeit sicher und auch, dass mittels der Unicode-Kodierung sowohl west- als auch osteuropäische Zeichensätze (inklusive Kyrillisch) innerhalb des Tools Verwendung finden können • Zentrale Metadatenverwaltung, d.h. Katalogisieren und Vervollständigung der Metadaten von verschiedenen Standorten aus (z.B. Erstellung der russischen Metadaten in Moskau, Transliterationen in Hannover)

  19. RusDML-Tool (3): Aufgaben • Zentrale Verwaltung der Digitalisate (Images) • Import- und Exportschnittstellen für Metadaten (z.B. aus dem Zentralblatt MATH) und für den Import externer Digitalisate • Controlling-Mechanismen: welcher Partner ist wie weit mit seinen Arbeiten, welche Zeitschrift ist in welchem Bearbeitungsstadium etc. • Integration von Komponenten eines verteilten Workflowmanagements zur Gewährleistung der Verwaltung einer verteilten Produktion und zur Kommunikation zwischen den Partnern: Ablauf der Prozeßschritte, Abbildung von Korrekturschleifen

  20. RusDML-Tool (4): Aufgaben • Komfortable Erfassung und Bearbeitung der Informationen zu den einzelnen Werken: allgemeine Metadaten, hierarchische Strukturdaten der Bände (Jahrgang, Hefte, Artikel) sowie das Matching von logischen (aufgedruckten) und physikalischen (tatsächlichen) Seitenzahlen. • Metadatenimport aus unterschiedlichen Quellen auf der Basis des Dateiformates XML z.B. aus dem „Zentralblatt MATH“ sowie dem „Jahrbuch über die Fortschritte der Mathematik (JFM)“ • Abspeicherung der erfassten bzw. bearbeiteten Daten - im Hinblick auf eine optimale Archivierbarkeit - im Metadata Encoding and Transmission Standard (METS)-Format (standardisierte Exportmöglichkeiten sind zudem die Formate PICA und UNIMARC)

  21. RusDML-Tool (5) Der Workflow abgebildet im Tool: Die 22 Arbeitsschritte

  22. RusDML-Tool (6): Weiterentwicklung • Zusammenführung der Entwicklungen im Bereich “Digitale Bibliothek” zu einer modularen Software-Suite • Nachnutzung aus folgenden DFG-Projekten: • RusDML (Workflowtool, Metadatentool) • Rise of modern Constitutionalism (Access-Tool, Benutzerstatistik-Tool, Volltextsuche) • DigiZeitschriften (Typo3-Integration) • zvdd (Schnittstellen zum GBV) • Sowie • kopal (Langzeitarchivierung- BMBF) • ProPrint (Print on Demand - BMBF) • DigiWunschbuch (Digitization on Demand – SUB)

  23. Göttingen online-objects binaries TOOLS CORE ARCHITECTURE SERVICES USAGE Goobi.COLLABORATE WEB 2.0 / WIKIPEDIA / DIGITAZATION ON DEMAND Goobi.VISUAL TYPO3 / PDF / CSS / ACCESSIBILITY Goobi.PRINT PROPRINT / PRINT ON DEMAND Goobi.ACCESS IP-RANGES / USER-MANAGEMENT / SHIBBOLETH Goobi.SEARCH BROWSING / FULLTEXT / HIGHLIGHTING Goobi.COUNTER PROJECTCOUNTER.ORG / LOGGING / SFX PRODUCTION Goobi.ARCHIVE METS / TEI / XML Goobi.PRESERVATION KOPAL / EROMM / EDL Goobi.META METS-EDITOR / LOGICAL-STRUCTURE / OCR Goobi.PRODUCER SCANNING / IMPORT / WEBDAV Goobi.FLOW WORKGROUP-MANAGEMENT / CONTROLLING

  24. RusDML-Tool (8): Perspektiven • Zielsetzung: eine nutzerfreundliche und alltagstauglicheSoftwareumgebung fürwesentliche Bereiche der (Massen-)Digitalisierung und der „Digitalen Bibliothek“ • Automatische Importmöglichkeit in die European Digital Library (EDL, TEL) • Zertifizierungsmöglichkeiten des Workflows der Digitalisierung und der digitalen Objekte (Qualität der Scans, der Metadaten etc.) • Open Source (Möglichkeit, eine verteilte Entwickler-community aufzubauen) • Derzeitiger Einsatz der Module: • Johannes a Lasco Bibliothek Emden • Universitätsbibliothek Mannheim • Sächsische Landesbibliothek - Staats- und Universitätsbibliothek (SLUB) Dresden

  25. Transliteration (1) • Aufgabe des Partners TIB • Im Original in kyrillischer Schrift vorliegende Titel werden transliteriert (Zuordnung Buchstabe zu Buchstabe) • Im Zentralblatt MATH wurde immer auch transliteriert, aber nach wechselnden Transliterationstabellen • Für RusDML Ergänzung durch Transliteration nach DIN 1460 und ISO 9, so dass im RusDML-Archiv über bis zu drei verschiedene Transliterationsvarianten gesucht werden kann

  26. Transliteration (2) • Verfahren: • anfangs manuell • später mit Transliterationstool als Standalone-Anwendung:

  27. Transliteration (3) • Inzwischen Integration in das RusDML-Tool; für entsprechende Felder Transliteration auf Knopfdruck:

  28. Transliteration (4) • Warum keine vollautomatische Transliteration? • Teil der Qualitätskontrolle für die erstmals erfassten kyrillischen Metadaten • Warum nicht Transliteration erst bei Suche im RusDML-Archiv? • Transliteration kyrillischer Schrift ist keine bijektive Abbildung • Indexierung der bereits transliterierten Daten beschleunigt Suche

  29. RusDML-Archiv • Prototyp beim GDZ: http://demo.rusdml.de • Einfache Suche (auch nach Klassifikation möglich) • Erweiterte Suche • Browsing • Volltextsuche (OCR-generiert)

  30. Zugänge zum RusDML-Archiv • Jeder Projektpartner und Lizenzgeber erhält eine Kopie des RusDML-Archivs und kann eine eigene Suche implementieren. • Geplant: Die in RusDML verbesserten Metadaten werden ins Zentralblatt MATH zurückgeliefert und aus dem Zentralblatt MATH für jeden Artikel auf das RusDML-Archiv verlinkt. Somit kann für die fachlich anspruchsvollste Suche weiterhin das Zentralblatt MATH genutzt werden.

  31. Kritisches Fazit (1) • Quantitativ bleibt RusDML im Förderzeitraum hinter den gesteckten Zielen zurück: • Geplant 1,5 Mio. Seiten zu digitalisierende Seiten, je 750.000 durch die deutschen Partner und den russischen Partner • Lizenzen liegen momentan vor für ca. 283.000 Seiten • Problematik der Einwerbung von Lizenzen • Digitalisierung nur durch den deutschen Partner SUB Göttingen • GPNTB erhält von RFBR erheblich geringere Förderung als erwartet und beteiligt sich nur an Anreicherung der Metadaten

  32. Kritisches Fazit (2) • Qualitativ erreicht RusDML die gesteckten Ziele: • Kooperative, dezentrale Anreicherung von Metadaten durch alle Partner • Die im Projekt entwickelte technische Infrastruktur zu Workflowverwaltung und verteilter Metadatenbearbeitung (RusDML-Tool) wird für weitere Digitalisierungsprojekte nachgenutzt. • Die Ergebnisse aus dem Projekt RusDML werden als Teil der WDML und des europäischen Kulturerbes Bestand haben. • Abschied vom Ideal des weltweit freien Zugangs zu sämtlicher mathematischer Literatur im Rahmen der WDML? Inzwischen wird auch das kostenpflichtige JSTOR auf der Internetpräsentation der WDML aufgeführt: http://www.ceic.math.ca/WDML/dml/index.shtml

  33. Haben Sie Fragen, Anmerkungen ...? http://www.rusdml.de/ Matthias Schulze schulze@sub.uni-goettingen.de Bernhard Tempel Bernhard.Tempel@tib.uni-hannover.de Vielen Dank für Ihre Aufmerksamkeit!

More Related