1 / 36

F. Lützenkirchen HochschulRechenZentrum der Universität Essen

Das MILESS Projekt der Universität Essen Implementierung einer Digitalen Bibliothek auf Basis des IBM Content Managers Zukunft der Software im MyCoRe Projekt. F. Lützenkirchen HochschulRechenZentrum der Universität Essen. Themen. Was ist MILESS? Entstehung, Intentionen und Ziele

dinah
Download Presentation

F. Lützenkirchen HochschulRechenZentrum der Universität Essen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Das MILESS Projekt der Universität EssenImplementierung einer Digitalen Bibliothek auf Basis des IBM Content Managers Zukunft der Software im MyCoRe Projekt F. LützenkirchenHochschulRechenZentrum der Universität Essen Präsentation Humboldt-Universität Berlin

  2. Themen • Was ist MILESS? • Entstehung, Intentionen und Ziele • Systemkomponenten und Datenmodell • Funktionalität und graphische Benutzeroberfläche • Stand und Weiterentwicklung • Was ist IBM Content Manager? • Systemkomponenten und Funktionalität • Erfahrungen bei der MILESS Implementierung • Stärken und Schwächen des Produktes • Was ist MyCoRe? • Entstehung, Intentionen und Ziele • Organisation und Projektbeteiligte • Stand der Entwicklung • Diskussion Präsentation Humboldt-Universität Berlin

  3. Lehr- und Lernmaterial istvorhanden, aber Ziele des MILESS Projektes: • Zentraler, einheitlicher Zugang für alle Fachbereiche, Suche und Navigation in einem homogenen System • Sachliche, systematische Erschließung in bibliothekarischer Qualität, Integration der Bibliothek in den Dokumentenworkflow Intentionen und Ziele • oft mühsam auffindbar, verstreut in der Hochschule • keine systematische Ordnung Präsentation Humboldt-Universität Berlin

  4. Archivierung und Sicherung, dauerhafte, zuverlässige Verfügbarkeit • Zentrale Plattform zur Verteilung von Materialien • Manipulationssicherheit, Digitale Signatur, Zugriffsschutz • Elektronische Dissertationen Intentionen und Ziele Lehr- und Lernmaterial ist Ziele des MILESS Projektes: • oft flüchtig, Verfügbarkeit nicht garantiert • Pflege des Distributionssystems (Web-Server) aufwendig • Manipulationsgefahr, Urheberschutzprobleme Präsentation Humboldt-Universität Berlin

  5. Unterstützung beliebiger Dateiformate • Skalierbarkeit des Systems: Spezielle Audio-/Videosoftware • Einsatz direkt in der Vorlesung: geringe technische Hemmschwelle Intentionen und Ziele Multimediales Material: Ziele in MILESS: • Verschiedenste Formate • Audio / Videomaterialien: Große Datenmengen • Audio / Videomaterialien: Intensive Nutzung bisher nicht verbreitet Präsentation Humboldt-Universität Berlin

  6. Hochschul- rechenzentrum Universitäts- bibliothek Fachbereiche Medien- zentrum Gemeinschaftsprojekt der zentralenEinrichtungen der Universität Essen http://miless.uni-essen.de/ Präsentation Humboldt-Universität Berlin

  7. Was ist MILESS? • MILESS: Multimedialer Lehr- und Lernserver Essen • Projekt an der Universität Essen: seit 1998 ständig weiterentwickelt • Essener Digitale Bibliothek: Infrastruktur für die Universität Essen • In Essen für Essen entwickelte Applikation, d .h. - ursprünglich zugeschnitten auf Essener Anforderungen - aber: Standards bei Metadaten u. Content: Dublin Core, XML, ... - aber: zunehmende Flexibilisierung zur einfacheren Nachnutzung • Benötigt IBM Content Manager 6.1 oder 7.1, DB2 unter AIX / NT • Java-Applikation: ca. 45000 Zeilen Quellcode - Servlets, Applets • Open Source unter GNU General Public License, nichtkommerziell • Nachnutzung durch andere Universitäten erfolgreich, z. B. Leipzig (Bach Digital), Jena (Urmel), ca. ein Dutzend Installationen • Teil der CampusSource Initiative NRW, Teil des MyCoRe Projekts Präsentation Humboldt-Universität Berlin

  8. Was ist MILESS nicht? • Ein Produkt der IBM in Zusammenarbeit mit der Universität Essen • Ein Produkt der Universität Essen im kommerziellen Sinne - Support, Hotline, ... - Kommerziell vermarktet - Von Beginn an zugeschnitten auf die Bedürfnisse möglichst vieler „Kunden“ d. h. Nachnutzer - ABER: Ständige Weiterentwicklung in Richtung Flexibilisierung, Verbesserung der Software-Qualität, Dokumentation etc. - ABER: Nachnutzung ist erwiesenermaßen gut möglich • Eine interaktive Lernumgebung: - Kursverwaltung: Studenten, Diskussionsforen, Online-Üungen - Führung des Benutzers durch die Lerninhalte etc. Präsentation Humboldt-Universität Berlin

  9. MILESS als Digitale Bibliothek • Katalogsysteme: • Integration auf Metadatenebene, nur Nachweis (Link) • Keine Archivierung, keine Verfügbarkeitsgarantie • MILESS: • Dokumente werden im System selbst gehalten: Einheit von Metadaten und Inhalten • Verfügbarkeit der Inhalte kann garantiert werden • Keine ungültigen Verweise • Grundlage für zuverlässigen Einsatz in Vorlesung, Vor- und Nachbereitung, zur Schaffung von Zitierfähigkeit • Archivierung und Sicherung, Zugriffs- und Manipulationsschutz • Zusatzdienste werden ermöglicht, z. B. Suche im Volltext, nach Bildern (QBIC), ZIP-Generierung, ... Präsentation Humboldt-Universität Berlin

  10. Systemkomponenten MILESS / CM HTTP OPAC-System Web-Server Web-Browser Java Servlets:MILESS Server-Komponenten Java-Applet:MILESS Autoren-GUI HTML VideoChargerServer: Streaming von Audio/Video Daten (MPEG, ...) XML IBM Content Manager IBM 3494 Tape LibrarySystem Text Search Server:Volltext-Suche (Textindizes) Object Server:Dateien (PS, PDF, ...), zentral / dezentral Library Server:Metadaten (Titel, Autor, ...) IBM DB2 Datenbank TSM Server: Langzeit-Archivierung Präsentation Humboldt-Universität Berlin

  11. Content Manager: Wesentliche Funktionen • Content Manager: Server-Komponenten mit DB2, TSM-Anbindung... • Enterprise Information Portal: Client-Komponenten u. Text Search • Speicherung von Metadaten und Content • Parametrische Suche, vergleichbar mit Suche in relationaler DB • Volltextsuche mit linguistischen Features • Über EIP verteilte Suche mit Anbindung an andere Backends • Programmier-Schnittstellen (API‘s) für Java, C++, C, ActiveX • Funktionen für Benutzer- und Rechtemanagement • Workflow-Funktionen • Einfache Beispiel-Applikationen (flaches Karteikarten-Datenmodell) • Administrations-Clients • ... (diese Liste ist nicht vollständig) Präsentation Humboldt-Universität Berlin

  12. Content Manager: Stärken (subjektiv) • Integrierte Verwaltung von Metadaten und Content • Hohe Skalierbarkeit: Millionen von Items, verteilte Komponenten • Automatisierte Anbindung an TSM-Server: Automatische Auslagerung von Objekten auf Band anhand zu definierender Regeln wie z. B. Plattenplatz, Häufigkeit der Zugriffe • Integration des IBM VideoCharger Server: Streaming von Audio-/Videodateien • Content Manager ist ein IBM Produkt: Es ist wahrscheinlich, dass es diese Firma auch in einigen Jahren noch gibt... Präsentation Humboldt-Universität Berlin

  13. Content Manager: Schwächen (subjektiv) • CM/EIP ist ein Werkzeugkasten zur Erstellung von eigenen Applikationen, keine fertige nur zu konfigurierende Applikation • Probleme bei Performance und Stabilität, Administrationsaufwand • Möglichkeiten der Datenmodellierung sind unzureichend für komplexe Datenmodelle wie MILESS: flaches Karteikartenmodell • Da die mitgelieferten Clients auf flaches CM-Datenmodell ausgelegt sind, sind sie für eigene komplexe Anwendungen so gut wie nicht benutzbar • Nicht alle Funktionen werden mit Java-Schnittstellen unterstützt • Möglichkeiten parametrischer Suche im Vergleich zu SQL stark eingeschränkt • Kombination von parametrischer Suche und Volltextsuche unzulänglich gelöst und problematisch Präsentation Humboldt-Universität Berlin

  14. Content Manager: Zukunft (subjektiv) • IBM Content Manager Version 8 verspricht gravierende und wesentliche Verbesserungen Präsentation Humboldt-Universität Berlin

  15. MILESS Software-Komponenten Java Applets:Inhalte einbringen und bearbeiten HTML-Seiten: Suchmasken, Navigation, Inhalte anzeigen B R O W S E R MILESS Datenmodell-Klassen(Java-Klassenbibliothek): Dokumente, Personen, Derivate, ... Java Servlets: Inhalte suchen, anzeigen, verwalten W E B - S R V MILESS Persistenz-Layer (Java-Klassenbibliothek): MILESS Daten-Objekte erzeugen, lesen, ändern, löschen, suchen C M IBM Enterprise Information Portal / Content Manager API (C, C++, Java, ...) Präsentation Humboldt-Universität Berlin

  16. SSA SSA SSA SSA- Raid SSA- Raid 36 GB 58 GB 58 GB 172 GB 172 GB MILESS Hardware-Basis in Essen RS/6000 SP Frame 3 Frame 2 Frame 1 Internet via GWIN: Gigabit Wissenschaftsnetz MILESS IBM DB2 Content Manager Objectserver Libraryserver Videoserver parallel batch login email services students login email services staff GWIN 155 Mbit/s TSM Serial batch Uni Essen Campus Netzwerk (FDDI, ATM, Gigabit-Ethernet) DB and WWW Services Scalable POWERParallel Switch SCSI SSA Harddisks (ca 0,5 TB) 3494-C2A 3494-L10 3494-D12 RAID RAID Ca. 800 Band- lager- fächer 3590 3590 30 GB 30 GB 3490 3490 3590 3590 IBM 3494 Tape Library (ca. 8 TB) Präsentation Humboldt-Universität Berlin Stand 17.8.1998 NA

  17. Datenmodell • Dokumentenmodell ist Umsetzung des Dublin Core Element Set: • Creator, Publisher, Contributor, Title, Subject, Description, Source, Coverage, Rights, Type, Format, Date, Language • Ergänzt um Modell für Personen / Körperschaftsdaten: • Personen, Namensformen, Kontaktinformationen, ... • Ergänzt um Modell für Dokumenten-Derivate und Dateien • Ein Dokument in verschiedenen Formaten (HTML, PS, PDF, ...) • Metadatensatz ist abgestimmt auf / mit Deutsche Bibliothek:Dissertationen Online Präsentation Humboldt-Universität Berlin

  18. Datenmodell und Funktionalität • Bis zu neun alternative Titel je Dokument, Sprache, Typ des Titels (main / alternative, translated), Länge beliebig, Volltextsuche im Titel • Angabe der Sprache(n) des Dokumentes anhand ISO 639-2 Liste • Datum der Erzeugung, der letzten Änderung, Gültigkeitszeitraum von / bis, Datum der Antragstellung zur Promotion, Datum der Prüfung (Dissertationen) Präsentation Humboldt-Universität Berlin

  19. Datenmodell und Funktionalität Bis zu 30 Autoren, Herausgeber, Beitragende (Übersetzer, ...) je Dokument • Personen- / Körperschaftsdaten • Unterstützung mehrererNamensformen je Person, z. B. für verschiedene Schreibweisen, Nachname nach u. vor Heirat... • L/M/R-trunkierte Suche • Mehrere Kontakte (dienstl., privat) • Mehrere E-Mail- und Web- Adressen, Telefon, Telefax, Anschriften je Kontakt Präsentation Humboldt-Universität Berlin

  20. Datenmodell und Funktionalität • Freie Stichwörter / Schlagwörter • Unterstützung beliebiger hierarchischer Fachklassifikationen • Mehrfachzuordnung, parallele Verwendung mehrer Klassifikationen • Exakte Suche nach bestimmten Kategorien • Volltextsuche (Wörter, Phrasen) nach Kategorien und Stichwörtern Präsentation Humboldt-Universität Berlin

  21. Datenmodell und Funktionalität • Klassifikations- bäume können in MILESS integriert geladen werden • Navigation durch die Hierarchie,Suche in der Hierarchie • Volltextsuche im Klassifikationssystem zum Auffinden von Kategorien ( z. B. PACS: ca. 2900 Kategorien ) Präsentation Humboldt-Universität Berlin

  22. Navigation durch Klassifikationsbäume Präsentation Humboldt-Universität Berlin Stand 17.8.1998 NA

  23. Datenmodell und Funktionalität • Description: Beschreibung oder Zusammenfassung (Abstract) • Source: Hinweis auf Herkunft (Freitext, ISBN-Angabe etc.) • Coverage: Räumlicher / zeitlicher Bezug des Dokumentes • Rights: Rechtliche Vermerke, Lizenzbedingungen etc. • Je bis zu 10 Angaben je Dokument, Länge beliebig • Freitext, URL (z. B. Verweis auf externe Zusammenfassung) oder andere Schemata, Sprache zu diesen Elementen erfaßbar • Volltextsuche in diesen Elementen Präsentation Humboldt-Universität Berlin

  24. Datenmodell und Funktionalität • Ein Dokument kann in mehreren Formaten (Derivate) vorliegen • Medientyp: Grobeinordnung, Formate: Genauere Angabe • Derivat kann in MILESS archiviert oder auch nur URL sein • Unterstützung beliebiger Dateiformate (erweiterbare Liste) • Beibehaltung der Verzeichnishierarchie des Derivates • Integrierter Verweis auf Plug-In‘s, Anzeige Umfang • Generierung von zip-Archiven on the fly Präsentation Humboldt-Universität Berlin

  25. Allgemeine u. fachspezifische Suchmasken Präsentation Humboldt-Universität Berlin Stand 17.8.1998 NA

  26. Ergebnisliste Präsentation Humboldt-Universität Berlin Stand 17.8.1998 NA

  27. Dokumentendaten Präsentation Humboldt-Universität Berlin Stand 17.8.1998 NA

  28. Import / Ändern / Export von Daten • Import-/Export-Format für Metadaten ist XML • Metadaten und Dateien werden in der Regel über GUI bearbeitet: Autoren arbeitet selbständig mit Java-Applet • Kommandozeilen-Interface auf dem Server für Batch- Import/Export und für administrative Zwecke • Flexibel durch Unterstützung beliebiger Dateitypen • Drei-Schichten-Architektur von MILESS: - Graphische Oberflächen (HTML, Servlets, Applets) - Datenmodell und Logik - Persistenz (IBM Content Manager, DB2) • Dadurch flexible Möglichkeit, Schichten auszutauschen / anzupassen, aber auch wesentlich aufwendigere Implementierung Präsentation Humboldt-Universität Berlin Stand 17.8.1998 NA

  29. Applet für Autoren: Einstellen / Ändern Präsentation Humboldt-Universität Berlin Stand 17.8.1998 NA

  30. MILESS Weiterentwicklung:Online Digital Video Archive • IBM Shared University Research Grant im Dezember 1999: Hard-/Software und Service im Wert von ca. 400.000 DM • DFG-Projekt ”Verteilte Digitale Video/Audio-Bibliothek" • Uni Essen (HRZ, UB, MZ) and FSU Jena (URZ, THULB): • - Projekt seit Mitte dieses Jahres, Laufzeit ca. 2 Jahre • - Transparente, gemeinsame Nutzung von digitalem Videomaterial • - Erschliessung der Struktur von Videos: Szenen-Erkennung, Storyboard-Generierung • - Transcoding für verschiedene Bandbreiten • - Erweiterung der Recherchemöglichkeiten z. B. durch Volltextindizierung der Audio-Spur nach Spracherkennung Präsentation Humboldt-Universität Berlin

  31. MILESS und CampusSource / MyCoRe • Problem: Langfristige Weiterentwicklung/Pflege von ca. 45.000 Codezeilen problematisch • Erste Idee: IBM übernimmt MILESS als Beispiel-Anwendung als Teil der Content Manager Distribution ? -> Rechtliche Probleme, gescheitert • Erfahrungen mit ersten Nachnutzern: GWDG, FSU Jena (UrMEL), • Uni Leipzig (Bach Digital) • Neues Konzept: MILESS Code als Open Source unter • GNU GPL Lizenz für jedermann nachnutzbar • Unterstützt durch die "CampusSource Initiative NRW" • Ziele: Erfahrungsaustausch, Bildung einer Gemeinschaft zur Weiterentwicklung und Pflege • Daraus Entstehung des MyCoRe-Projekts Präsentation Humboldt-Universität Berlin

  32. MyCoRe: Entstehung und Ziele • Essener Lösung „MILESS“ ist spezialisiert auf die Essener Anforderungen (z. B. in Datenmodell, Graphische Oberflächen) • „MILESS Community“ der Nachnutzer brachte zusätzliche Anforderungen, Flexibilisierungswünsche, neue Anwendungsgebiete ein • Daher, ausgehend von MILESS, gemeinsame Entwicklung eines flexiblen, anpassbaren Software-Kerns („My core“) zur Erstellung von digitalen Bibliothekssystemen / Archivlösungen (allgemein „Content Repositories“ -> CoRe), für verschiedene Backend-Datenbanken, unter anderem IBM Content Manager • Entwicklung als Open Source auf Java-Basis unter GNU GPL • Kern, ergänzt um Anpassungen und Erweiterungen, bildet jeweils eine lokale Lösung, z. B. für Münzsammlung, Papyri-Archiv, ... Präsentation Humboldt-Universität Berlin

  33. MyCoRe Projektbeteiligte • Universität Essen: Zentrale Einrichtungen • Universität Jena: Rechenzentrum, Bibliothek • Universität Leipzig: Rechenzentrum • Universität Münster: Rechenzentrum, Bibliothek • Universität Halle: Rechenzentrum, Bibliothek • Universität Freiburg: Rechenzentrum • Universität Rostock: Bibliothek, Informatik-Lehrstuhl Prof. Heuer • GWDG Göttingen mit Bayerischer Staatsbibliothek München • Universität Uppsala mit Louisiana Tech University • IBM Deutschland: Content Manager Gruppe, Forschung & Lehr • Weitere Interessenten / Potentielle Nutzer / KontakteUniversitäten Greifswald, Düsseldorf, BASF Ludwigshafen, ... Präsentation Humboldt-Universität Berlin

  34. MyCoRe: Organisation • Einzelne Mitglieder übernehmen Weiterentwicklung bestimmter Funktionsbereiche: Analyse, Design, Implementierung usw. • Gemeinsame Arbeitsumgebung für die Software-Entwickler(Entwicklungsrechner in Essen, CVS-Repository zur Code-Verwaltung, Dokumentenaustausch via BSCW, Mailing-Liste):Teilkomponenten werden hier entwickelt und zusammengeführt • Architecture Board (5 Pers.) koordiniert gemeinsame Entwicklung, legt Standards, Richtlinien, Schnittstellen fest, sammelt Anforderungen aller Mitglieder, stellt Integrationsfähigkeit der Teile sicher etc. • IBM-Support: gemeinsam, über einen Koordinator kanalisiert • Je ein Key Decider auf technischer Ebene / auf Management Ebene für MyCoRe-Mitglieder und für die IBM, als Ansprechpartner Präsentation Humboldt-Universität Berlin

  35. MyCoRe: Arbeitsteilige Implementierung • Essen:Unterstützung hierarchischer Fachklassifikationen, Systeminterne Dateiverwaltung, Videofunktionen • Münster und Rostock:Verteilte Suche, Schnittstelle für Open Archives Initiative • Jena und Leipzig:Flexibilisierung des Metadatenmodells (Dokumente, Personen) • Freiburg:Benutzer- und Rechteverwaltung • Göttingen:Workflow-Funktionen • IBM:HowTo-Support, Link zum Entwicklungslabor, spezielle Konditionen zur Nutzung von IBM Content Manager Präsentation Humboldt-Universität Berlin

  36. MyCoRe: Einsatzgebiete • Essen, Jena: Verteilte Digitale Audio-/Video-Bibliothek • Freiburg: Sammlung Salvator Rosa, Handschriften Raimundus Lullus, Videosammlung der Bibliothek, Altrömische Münzen • GWDG Göttingen, Bayer. Staatsbibliothek München:Publikations- und Redaktionssystem Geschichte (Frühe Neuzeit) • Jena, Leipzig: Digitalisierung historisches Universitätsarchiv • Jena, Leipzig, Halle: Papyri-Sammlung • Uppsala, Louisiana: Repository mit Material zur Architekturgeschichte, Anbindung an Online-Lernumgebung Projekt-Homepage und erste Quellcode-Ergebnisse unterhttp://www.mycore.de/ Präsentation Humboldt-Universität Berlin

More Related