Finden statt suchen retrieval
Download
1 / 28

Finden statt Suchen - Retrieval - PowerPoint PPT Presentation


  • 55 Views
  • Uploaded on

Finden statt Suchen - Retrieval. Kerstin Zimmermann Universität Oldenburg. Berlin, Oktober 2000. * Aufbau eines Harvestsystems * Installation und Konfiguration * Suchen mit Harvest. Inhaltsverzeichnis. Online Theses in Europe. many theses at several places

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Finden statt Suchen - Retrieval' - ranee


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Finden statt suchen retrieval

Finden statt Suchen - Retrieval

Kerstin Zimmermann

Universität Oldenburg

Berlin, Oktober 2000


Inhaltsverzeichnis

* Aufbau eines Harvestsystems

* Installation und Konfiguration

* Suchen mit Harvest

Inhaltsverzeichnis

Kerstin Zimmermann, Universität Oldenburg


Online theses in europe
Online Theses in Europe

many theses at several places

up to 10 links for theses

some theses found mostly at one place

no theses found yet

updated: April 2000

Kerstin Zimmermann, Universität Oldenburg


Sorten von archiven
Sorten von Archiven

bisher

a) Listen (Name, Titel, Datum)

b) zusätzlich mit Abstract

c) nur Volltext

d) Metadaten, Abtract und Volltext

später DissOnline Dokumentenserver

Kerstin Zimmermann, Universität Oldenburg


Indizierte formate
Indizierte Formate

  • sgml x

  • xml x

  • html X

  • ps X Text, attention: do not use graficmode ASCII required

  • pdf X Text, Destiller-Options: asciipdf=on, commpressed text= off exchangedo not use optimize

  • doc X

  • rtf X

  • tex X

  • dvi X

Kerstin Zimmermann, Universität Oldenburg


Globale harvest serverstruktur
Globale Harvest Serverstruktur

global

national

fach-spezifisch

europaweit

Kerstin Zimmermann, Universität Oldenburg


Retrieval
Retrieval

public

WWW

Workstation

Server / Archive

PC

private

Kerstin Zimmermann, Universität Oldenburg


Harvest
Harvest

WWW

Browser

HARVEST

WWW-SERVER

N

BROKER

Result

Result

..........

.............

............

http://www.physik...

Internal Area

Request

Dissertation

GATHERER

User

Kerstin Zimmermann, Universität Oldenburg


Tags and metadata
<tags> and Metadata

HTML Element SOIF-Element

<A HREF> url-reference{}

<ADDRESS> address{}

<H1 ... H6> headings{}

<TITLE> title{}

...

Metadaten SOIF-Element

DC.title dc.title{}

DC.author dc.author{}

...

Kerstin Zimmermann, Universität Oldenburg


Rechtliche Aspekte

§

  • Promotionsordnungen

  • Diskussion in DC.Rights 1999 - rights of the resource (un-)restricted access / use - rights of Metadata

  • DissOnline Dokumentenserver

Kerstin Zimmermann, Universität Oldenburg


Harvest - Configuration

Provider

Broker

gdbm

SOIF

HTTP

objects

Provider

HTTP

Gatherer

glimpse

SOIF

HTTP

Broker

Provider

Kerstin Zimmermann, Universität Oldenburg


SOIF: Example

@FILE { http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/metadocs/ebs.shell.structure.html

update-time{9}: 938935362

url-references{208}: http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/ebs.shell.structure.pdf

mailto:[email protected]

http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/ebs.shell.structure.pdf

title{59}: Shell Structure and Stability of Very Neutron-Rich Isotopes

keywords{97}:

and author date eberhard ebs files hilf isotopes neutron pdf rich shell stability structure very

head{16}: -Version 1.0 -->

dc.type{59}: InProceedings

(SCHEME=Freetext)publication-status=published

dc.title{59}: Shell Structure and Stability of Very Neutron-Rich Isotopes

dc.publisher{18}: IKDA, TH Darmstadt

dc.language{18}: (SCHEME=Z39.53)ENG

dc.format{15}: application/pdf

dc.date{75}: (SCHEME=ANSI.X3.30-1985)1975

(SCHEME=ANSI.X3.30-1985)(TYPE=current)19990408

dc.creator{126}: Eberhard R. Hilf

(TYPE=email)[email protected]

(TYPE=phone)+49-(0)441-798-2543

(TYPE=fax)+49-(0)441-798-3201

body{190}: =+4>Shell Structure and Stability of Very Neutron-Rich Isotopes Author:

Eberhard R. Hilf

Phone: +49-(0)441-798-2543

Fax:

+49-(0)441-798-3201

Files: ebs.shell.structure.pdf

Date: 1975

md5{32}: bc1f2750a042a8175cce710030c60d76

file-size{4}: 2440

type{4}: HTML

gatherer-version{6}: 1.5.19

gatherer-host{31}: egoiste.physik.uni-oldenburg.de

gatherer-name{17}: Physics Oldenburg

refresh-rate{5}: 86400

time-to-live{7}: 3888000

last-modification-time{9}: 928224570

description{186}: =+4>Shell Structure and Stability of Very Neutron-Rich Isotopes Author:

Eberhard R. Hilf Phone: +49-(0)441-798-2543

Fax:

+49-(0)441-798-3201

Files: ebs.shell.structure.pdf Date: 1975

}

Kerstin Zimmermann, Universität Oldenburg


Harvest Links

Harvest-Sources:

ftp://ftp.tardis.ed.ac.uk/pub/harvest/develop/snapshots/

More infos:

http://www.dissonline.org/harvest.html

Kerstin Zimmermann, Universität Oldenburg


Port nummern
Port-Nummern

  • Harvest 8500

  • Webserver http 80

  • ftp 21 tcp

  • telnet 23

  • smtp (email) 25

  • pop3 110

  • time-server 123

Kerstin Zimmermann, Universität Oldenburg


Warum harvest
Warum Harvest?

  • dezentrales System

  • heterogene Einträge

  • plattformunabhängig

  • Software public domain (-> Kostenersparnis)

  • open sourcecode ( -> offene Schnittstellen)

Kerstin Zimmermann, Universität Oldenburg


Harvest anleitung
Harvest Anleitung

  • indexierbare Formate

  • Softwarelink

  • Handbuch

  • Installationshilfe

  • Fehlerquellen

  • http://www.dissonline.org/harvest.html

Kerstin Zimmermann, Universität Oldenburg


Kerstin Zimmermann, Universität Oldenburg


  • Requirements for Harvest-Servers

  • Platforms:

    • DEC OSF/1 2.0 or newer

    • SunOS 4.1.x or newer

    • SunSolaris 2.3 or newer

    • HPUX

    • AIX 3.x or newer

    • Linux all Kernel from 1999 on...

    • ... beginning with Version 1.5 Harvest should run under all Unix-Platforms, but WindowsNT

Kerstin Zimmermann, Universität Oldenburg


  • Requirements for Harvest-Servers

  • Software:

    • Perl v4.0 or higher (v5.0 preferred)

    • gzip

    • tar

    • HTTP-Server (may be on remote machine)

    • GNU gcc v2.5.8 or higher

    • flex v2.4.7

    • bison v1.22

Kerstin Zimmermann, Universität Oldenburg


Installation
Installation

rlogin

Password:

cp harvest-1.5.20.tar.gz

gunzip harvest-1.5.20.tar.gz

tar -xf harvest-1.5.20.tar

cd harvest-1.5.20

login on remote machine

type in and forget...

copy source...

uncompress sources

unpack sources

change into sources dir

Kerstin Zimmermann, Universität Oldenburg


Installation1
Installation

  • RunHarvest

  • Tuning:

    • Gatherer

      • Editing the Gatherername.cf

      • Editing the RunGatherer and RunGatherd

    • Broker

      • Editing the admin/Collection.conf

      • Editing the CGI-Files

Kerstin Zimmermann, Universität Oldenburg


Fehlermeldungen quellen
Fehlermeldungen / -quellen

Broker findet nichts

-> Glimpse-Server läuft nicht

Gatherer tut nicht

-> port-Nummer belegt

Kerstin Zimmermann, Universität Oldenburg


Laufzeit und datenmengen
Laufzeit und Datenmengen

DFN-Netz 3 Doks pro Minute

Ladezeit vgl. Browser

indizieren [ms]

Speicherplatz 9 MB

PhysDis (Jan.‘00) 306 ‚echte‘ links

1475 Dokumente

112 Server

Gatherer 2h 4min

Kerstin Zimmermann, Universität Oldenburg



Suchergebnisse
Suchergebnisse

Möglichkeiten

- Trefferlisten

- Link zum Index-file

- Link zum Volltext

(- Link zum Worttreffer im Text)

Kerstin Zimmermann, Universität Oldenburg


mit Metadaten

Kerstin Zimmermann, Universität Oldenburg


Zusammenfassung
Zusammenfassung

geplante Suchdienststruktur

bundesweit / weltweit

Dissertation auf verschiedenen Servern

Suchdienste (Prototyp)

Harvest

technische Details

Installationshilfen

Kerstin Zimmermann, Universität Oldenburg


Diskussionspunkte
Diskussionspunkte

  • Suchtiefe

  • Volltext gegenüber Metadaten und Abstrakt

  • Integration alter Archive

  • Zugriff

  • Anregungen, Kommentare

  • -> [email protected]

Kerstin Zimmermann, Universität Oldenburg


ad