Finden statt suchen retrieval
This presentation is the property of its rightful owner.
Sponsored Links
1 / 28

Finden statt Suchen - Retrieval PowerPoint PPT Presentation


  • 38 Views
  • Uploaded on
  • Presentation posted in: General

Finden statt Suchen - Retrieval. Kerstin Zimmermann Universität Oldenburg. Berlin, Oktober 2000. * Aufbau eines Harvestsystems * Installation und Konfiguration * Suchen mit Harvest. Inhaltsverzeichnis. Online Theses in Europe. many theses at several places

Download Presentation

Finden statt Suchen - Retrieval

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Finden statt suchen retrieval

Finden statt Suchen - Retrieval

Kerstin Zimmermann

Universität Oldenburg

Berlin, Oktober 2000


Inhaltsverzeichnis

* Aufbau eines Harvestsystems

* Installation und Konfiguration

* Suchen mit Harvest

Inhaltsverzeichnis

Kerstin Zimmermann, Universität Oldenburg


Online theses in europe

Online Theses in Europe

many theses at several places

up to 10 links for theses

some theses found mostly at one place

no theses found yet

updated: April 2000

Kerstin Zimmermann, Universität Oldenburg


Sorten von archiven

Sorten von Archiven

bisher

a) Listen (Name, Titel, Datum)

b) zusätzlich mit Abstract

c) nur Volltext

d) Metadaten, Abtract und Volltext

später DissOnline Dokumentenserver

Kerstin Zimmermann, Universität Oldenburg


Indizierte formate

Indizierte Formate

  • sgmlx

  • xmlx

  • htmlX

  • ps X Text, attention: do not use graficmode ASCII required

  • pdfX Text, Destiller-Options: asciipdf=on, commpressed text= off exchangedo not use optimize

  • docX

  • rtfX

  • texX

  • dvi X

Kerstin Zimmermann, Universität Oldenburg


Globale harvest serverstruktur

Globale Harvest Serverstruktur

global

national

fach-spezifisch

europaweit

Kerstin Zimmermann, Universität Oldenburg


Retrieval

Retrieval

public

WWW

Workstation

Server / Archive

PC

private

Kerstin Zimmermann, Universität Oldenburg


Harvest

Harvest

WWW

Browser

HARVEST

WWW-SERVER

N

BROKER

Result

Result

..........

.............

............

http://www.physik...

Internal Area

Request

Dissertation

GATHERER

User

Kerstin Zimmermann, Universität Oldenburg


Tags and metadata

<tags> and Metadata

HTML ElementSOIF-Element

<A HREF>url-reference{}

<ADDRESS>address{}

<H1 ... H6>headings{}

<TITLE>title{}

...

MetadatenSOIF-Element

DC.titledc.title{}

DC.authordc.author{}

...

Kerstin Zimmermann, Universität Oldenburg


Finden statt suchen retrieval

Rechtliche Aspekte

§

  • Promotionsordnungen

  • Diskussion in DC.Rights1999- rights of the resource (un-)restricted access / use - rights of Metadata

  • DissOnline Dokumentenserver

Kerstin Zimmermann, Universität Oldenburg


Finden statt suchen retrieval

Harvest - Configuration

Provider

Broker

gdbm

SOIF

HTTP

objects

Provider

HTTP

Gatherer

glimpse

SOIF

HTTP

Broker

Provider

Kerstin Zimmermann, Universität Oldenburg


Finden statt suchen retrieval

SOIF: Example

@FILE { http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/metadocs/ebs.shell.structure.html

update-time{9}: 938935362

url-references{208}: http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/ebs.shell.structure.pdf

mailto:[email protected]

http://www.physik.uni-oldenburg.de/Docs/THEO3/publications/ebs.shell.structure.pdf

title{59}: Shell Structure and Stability of Very Neutron-Rich Isotopes

keywords{97}:

and author date eberhard ebs files hilf isotopes neutron pdf rich shell stability structure very

head{16}: -Version 1.0 -->

dc.type{59}: InProceedings

(SCHEME=Freetext)publication-status=published

dc.title{59}: Shell Structure and Stability of Very Neutron-Rich Isotopes

dc.publisher{18}: IKDA, TH Darmstadt

dc.language{18}: (SCHEME=Z39.53)ENG

dc.format{15}: application/pdf

dc.date{75}: (SCHEME=ANSI.X3.30-1985)1975

(SCHEME=ANSI.X3.30-1985)(TYPE=current)19990408

dc.creator{126}: Eberhard R. Hilf

(TYPE=email)[email protected]

(TYPE=phone)+49-(0)441-798-2543

(TYPE=fax)+49-(0)441-798-3201

body{190}: =+4>Shell Structure and Stability of Very Neutron-Rich Isotopes Author:

Eberhard R. Hilf

Phone: +49-(0)441-798-2543

Fax:

+49-(0)441-798-3201

Files: ebs.shell.structure.pdf

Date: 1975

md5{32}: bc1f2750a042a8175cce710030c60d76

file-size{4}: 2440

type{4}: HTML

gatherer-version{6}: 1.5.19

gatherer-host{31}: egoiste.physik.uni-oldenburg.de

gatherer-name{17}: Physics Oldenburg

refresh-rate{5}: 86400

time-to-live{7}: 3888000

last-modification-time{9}: 928224570

description{186}: =+4>Shell Structure and Stability of Very Neutron-Rich Isotopes Author:

Eberhard R. Hilf Phone: +49-(0)441-798-2543

Fax:

+49-(0)441-798-3201

Files: ebs.shell.structure.pdf Date: 1975

}

Kerstin Zimmermann, Universität Oldenburg


Finden statt suchen retrieval

Harvest Links

Harvest-Sources:

ftp://ftp.tardis.ed.ac.uk/pub/harvest/develop/snapshots/

More infos:

http://www.dissonline.org/harvest.html

Kerstin Zimmermann, Universität Oldenburg


Port nummern

Port-Nummern

  • Harvest 8500

  • Webserver http 80

  • ftp 21 tcp

  • telnet 23

  • smtp (email) 25

  • pop3 110

  • time-server 123

Kerstin Zimmermann, Universität Oldenburg


Warum harvest

Warum Harvest?

  • dezentrales System

  • heterogene Einträge

  • plattformunabhängig

  • Software public domain (-> Kostenersparnis)

  • open sourcecode ( -> offene Schnittstellen)

Kerstin Zimmermann, Universität Oldenburg


Harvest anleitung

Harvest Anleitung

  • indexierbare Formate

  • Softwarelink

  • Handbuch

  • Installationshilfe

  • Fehlerquellen

  • http://www.dissonline.org/harvest.html

Kerstin Zimmermann, Universität Oldenburg


Finden statt suchen retrieval

  • Requirements for Harvest-Servers

  • Hardware:

    • fast processor (e.g. Sparc5...)

    • fast I/O

    • much MEMORY ( > 64 MB)

    • 1-2 GB free disk-space (sources take approx 25 MB)

Kerstin Zimmermann, Universität Oldenburg


Finden statt suchen retrieval

  • Requirements for Harvest-Servers

  • Platforms:

    • DEC OSF/1 2.0 or newer

    • SunOS 4.1.x or newer

    • SunSolaris 2.3 or newer

    • HPUX

    • AIX 3.x or newer

    • Linux all Kernel from 1999 on...

    • ... beginning with Version 1.5 Harvest should run under all Unix-Platforms, but WindowsNT

Kerstin Zimmermann, Universität Oldenburg


Finden statt suchen retrieval

  • Requirements for Harvest-Servers

  • Software:

    • Perl v4.0 or higher (v5.0 preferred)

    • gzip

    • tar

    • HTTP-Server (may be on remote machine)

    • GNU gcc v2.5.8 or higher

    • flex v2.4.7

    • bison v1.22

Kerstin Zimmermann, Universität Oldenburg


Installation

Installation

rlogin

Password:

cp harvest-1.5.20.tar.gz

gunzip harvest-1.5.20.tar.gz

tar -xf harvest-1.5.20.tar

cd harvest-1.5.20

login on remote machine

type in and forget...

copy source...

uncompress sources

unpack sources

change into sources dir

Kerstin Zimmermann, Universität Oldenburg


Installation1

Installation

  • RunHarvest

  • Tuning:

    • Gatherer

      • Editing the Gatherername.cf

      • Editing the RunGatherer and RunGatherd

    • Broker

      • Editing the admin/Collection.conf

      • Editing the CGI-Files

Kerstin Zimmermann, Universität Oldenburg


Fehlermeldungen quellen

Fehlermeldungen / -quellen

Broker findet nichts

-> Glimpse-Server läuft nicht

Gatherer tut nicht

-> port-Nummer belegt

Kerstin Zimmermann, Universität Oldenburg


Laufzeit und datenmengen

Laufzeit und Datenmengen

DFN-Netz 3 Doks pro Minute

Ladezeit vgl. Browser

indizieren [ms]

Speicherplatz 9 MB

PhysDis (Jan.‘00)306 ‚echte‘ links

1475 Dokumente

112 Server

Gatherer 2h 4min

Kerstin Zimmermann, Universität Oldenburg


Finden statt suchen retrieval

Kerstin Zimmermann, Universität Oldenburg


Suchergebnisse

Suchergebnisse

Möglichkeiten

- Trefferlisten

- Link zum Index-file

- Link zum Volltext

(- Link zum Worttreffer im Text)

Kerstin Zimmermann, Universität Oldenburg


Finden statt suchen retrieval

mit Metadaten

Kerstin Zimmermann, Universität Oldenburg


Zusammenfassung

Zusammenfassung

geplante Suchdienststruktur

bundesweit / weltweit

Dissertation auf verschiedenen Servern

Suchdienste (Prototyp)

Harvest

technische Details

Installationshilfen

Kerstin Zimmermann, Universität Oldenburg


Diskussionspunkte

Diskussionspunkte

  • Suchtiefe

  • Volltext gegenüber Metadaten und Abstrakt

  • Integration alter Archive

  • Zugriff

  • Anregungen, Kommentare

  • -> [email protected]

Kerstin Zimmermann, Universität Oldenburg


  • Login