1 / 21

10 millió publikált oldal az Interneten

10 millió publikált oldal az Interneten. Biszak Sándor ARCANUM Adatbázis. –– Alapítva 1989 –– Alapító Magyar Szabadalmi Hivatal Cél a CD-ROM magyarországi bevezetése Első CD-ROM 1991Nemzetközi Szabadalmi Osztályozás Első DVD-ROM 2000 150 CD-ROM and DVD-ROM az elmúlt 20 évben:

zanthe
Download Presentation

10 millió publikált oldal az Interneten

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 10 millió publikált oldal az Interneten Biszak SándorARCANUM Adatbázis

  2. –– Alapítva 1989 –– • Alapító Magyar Szabadalmi Hivatal • Cél a CD-ROM magyarországi bevezetése • Első CD-ROM 1991Nemzetközi Szabadalmi Osztályozás • Első DVD-ROM 2000 • 150 CD-ROM and DVD-ROM az elmúlt 20 évben: • Bibla, versek, lexikonok, stb. és nagy számban levéltári és könyvtári adatbázisok

  3. — Régmúlt — Technológia: 10-15 adatrögzítő, szedő, ugyanennyi korrektor • Előny: • igen jó szövegminőség (99.95-99.99%): 10.000 betűnként 1-5 hiba • Hátrány: • havonta maximum 4-5000 oldal feldolgozása • nagyon drága Kiadványok: • iparjogvédelmi adatbázisok (védjegy, szabadalom, osztályozási rendszer), • VersTár, Biblia, Pallas Nagy Lexikon, Miszáth, Jókai összes, stb.

  4. — Közelmúlt — • A világ megváltozott, elsősorban a Google Books megjelenésével. • A digitalizálás a tömeges feldolgozás irányába indult el. • (Patents!, Books) • Technológia: nagy tömegű digitalizálás (szkennelés), automatikus szövegfelismerés (OCR) • Előny: nagy mennyiség, olcsó • Hátrány: szövegminőség (98-99%), 10.000 betűnként 100-200 hiba • Publikálás: kétrétegű PDF • Szkennelt, hiteles kép • Alatta az automatikusan felismert szöveg • Saját fejlesztésű internetes kereső – Betekintés az indexbe - Csonkolás jobbról, balról - Szomszédossági keresés -Találat kivilágítása - Tetszőleges méretű adatbázis (akár több millió oldal) – Nagy sebesség

  5. — A JELEN. Mindent digitalizálunk — • Oklevelek, egyedi iratok, régi könyvek könyvszkennerrelBookEye 3 A1 color és Zeutschel OMNISCAN 12000 • Kapacitásunk: 2000 felvétel / nap • A1 (60×80 cm) és A2 dokumentum méret • 36 bit színmélység, 100-600 DPI felbontás • Sebesség: szürke 1 mp, szines 4 mp • Beépített, 100 mm-es tartományban állítható motoros könyvtartó • UV-mentes nagy fényerejű fehér LED • Tökéletes, tükrözésmentes megvilágítás • Könyv-görbület korrekció • Kíméletes, csak a szkennelés ideje alatti fényterhelés

  6. — A JELEN. Mindent digitalizálunk — Qidenus RBS Pro TT robotszkenner legfontosabb jellemzői • könyvszkennelő robot a minőségi nagytömegű digitalizáláshoz • 2 az 1-ben eszköz: teljesen automata mód (2000 oldal/óra teljesítmény); manuális, félautomata mód (900 oldal/óra) • Szabadalmaztatott lapozó megoldás: „bionikus ujj” • Gyökeresen új könyvtartó rendszer • Hatékony dupla-lapozás ellenőrzés • A legújabb Canon DSLR kamerák használata, 300-400 dpi felbontás • A borítólapok, a kötésből kiszakadt oldalak digitalizálása • QiSoft programcsomag: képfeldolgozás, formátum-konverzió, munkafolyamat irányítás, OCR, metaadatok • Asztali kivitel: kompakt, hordozható, gazdaságos

  7. — A JELEN. Mindent digitalizálunk — • Könyvek, folyóiratok, képeslapok • 2 Canon X10C nagysebességű szkenner Kapacitásunk: 20.000 oldal / nap2009-ben 3 millió oldalt digitalizáltunk • Canon imageFORMULA DR-X10C • Maximális felbontás 600 DPI • Maximumális méret A3 (1m) • Kétoldalas szines szkennelés • Ultrahangos duplalap-behúzás érzékelő, kapocs detektálás • Por mentes szkennelőrendszer • „Újra-próbáló” lapbehúzás • Szkennelési sebesség: szines 128 lap/min; szürke vagy FF 128 lap/min • Nagyvolumenű terhelhetőség: 60,000 oldal/nap • Sima, begyűrődésmentes adagoló- és görgőmechanizmus fotók és régi újságok esetén is!

  8. — A JELEN. Mindent digitalizálunk — • Térképek, tervek, plakátok nagy formátumú szkennerrel • Három VIDAR szkenner • Kapacitás: 1000 térkép / nap • VIDAR SELECT P42 PLUS • Maximumális felbontás: 600 DPI • Max. dokumentum szélesség: 106 cm • Max. dokumentum hossz: korlátlan • Max. dokumentum vastagság: 15 mm • Színmélység: 42 bit/24 bit • Tripla 4-soros CCD (RGB Triplets + Panchromatic B/W) • Precíz színkalibráció, kiváló színhűség, zaj nélküli képek • nagyfrekvenciás, hideg fényű megvilágítás • Computer-vezérelt sima görgőmechanizmus • 400 megabit/sec sebességű adatátvitel

  9. ——— Specialitásunk a régi térkép ——— - Digitalizáltuk a Habsburg Birodalom katonai felméréseit (1., 2. és 3.) - Magyarország történeti a kataszteri térképeit XIX. század (100,000 szelvény) - Horvátország történeti kataszteri térképeit (30,000 szelvény)

  10. —— Specialitásunk a régi térkép —— Térkép a képből: - georeferálás: GPS koordináta minden pixelre - nagyméretű mozaik a szelvényekből - publikálás DVD-ROM-on vagy Interneten (Google maps)

  11. –– Internetes adatbázisaink –– 10 millió oldal Magyar Távirati Iroda (MTI) 1920-1950: 850.000 oldal

  12. –– Internetes adatbázisaink — 10 millió oldal Magyar Szabadalmi Adatbázis 1896-2009: szabadalmak, védjegyek

  13. –– Internetes adatbázisaink –– 10 millió oldal Parlamenti Napló 1861-1990: 700.000 oldal

  14. –– Internetes adatbázisaink –– 10 millió oldal • Magyar Országos Levéltár • Középkori oklevelek adatbázis: 110.000 oklevél 500.000 kép • A MOL összes kiadványa: 200.000 oldal • Királyi Könyvek 1526-1918: 100.000 kép • Kataszteri térképek (50.000 szelvény); Kéziratos térképek (120.000 szelvény)

  15. — Internetes adatbázisaink — 10 millió oldal Önkormányzati levéltárak közös adatbázisa: - Levéltári kiadványok: 500.000 oldal - MSZMP vezető testületi jegyzőkönyvek 1956-1990: 250.000 oldal - Kataszteri térképek: 100.000 térképszelvény

  16. –– Internetes adatbázisaink –– 10 millió oldal Múzeumi kiadványok: 48 múzeum 900.000 oldal

  17. –– Internetes adatbázisaink –– 10 millió oldal Képeslapok: 4 múzeum 150.000 képeslap

  18. — Helyi lapok tömeges digitalizálása — • Digitalizálás lapadagolós szkennerrel? • Előnye: igen jó minőségű szkennelés, jó minőségű OCR • Hátránya: a köteteket lapokra kell bontani • Döntés: a kötetek szétszedése, visszakötés nélküli tárolása, szolgáltatás digitálisan • Digitalizálás mikrofilmről? • Előnye: viszonylag egyszerű, gyors, teljes • Hátránya: igen rossz minőségű, szövegfelismerésre (OCR) alkalmatlan • Nem biztosítható az elfogadható színvonalú keresés

  19. — A jövő — • Országos együttműködés lehetősége, közös publikálás • Tudományos periodikumok: ADT (Arcanum Digitális Tudománytár) • Helyi lapok • Napilapok • Lexikonok, könyvritkaságok • Helytörténeti gyűjtemények — Felajánlás a közgyűjteményeknek — • 2011 kötet térítés mentes digitalizálása 2011-ben • Partnerintézményeket keresünk • Helyszíni kitelepülés, mini digitalizálási konferenciák • Tartalmak közös kiválasztása • Digitális tartalmak átadása, igény esetén publikálása

  20. Köszönöm a figyelmet! ——— www.arcanum.hu ———

More Related