Alternat v inform ci kezel s a nava ban
This presentation is the property of its rightful owner.
Sponsored Links
1 / 14

Alternatív információkezelés a NAVA-ban PowerPoint PPT Presentation


  • 83 Views
  • Uploaded on
  • Presentation posted in: General

Alternatív információkezelés a NAVA-ban. (Strukturált dokumentumok rendszerén alapuló információkezelés, mint alternatíva, a Nemzeti Audiovizuális Archívumban). Knapp Gábor, NAVA. A NAVA „másik” feladata. Egyik: Kötelespéldány archívum (sugárzott rádió és tv) Egységes, állandó séma

Download Presentation

Alternatív információkezelés a NAVA-ban

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Alternat v inform ci kezel s a nava ban

Alternatív információkezelés a NAVA-ban

(Strukturált dokumentumok rendszerén alapuló információkezelés, mint alternatíva, a Nemzeti Audiovizuális Archívumban)

Knapp Gábor, NAVA


A nava m sik feladata

A NAVA „másik” feladata

  • Egyik: Kötelespéldány archívum (sugárzott rádió és tv)

    • Egységes, állandó séma

    • Folyamatos tervezett gyarapodás, realtime (meta/media)

    • Tervezett munkafolyamat (realtime, de pufferelt)

    • Nagy mennyiség (kb. 100.000 rekord/év)

    • Törvény által szabályozott hozzáférés

  • Másik: Önkéntes archívum

    • Sokféle, változatos, időben is változékony séma

    • Eseti feladatok (ritkán, de persze azonnal kell minden…)

    • Egyedi bevételezési megoldások

    • Egyedi metaadat források: papír/doc/xml/xls/html/txt

    • Egyedi média források: dvd/svhs/betasp/digitbeta/mpeg4/mpeg2

    • Kevés rekord (gyűjteményenként <1000)


Jelenlegi k l ngy jtem nyek

Jelenlegi különgyűjtemények

+ MTV archívum (Híradók, Öveges stb.)


Alternat v inform ci kezel s a nava ban

Demo

  • http://nava.hu/test/kulon.htm

  • http://mnfa.nava.hu


K z s k vetelm nyek

Közös követelmények

(Ha már bent vannak a gyűjtemények…)

  • A kötelespéldánynál már megvalósult funkciók:

    • Böngészhetőség (idő szerint: RTV részletes…)

    • Kereshetőség (mezők szerint, olykor szabadszavasan)

    • OAI-PMH protokoll szerinti lekérdezhetőség (DC, NDA)

    • Szabályozott hozzáférés (kijátszás, metaadat bevitel)

  • További funkciók:

    • Más böngészési elvek (pl. tag-felhő)

    • Más kijátszási formátumok (pl. mpeg4/avc, flash)

    • Kiterjesztés a többnyelvűség felé (VideoActive)

    • Felhasználói közreműködés (upload, annotálás, P2P-Fusion)

    • Egyedi szabályok szerinti hozzáférés


Fejleszt si c l 2007 okt ber

Fejlesztési cél, 2007 október

  • Tájékoztató kidolgozása különgyűjteményekhez

    • Mit tudunk ajánlani, milyen erőforrások árán

    • Mennyi idő, mennyi tárhely, mekkora sávszélesség, hány/milyen ember, -> azaz: mennyi pénz…

  • Szabályozott, dokumentált munkafolyamat kidolgozása különgyűjteményekhez

    • Bevételezési technológia összeállítása (meta/média)

    • Konvertálási lehetőségek/technikák, tárhely biztosítása

    • Időzítés, erőforrás becslés

  • Új alkalmazás (csoport) készítése, amely megvalósítja a közös követelményeket

    • A kötelespéldánynál működő funkciók megvalósítása

    • Az új funkciók kísérleti megvalósítása, majd tesztelése


Mi rt nem a jelenlegi alkalmaz s

Miért nem a jelenlegi alkalmazás?

  • Feladat

    • Mind a munkafolyamat, mind az adatok, mind a célközönség szempontjából új feladatok

  • Biztonság

    • A „gyár”-nak működnie kell, egy ilyen fejlesztés gyerekbetegségei megengedhetetlen kockázatot jelentenének

    • A NAVA-ba minden művelet nagyon leterheli a szervereket, es nagyon sokáig tart…

  • Technológia

    • A fejlesztés egyben kísérlet arra, hogy a web 2.0 technológia által kínált lehetőségek hogy alkalmazhatók

    • A tapasztalatok alapján beláthatatlanul hosszú fejlesztési idő

    • A felvázolt többlet funkciók annyira eltérnek, hogy célszerű újat kezdeni


Fejleszt s 1 bej tsz s transzk dol s kij tsz s

Fejlesztés 1: Bejátszás, Transzkódolás, Kijátszás

  • Bejátszás

    • a bevételi lehetőségek, a szoftverek paramétereinek, vezetékezés, eszközök dokumentálása,

    • lehetőség szerint állandóan rendelkezésre álló, összeállított eszközpark létesítése

    • felhasználói és/vagy automata upload (P2P-Fusion)

  • Transzkódolás, kulcskép generálás

    • Jelenleg: MPEG2 TS, RealVideo/Audio

    • Terv: MPEG4/AVC (pl. P2P-Fusion követelmény)

  • Kijátszás (szabályozott)

    • Jelenleg: real stream

    • Terv: download, mélylink/beágyazhatóság (vízjelezés?)

    • Terv: Flash + MPEG-4


Fejleszt s 2 meta s ma kialak t sa

Fejlesztés 2: Meta séma kialakítása

  • Séma minimális követelmények

    • DC elvek, az azonosításhoz szükséges DC mezők

    • XML/XSD formátum, XSLT

  • Séma felderítése, definiálása (gyűjteményenként)

    • Kapott metaadatok alapján

    • Kapott dokumentumok alapján

    • Belső struktúra, dokumentumok közötti kapcsolatok

    • Formális sémadefiníció (XSD)

  • Séma megjelenítésének tervezése (CSS, XSLT-k)

    • Rövid lista tartalma, részletes lista tartalma

    • Védett (nem megjeleníthető) mezők

    • OAI-PMH exportok, RSS


Fejleszt s 3 meta s m k sszehangol sa

Fejlesztés 3: Meta sémák összehangolása

(Talán a legnehezebb feladat…)

  • Mezők összekapcsolása (több-> egy, egy-> több)

    • Pl. nevek különböző reprezentációja

  • Szótárak összekapcsolása

    • Pl. különböző műfaji kategorizálás

    • Felsőbb szintű tezaurusz/ontológia? (VideoActive)

  • Megfeleltetés adatcsere formátumoknak

    • Pl. DC, DC.Culture


Fejleszt s 4 hozz f r s vez rl s

Fejlesztés 4: Hozzáférés vezérlés

  • Kötelespéldány archívum:

    • Archivátori alkalmazás: Tábla/Csoport szinten szabályozott

    • Kereső alkalmazás:

      • kereshet (internet)

      • kereshet, és elmentheti a találatokat (regisztrált)

      • Kereshet, lejátszhat (navapont)

      • Kereshet, elmenthet, lejátszhat (regisztrált + nava pont)

  • Tervezett különgyűjteményeknél:

    • Mező/Felhasználó szintű, ACL alapú szabályozás

      • Felhasználói annotáció, rangsorolás

    • Az audio/videó állománynál

      • Idő/tér korlátozott hozzáférés

      • Megtekintés/letöltés (ingyen/pénzért)

      • Csak demo részletek

      • Authentikáció jobb megoldása


Fejleszt s 5 keres s b ng sz s

Fejlesztés 5: Keresés/Böngészés

  • Keresés

    • Szabadszavas keresés a tartalomban

    • A találati lista rendezése mezők/gyűjtemények/relevancia szerint

    • Rendezés felsőbb szemantikai szint szerint (pl. ember)

    • Finomított keresés találati listában

    • Keresés kiterjesztése túl kevés találat esetén (ontológia)

    • Találatok csoportosítása túl sok találat esetén (ontológia)

  • Böngészés

    • Gyűjteményenként valószínűleg specifikus

    • Tag- felhő alapján (automata klaszterezés)

  • OAI-PMH export

    • A rendszer nyitott, mindenki csinálhat saját keresőt is…


T vlati c l 2008

Távlati cél, 2008…

  • Hipotézis 1:

    • Az alkalmazandó, web-re kidolgozott „szabad szavas indexelő”, illetve félstrukturált dokumentum alapú megoldások nagyszámú dokumentum esetén is legalább olyan hatékonyak, mint a relációs adatbázis alapúak

    • Tehát, mivel az új alkalmazás szempontjából a kötelespéldány archívum „csak egy eset”, így érdemes kipróbálni az új alkalmazás hatékonyságát több százezer rekordra, és ha beválik…

  • Hipotézis 2:

    • Az új technológia felhasználói interfészében is új, népszerűbb lehet a felhasználók körében (lásd YouTube), könnyebb hozzá oktatatási stb célú speciális API-kat illeszteni

    • A felhasználói interakció gazdagíthatja a nehezen annotálható tartalmat (pl. 1988-as TV híradók)


K sz n m a figyelmet j tv gyat

Köszönöm a figyelmet!(Jó étvágyat!)

www.nava.hukereso.nava.humnfa.nava.hu

Knapp Gábor, [email protected]


  • Login