1 / 31

A hatékony információkeresés alapjai

A hatékony információkeresés alapjai. Aranyi Zoltán SZTE Klebelsberg Könyvtár aranyi@ ek.szte.hu. Áttekintés. Alapfogalmak Adatbázisok kategorizálása Adatbázisok jellemzése Keresés menete Keresési technikák Találatok feldolgozása. Alapfogalmak 1.

clem
Download Presentation

A hatékony információkeresés alapjai

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. A hatékony információkeresés alapjai Aranyi Zoltán SZTE Klebelsberg Könyvtár aranyi@ek.szte.hu

  2. Áttekintés • Alapfogalmak • Adatbázisok kategorizálása • Adatbázisok jellemzése • Keresés menete • Keresési technikák • Találatok feldolgozása

  3. Alapfogalmak 1. • Adatbázis : Adatmezőkből álló rekordok rendezett halmaza. Logikai szerkezettel rendelkező, információk tárolására és visszakeresésére szolgáló számítógépes állomány. (Forrás : Elektronikus könyvtári értelmező szótár : http://www.bibl.u-szeged.hu/mke_eksz/docs/ekszotar/)

  4. Alapfogalmak 2. • Rekord : A számítógépes adatbázisok egyik alapegysége: önállóan kezelhető, logikailag összetartozó adatmezők együttese (pl. egy dokumentum bibliográfiai adatsora). (Forrás : Elektronikus könyvtári értelmező szótár : http://www.bibl.u-szeged.hu/mke_eksz/docs/ekszotar/)

  5. Alapfogalmak 3. • Mező : A rekord alapegysége, melyet névvel (kóddal) és tartalommal látnak el. Megkülönböztetünk kereshető és nem kereshető (de megjeleníthető) mezőket.

  6. Struktúra Mező => Rekord => Adatbázis

  7. Adatbázisok kategorizálása • Két fő szempont : • TARTALOM • TÍPUS • A fentiek keverednek egymással • Bizonyos esetekben a kategorizálás (pl. információ hiányában) nem végezhető el egyértelműen

  8. Adatbázisok tartalom szerinti csoportosítása • Milyen szakterületet ölelnek fel? • Lehet multidiszciplináris is! • Milyen típusú forrásokat dolgoz fel? • Pl. könyvek, folyóiratok, szabadalmak, videodokumentumok, vegyes, stb. • Milyen a feldolgozás mélysége? • Csak bibliográfiai adatok, vagy tartami kivonatok is, esetleg teljes szöveg; stb. • Milyen időtartamot fed le? • Milyen gyakran frissítik? • Hány rekordot tartalmaz?

  9. Adatbázisok típus szerint • Bibliografikus • „szakirodalmi” • szabadalmi • vegyes • Teljes szövegű (full-text) • Faktografikus • Katalógus • Egyéb (pl. kémiai szerkezeti, stb.) • Vegyes (a fentiek közül több is)

  10. A szakirodalmazás menete • Két fő fázisa a tágabb értelemben vett ELŐKÉSZÍTÉS és a VÉGREHAJTÁS • A két fő fázis ciklikusan ismétlődik • Ha EREDMÉNYESEN akarunk dolgozni, az előkészítés a hosszadalmasabb, a nagyobb körültekintést igénylő fázis

  11. Keresés előkészítése • Tisztáznunk kell a keresés célját • Megfelelő adatbázis(oka)t kell keresnünk • Tartalmuk és típusuk szerint is mérlegelni kell • Át kell gondolnunk a keresendő fogalomköröket • Meddig terjed a határ ; milyen keresőszavak merülhetnek fel (szerzőnevek, tárgyszavak, stb.) ; hol érdemes csonkolni ; kell-e korlátozni a keresést (idő, nyelv, dokumentum típusa szerint) ; milyen operátorokat használunk majd ; stb.

  12. Keresés végrehajtása • A találatok kiértékelését követően az esetleg felmerülő problémák miatt legtöbbször vissza kell térni az előkészítéshez, és módosítani kell a keresést. Ezt akár többször is érdemes megtenni. • A „végső” találati halmaz még feldolgozásra vár, ez nem kerülhető meg!

  13. Keresési technikák • Kulcsszavas keresés : egy vagy több szó előfordulását keressük • Böngészés : indexben szereplő szavakat vagy kifejezéseket keresünk („lista” áttekintése) (Hasonlóan, mint Az SZTE EK OPAC-ja ppt-ben!)

  14. Csonkolás, karakterhelyettesítés • Az egyes adatbázisok különböző speciális karaktereket használnak : *, $, %, #, ?, ! • Eltérő csonkolási típusok lehetnek : • A) Végtelen csonkolás • Általánosan használt; akárhány karakter követheti a beírtakat (nulla is!) • B) Adott karakterre történő csonkolás • Karaktersorozaton belül is használhatjuk (pl. wom!n => woman ; women) • C) Csonkolás megadott határok között (pl. 4 karakterre) • A magyar nyelvi sajátosságok miatt nagyon alaposan át kell gondolni a használatukat

  15. Keresések korlátozása • Leggyakoribb esetei : idő, nyelv, dokumentum típusa • Legtöbbször valamely mező kitöltésével (pl. megjelenés éve / időszaka), vagy legördülő menüből történő kiválasztással (pl. dokumentum típusa) működik • Akkor érdemes használni, ha biztosak vagyunk a hatékonyságában

  16. Operátorok • A legtöbb adatbázis keresések eredményeiből találati halmazokat képez • A halmazok, vagy egyes keresőszavak között, de halmaz és keresőszó között is kapcsolatokat létesíthetünk: erre szolgálnak az operátorok • Három típusukat különítjük el: • Logikai vagy Boole-operátorok • Helyzeti operátorok (más elnevezése is lehet!) • Szám- vagy numerikus operátorok

  17. Logikai operátorok • A legelterjedtebb operátorok: ÉS, VAGY, NEM (AND, OR, NOT) • Ritkán speciális karaktereket is használhatnak helyettük (*, +, -, stb.) • Jelentésüket „halmazábrákkal” (Venn-diagram) szoktuk szemléltetni • Egyértelmű a használatuk, ha zárójeleket alkalmazunk

  18. AND (ÉS) erős kicsi erős AND kicsi Sok kicsi sokra megy. x Erős, mint a méreg. x Kicsi a bors, de erős.  A sorrend tetszőleges : erős AND kicsi ugyan azt adja, mint kicsi AND erős

  19. OR (VAGY) erős kicsi erős OR kicsi Sok kicsi sokra megy.  Erős, mint a méreg.  Kicsi a bors, de erős.  A sorrend tetszőleges : erős OR kicsi ugyan azt adja, mint kicsi OR erős

  20. NOT (NEM ; DE NEM) kicsi erős kicsi erős erős NOT kicsi kicsi NOT erős Sok kicsi sokra megy. x Sok kicsi sokra megy.  Erős, mint a méreg. Erős, mint a méreg. x Kicsi a bors, de erős. xKicsi a bors, de erős. x A sorrend fontos : erős NOT kicsi mást jelent, mint kicsi NOT erős

  21. Helyzeti operátorok • Hívhatják szóközelségi, távolsági, stb. operátoroknak is • Jelentésük, jelölésük, alkalmazhatóságuk keresőrendszerenként változik • Szavak, kifejezések sorrendjét és távolságát határozzuk meg segítségükkel • Leggyakrabban a "pontos kifejezés keresése" esetet alkalmazzuk

  22. Pontos kifejezés keresése 1. • Az egyik nagy Internet-kereső azegér elefánt keresésére ~166.000 találatot ad (2013 szeptember végén) • Ugyan ezt kapjuk az elefánt egér megadásával (~166.000 találat) • Az "egér elefánt"beírására 2.910 találatunk lesz • Az "elefánt egér"1.820 találatot produkál

  23. Pontos kifejezés keresése 2. • Egy másik Internet-kereső azegér elefánt keresésére ~33.500 találatot ad (az előző ~166.000 volt) • Az elefánt egér keresésre ~2.780.000 találat van (előzőleg ~166.000 találat) • Az "egér elefánt"2170 találatot eredményez (2.910) • Az "elefánt egér" pedig 191.00 találatot (1.820) • A látszólagos ellentmondás oka : a kereső az "elefánt egér" kifejezésbe beleveszi az "elephantear" -t is.

  24. Példa helyzeti operátorok menüből történő használatára CompLex Web Jogtár keresőablaka

  25. Szám- vagy numerikus operátorok • < ; > ; = ; =< ; <= ; => ; >= ; - (-tól/-ig) • Általában űrlapokon használjuk őket:

  26. Keresési eredmények értékelése • Két fő problémával találkozhatunk • Túl sok találat • Túl kevés találat • Leginkább a sok találat okoz gondot

  27. Túl sok találat… • Újra át kell gondolnunk a téma megközelítését • Újabb keresőszavak, kifejezések használata • Operátorok használata (az AND sokat szűkít, a helyzeti operátorok méginkább!) • Korlátozások (idő, nyelv dokumentum típusa) megfontolása

  28. Túl kevés találat… • Helyesírás ellenőrzése • Tágabb fogalmak, kifejezések használata • Operátorok : az OR bővít! • Csonkolás használata • Téma átgondolása : Lehet, hogy rossz a megközelítésünk?

  29. A keresés módosítása után • Új keresés lefuttatása • Újabb értékelés!!! (Esetleg újabb futtatás…) • Mentés előkészítése: minden találat, vagy csak a kijelöléssel kiválasztottak • Mentés : csak a találatok, vagy a keresés menete (stratégia) is – későbbi futtatás, átdolgozás céljából

  30. Keresés „befejezése” • Lehet, hogy kezdetben csak a bibliográfiai adatok állnak rendelkezésünkre, de újabb ötleteket, megközelítéseket kaphatunk a primer dokumentumokfeldolgozása során • Ez újabb információkeresésre sarkallhat bennünket

  31. Információk a sikeres tanuláshoz • Az alapos megértéshez, a gyakorlati ismeretek elsajátításához a teljes diasorozatot érdemes tanulmányozni • Tesztkérdések csak az aláhúzott című diákból lesznek • GYAKORLAT TESZI A MESTERT!

More Related