1 / 20

Konsep Dasar Sistem Temu Kembali Informasi

Sistem Temu Kembali Informasi/ Information Retrieval. Konsep Dasar Sistem Temu Kembali Informasi. Dokumen. Penyimpanan yang T erorganisasi. Database. Database Mahasiswa. U nstructured. Siapa pemain dalam novel tersebut ?. Digital Library UB. Google. Database Retrieval vs IR.

milos
Download Presentation

Konsep Dasar Sistem Temu Kembali Informasi

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Sistem Temu Kembali Informasi/ Information Retrieval KonsepDasarSistem Temu KembaliInformasi

  2. Dokumen

  3. Penyimpanan yang Terorganisasi

  4. Database Database Mahasiswa

  5. Unstructured Siapa pemain dalam novel tersebut ?

  6. Digital Library UB

  7. Google

  8. Database Retrieval vs IR • Database retrieval – Dokumenmana yang mengandunghimpunan keyword? – Semantikdidefinisikandenganbaik – Error darisuatuobyekmengakibatkankegagalan! • Information retrieval – Informasimengenaisuatusubyekatautopik – Semantikdapatbersifatlepas (longgar) – Error kecilditoleransi

  9. Pengertian IR • Pencarianmateri (biasanyadokumen) darisesuatu yang sifatnyatak-terstruktur (unstructured, biasanyateks) untukmemenuhikebutuhaninformasidaridalamkoleksibesar (biasanyadisimpandalamkomputer). • Representasi, penyimpanan, organisasi, pencariandanakseske item informasiuntukmemenuhikebutuhaninformasipengguna. • Penekananpadaprosesretrieval informasi (bukan data). • Karakterisasikebutuhaninformasitidaklahmudah.Harusditranslasikedalamsuatu query terlebihdahulu.

  10. Information Retrieval • Secarateknis: indexing (pembuatanindex) danretrieval (pencarianketerangan) dokumentextual. • Pencarianhalamanpada WWW adalahaplikasi paling “ngetop” saatini • Fokuspertama: me-retrieve dokumen- dokumen yang relevandengan query. • Fokuskedua: me-retrieve himpunanbesardokumensecaraefisien. • Tujuan: Me-retrieve semuadokumen yang relevansekaligus me-retrieve sesedikitmungkindokumenyang tidakrelevan

  11. Relevan • Relevansimerupakansuatujudgment (keputusan) subyektifdandapatdidasarkanpada: – Topik yang tepat. – Waktu (informasiterbaru). – Otoritatif (darisuatusumberterpercaya). – Kebutuhaninformasidaripengguna. • Kriteriarelevansiutama: suatusistem IR sebaiknya (harus) memenuhikebutuhaninformasipengguna.

  12. Sistem IR

  13. Sistem IR

  14. Pencarian Keyword • Ide paling sederhanadarirelevansi: apakah string query adadidalamdokumen (katademikata, verbatim)? • Ide yang lebihfleksibel: Berapaseringkata-katadidalam query munculdidalamdokumen, tanpamelihaturutannya (bagof words)?

  15. Masalahdengan Keyword • Mungkintidak me-retrieve dokumenrelevan yang menyertakansynonymous terms. – “restaurant” vs. “café” – “NDHU” vs. “National Dong Hwa University” • Mungkin me-retrieve dokumentak-relevan yang menyertakanambiguous terms. – “bat” (baseball vs. mamalia) – “Apple” (perusahaan vs. buah-buahan) – “bit” (unit data vs. perilakumenggigit)

  16. BukanSekedar Keyword • Kita akanmendiskusikandasar-dasar IRberbasiskeyword, tetapi… – Fokuspadaperluasandanpengembanganterakhiruntukmendapatkanhasilterbaik. • Kita akanmembahasdasar-dasarpembangunansistem IR yang efisien, tetapi… – Fokuspadaalgoritmadankemampuandasar, bukanmasalahsistem yang memungkinkanpengembanganke database ukuranindustri.

  17. IR Cerdas • Memanfaatkanpengertianataumaknadarikata yang digunakan. • Melibatkanurutankatadidalam query. • Beradaptasidenganpenggunaberdasarkanpadafeedback, langsungatautidaklangsung. • Memperluaspencariandengan term terkait. • Mengerjakanpemeriksaanejaaan/perbaikantandapengenalotomatis. • MemanfaatkanOtoritasdarisumber

  18. Perkembangan IR • KlasifikasiDokumen • Clustering Dokumen • PeringkasanTeks • Question Answering System

  19. Portal Jurnal • Computer.org (gunakan proxy UB) : • http://scholar.google.com/ • http://www.sciencedirect.com/ : • Other

  20. Selesai

More Related