1 / 66

การจัดเก็บและค้นคืนสารสนเทศ

การจัดเก็บและค้นคืนสารสนเทศ. INFORMATION STORAGE and RETRIEVAL : ISR. review การค้นหาข้ามฐานข้อมูล. แบ่งตามจุดมุ่งหมายในการจัดทำ สามารถแบ่งได้ดังนี้ 1. ฐานข้อมูลต้นแหล่ง (Source Database) จะให้ข้อมูลฉบับเต็ม (Full Text) แก่ผู้ใช้ ฐานข้อมูลประเภทนี้ได้แก่. ประเภทของฐานข้อมูล.

temima
Download Presentation

การจัดเก็บและค้นคืนสารสนเทศ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. การจัดเก็บและค้นคืนสารสนเทศการจัดเก็บและค้นคืนสารสนเทศ INFORMATION STORAGE and RETRIEVAL : ISR

  2. review การค้นหาข้ามฐานข้อมูล

  3. แบ่งตามจุดมุ่งหมายในการจัดทำ สามารถแบ่งได้ดังนี้ 1. ฐานข้อมูลต้นแหล่ง (Source Database) จะให้ข้อมูลฉบับเต็ม(Full Text) แก่ผู้ใช้ ฐานข้อมูลประเภทนี้ได้แก่ ประเภทของฐานข้อมูล

  4. 1. ฐานข้อมูลต้นแหล่ง (Source Database) 1.1 ฐานข้อมูลข้อเท็จจริง(Factual Database) 1.2 ฐานข้อมูลเนื้อหาเต็ม (Full-Text Database) 1.3 ฐานข้อมูลตัวเลข (Numeric Database) 2. ฐานข้อมูลอ้างอิง (Reference Database) ประเภทของฐานข้อมูล

  5. ปัญหาที่พบจากการเพิ่มจำนวนของฐานข้อมูลปัญหาที่พบจากการเพิ่มจำนวนของฐานข้อมูล

  6. สามารถแก้ปัญหาด้วยวิธีการทำงานแบบปฎิบัติร่วมกัน (Interoperability) เพื่อให้ระบบที่มีความแตกต่างกันทั้งในด้านของฮาร์ดแวร์ (Hardware) ซอฟต์แวร์(Software) และฐานข้อมูล (Database) สามาถแลกเปลี่ยนข้อมูลหรือติดต่อสื่อสารกันได้ วิธีการแก้ปัญหา

  7. ฐานข้อมูล A ฐานข้อมูล B จากพื้นฐานขั้นตอนในการสื่อสาร

  8. สามารถกระทำได้ 2 วิธี คือ 1. Meta search(Federated search) 2. Harvesting and Indexing การทำงานแบบปฎิบัติร่วมกัน (Interoperability)

  9. Meta search(Federated search)

  10. ข้อดี ผลลัพธ์จากการสืบค้นจากทุกๆ แหล่งข้อมูล จะเรียง ลำดับตามที่ต้องการ ถือว่าเป็นเทคนิคการค้นหาที่อำนวยความสะดวกและมีประสิทธิภาพให้แก่ผู้สืบค้น Meta search(Federated search)

  11. ข้อเสีย - ความล่าช้า - ข้อจำกัดในด้านจำนวนของฐานข้อมูล - การพัฒนาทำได้ยาก มีความซับซ้อน Meta search(Federated search)

  12. โปรโตคอลที่ใช้ค้นหาแบบ Meta Search ได้แก่ โปรโตคอล Z39.50 SRU(Search/Retrieve via URL)และอื่นๆ Meta search(Federated search)

  13. Z39.50 หรือ ISO23950 เป็นกฏกติกาที่กำหนดสำหรับการสืบค้นข้อมูลจากคลังข้อมูลหรือฐานข้อมูลที่มีหลากหลายในการให้บริการ มีชื่อเต็มว่า ANSI 39.50-1995, Information Retrieval Application Service Definition and Protocol Specification รายละเอียดเพิ่มเติมสามารถติดตามได้จาก http://www.loc.gov/z39.50/agency/ โปรโตคอล Z39.50

  14. โปรโตคอล Z39.50 การทำงานของโปรโตคอล Z39.50

  15. ตัวอย่างโปรโตคอล Z39.50

  16. สามารถทดลองสืบค้นได้ที่ http://www.loc.gov/z3950/ โปรโตคอล Z39.50

  17. สามารถทดลองสืบค้นได้ที่ http://iic.oie.go.th:8080/gw/basic/indexeng.jsp โปรโตคอล Z39.50

  18. SRU เป็นโปรโตคอลที่ใช้ผ่าน URL โดยใช้ HTTP GET หรือส่งผ่านข้อมูล HTTP POST (SRU via POST) ซึ่งสามารถหลีกเลี่ยงข้อจำกัดในเรื่องความยาวและชุดของตัวอักขระใน HTTP GET สำหรับผลลัพธ์ในการค้นหาข้อมูล อยู่ในรูปแบบที่เขียนด้วย XML โปรโตคอล SRU(Search/Retrieve via URL)

  19. Request http://z3950.loc.gov:7090/voyager?version=1.1&operation=searchRetrieve &query=dinosaur&maximumRecords=1&recordSchema=dc ตัวอย่างการสื่อสารของโปรโตคอล SRU Response <record>  <recordSchema>info:srw/schema/1/dc-v1.1</recordSchema>  <recordPacking>xml</recordPacking>  <recordData>    <srw_dc:dc xmlns:srw_dc="info:srw/schema/1/dc-v1.1">     <dc:title>This is a Sample Record</dc:title>    </srw_dc:dc>  </recordData>  <recordPosition>1</recordPosition>  <extraRecordData>    <rel:score xmlns:rel="info:srw/extensions/2/rel-1.0">      0.965    </rel:rank>   </extraRecordData></record>

  20. การเก็บรวบรวม (Collect) ข้อมูลจากฐานข้อมูลต่างชนิดกันมาไว้ในระบบส่วนกลาง โดยระบบส่วนกลางจะทำหน้าจัดเก็บข้อมูล, จัดทำดรรชนีสำหรับสืบค้น,ให้บริการค้นหาข้อมูล และบริการอื่นๆ ที่เกี่ยวข้องกับข้อมูลที่ได้จาการจัดเก็บ Harvesting and Indexing

  21. Harvesting and Indexing

  22. ข้อดี - มีความรวดเร็วในการสืบค้นข้อมูล เนื่องจากข้อมูลถูกจัดเก็บไว้ในระบบที่ให้บริการสืบค้น - ไม่มีข้อจำกัดของจำนวนฐานข้อมูลภายนอกที่ต้องการค้นหา Harvesting and Indexing

  23. ข้อเสีย - ข้อมูลอาจไม่ถูกปรับปรุงให้ทันสมัย ซึ่งปัจจัยนี้ขึ้นอยู่กับความถี่ของการจัดเก็บข้อมูล - ต้องใช้ฐานข้อมูลขนาดใหญ่ เนื่องจากเป็นการจัดเก็บข้อมูลที่สนใจทั้งหมดมาไว้ที่ส่วนกลาง ดังนั้น จึงจำเป็นต้องจัดเตรียมฐานข้อมูลที่สามารถรองรับข้อมูลที่มีปริมาณมากได้ Harvesting and Indexing

  24. โปรโตคอลที่ใช้ในการดำเนินการแบบ Harvesting and Indexing ได้แก่ โปรโตคอล OAI-PMH (Open Archives Iniative – Protocol for Metadata Harvesting) Harvesting and Indexing

  25. หลักการทำงาน แบ่งการทำงานออกเป็น 2 ส่วนคือ 1. ส่วนจัดเตรียมข้อมูล (Data Provider) 2. ส่วนจัดเตรียมบริการ (Service Provider) OAI-PMH (Open Archives Iniative – Protocol for Metadata Harvesting)

  26. OAI-PMH (Open Archives Iniative – Protocol for Metadata Harvesting)

  27. OAI –PMH ได้กำหนดการร้องขอ (เรียกว่า Verbs)เพื่อร้องขอข้อมูลจากส่วนจัดเตรียมบริการ(Service Provider)ไปยังส่วนจัดเตรียมข้อมูล(Data Provider) ทั้งสิ้น 6 รูปแบบ มีรายละเอียดดังนี้ OAI-PMH (Open Archives Iniative – Protocol for Metadata Harvesting)

  28. OAI-PMH (Open Archives Iniative – Protocol for Metadata Harvesting)

  29. ห้องสมุดดิจิตอล (Digital Library)

  30. ประวัติของห้องสมุดดิจิตอลลลลลลลลลประวัติของห้องสมุดดิจิตอลลลลลลลลล ประวัติความเป็นมา

  31. หมายถึง ห้องสมุดที่มีทรัพยากรอยู่ในรูปแบบของดิจิตอล โดยเนื้อหาในรูปแบบดิจิตอลนั้นอาจจัดเก็บอยู่ภายในห้องสมุดหรือภายนอกก็ได้ ซึ่งสามารถเข้าถึงได้ด้วยเครือข่ายคอมพิวเตอร์ ความหมายของห้องสมุดดิจิตอล

  32. โดยทั่วไปห้องสมุดดิจิตอลจะให้บริการโดยทั่วไปห้องสมุดดิจิตอลจะให้บริการ - ด้านหนังสืออิเล็กทรอนิกส์ - วารสารอิเล็กทรอนิกส์ - บริการอื่นๆ ที่มีเนื้อหาแบบดิจิตอลและ สามารถเข้าถึงได้จากเครือข่ายคอมพิวเตอร์ การให้บริการของห้องสมุดดิจิตอล

  33. ห้องสมุดดิจิตอลถือเป็นห้องสมุดของอนาคต สามารถมองในมุมมองในรูปแบบ 4 มิติดังนี้ 1. Technology 2. Content 3. Service 4. Community มิติของห้องสมุดดิจิตอล

  34. Technology มิติต่างๆ ของห้องสมุดดิจิตอล Community content Service

  35. เทคโนโลยีด้าน ICT (Information Communication Technology) เป็นปัจจัยสำคัญที่สุดของห้องสมุดดิจิตอล โดยจำเป็นต้องมี 1. โครงสร้างพื้นฐาน (Infrastructure) ทาง ICT 2. เทคโนโลยีการสืบค้น เพื่อการเข้าถึงข้อมูล 3. อินเทอร์เฟซ (Interface) มิติของเทคโนโลยี

  36. ประกอบด้วย - เครือข่ายคอมพิวเตอร์ความเร็วสูง - เครื่องคอมพิวเตอร์ - เครื่องเซิร์ฟเวอร์ (Server) - คลังเก็บข้อมูลขนาดใหญ่ (Mass Storage) โครงสร้างพื้นฐานทาง ICT

  37. ในการสืบค้น ห้องสมุดดิจิตอลเน้นการบริการที่มีประสิทธิภาพและประสิทธิผล จึงจำเป็นต้องอาศัยการจัดทำดรรชนี การสร้างเมทาดาตา รวมทั้งกลไกในการเข้าถึงต่างๆ เพื่อให้การสืบค้นได้ผลลัพธ์มีประสิทธิภาพและประสิทธิผลตามต้องการ เทคโนโลยีการสืบค้น

  38. ผู้ใช้บริการสามารถเข้าถึงและอ่านผลได้หลายวิธีและหลายลักษณะ กล่าวคือ สามารถใช้คอมพิวเตอร์ตั้งโต๊ะจากที่บ้าน ที่ทำงาน หรือใช้คอมพิวเตอร์โน้ตบุ๊ค หรือคอมพิวเตอร์พกพาขนาดเล็กอื่น ๆ ซึ่งคอมพิวเตอร์ดังกล่าว อาจเชื่อมต่อผ่าน Wi-Fi หรือ GPRS ก็ได้ อินเทอร์เฟส(Interface)

  39. ห้องสมุดจะให้บริการเนื้อหาในรูปของอิเล็กทรอนิกส์ เช่น หนังสืออิเล็กทรอนิกส์ (e-book) วารสารอิเล็กทรอนิกส์ (e-Journal) เป็นต้น ในลักษณะมัลติมิเดีย ทั้งตัวอักษร ภาพ เสียง และภาพเคลื่อนไหว มิติของเนื้อหา (Content)

  40. ประเด็นที่ต้องพิจารณาด้านเนื้อหามีดังนี้ประเด็นที่ต้องพิจารณาด้านเนื้อหามีดังนี้ - การคัดสรรและการจัดหา ( Selection & Acquisition) - การสร้างดรรชนีและเมทาดาตา (Indexing & Metadata) - การบำรุงรักษาและการเก็บรักษา (Maintenance & Conservation) มิติของเนื้อหา (Content)(ต่อ)

  41. สำหรับหนังสือหรือเอกสารเก่า สามารถใช้วิธี scan เป็นภาพ โดยอาจมีการแปลงภาพให้กลายเป็นข้อความที่อ่านเข้าใจได้และให้สืบค้นได้ สำหรับสิ่งตีพิมพ์รุ่นใหม่ สามารถนำเข้าได้หลายวิธีเช่น การใช้แป้นพิมพ์ แสกนเนอร์ ไมโครโฟน กล้องดิจิตอลและเครื่องมืออื่นๆ การคัดสรรและการจัดหา

  42. จากผลของการจัดหาที่ได้มา นำมาสร้างดรรชนีและเมทาดาตา เพื่อประโยชน์ในการสืบค้นที่มีประสิทธิภาพและประสิทธิผลในแง่ของการสืบค้นได้อย่างรวดเร็ว ถูกต้องและครบถ้วน การสร้างดรรชนีและเมทาดาตา

  43. ข้อมูลที่จัดเก็บได้มีการเพิ่มขึ้นอย่างต่อเนื่องตลอดเวลา ดังนั้นการบำรุงรักษาและการเก็บรักษาจึงเกี่ยวข้องกับ - การปรับปรุงข้อมูลให้ทันสมัย - การควบคุมเวอร์ชันของข้อมูล เพื่อลดความสับสนในช่วงเวลาต่างๆ ที่มีการปรับปรุงให้ทันสมัย - การสำรองข้อมูล(Backup) เป็นประจำ เพื่อป้องกันการสูญเสียหรือถูกทำลาย - การจัดการเชื่อมโยงข้อมูล จากเนื้อหาหนึ่งไปสู่อีกเนื้อหาหนึ่งอย่างเป็นระบบ การบำรุงรักษาและการเก็บรักษา

  44. - การจัดการเชื่อมโยงข้อมูล จากเนื้อหาหนึ่งไปสู่อีกเนื้อหาหนึ่งอย่างเป็นระบบ - การรองรับการเก็บรักษาข้อมูลที่มีปริมาณเพิ่มขึ้นเรื่อยๆ จาก Giga-Byte(GB) เป็น Tera-Byte(TB) และเป็น Peta-Byte(PB) ในไม่ช้า การบำรุงรักษาและการเก็บรักษา(ต่อ)

  45. ห้องสมุดดิจิตอลให้บริการคนกับคอมพิวเตอร์มากกว่าคนกับคน กล่าวคือ เป็นการสืบค้นด้วยตัวผู้ใช้เองมากกว่าการพึ่งบรรณารักษ์ ดังนั้นการให้บริการจึงเป็นไปได้ตลอด 24/7 หรือตลอด 24 ชั่วโมงต่อวัน และ 7 วันต่อหนึ่งสัปดาห์ ทั้งปีไม่มีวันหยุด ผู้ใช้บริการต้องสามารถเข้าถึงได้โดยไม่มีข้อจำกัดของเวลา มิติของบริการ

  46. ค่าใช้จ่ายของห้องสมุดดิจิตอลเพื่อการให้บริการ ควรจะลดลงด้วยในแง่ของสถานที่ สาธารณูปโภค หนังสือ วารสาร สิ่งตีพิมพ์ บุคลากรที่ให้บริการ ในขณะเดียวกันบุคลากรบางส่วนอาจต้องเพิ่มขึ้น โดยเฉพาะผู้เชี่ยวชาญด้านคอมพิวเตอร์ เช่น เชี่ยวชาญด้านฐานข้อมูล การพัฒนาระบบ เป็นต้น มิติของบริการ(ต่อ)

  47. ห้องสมุดดิจิตอลทำให้เกิดการเปลี่ยนแปลงของการเรียนรู้และการทำกิจกรรมของประชาคมในผู้คนที่เข้ามาใช้ประโยชน์ กล่าวคือ เมื่อห้องสมุดดิจิตอลจัดเก็บ e-Book, e-Journal และอื่นๆ เสมือนเป็นคลังความรู้ ดังนั้นการเรียนรู้ผ่านทางห้องสมุดดิจิตอลจึงเกิดขึ้น กลุ่มคนที่สนใจและใฝ่หาความรู้จึงเข้าใช้งาน เกิดเป็นประชาคมแลกเปลี่ยนเรียนรู้ซึ่งกันและกัน มิติของประชาคม(Community)

  48. เมื่อเกิดประชาคมผู้ใช้ห้องสมุดดิจิตอล สิ่งหนึ่งที่ต้องทำให้ประชาคมมีความตะหนักมากขึ้นคือ เรื่องของลิขสิทธิ์ การละเมิดทรัพย์สิน เช่น การคัดลอกบทความจากหนังสือ วารสารต่างๆ นั้นทำได้ง่าย ไม่ยุ่งยากเหมือนในอดีต ดังนั้นจึงควรทำความเข้าใจเรื่องระเบียบว่าด้วยเรื่องของลิขสิทธิ์ สิทธิบัตร และสิทธิต่างๆ แก่ผู้ใช้บริการ เพื่อให้ยึดถือปฎิบัติเป็นหลักประกันพื้นฐานในประชาคมและสังคมต่อไป มิติของประชาคม(ต่อ)

  49. ทรัพยาการสารสนเทศในรูปแบบดิจิตอลที่น่าสนใจสำหรับห้องสมุดดิจิตอล ได้แก่ - หนังสืออิเล็กทรอนิกส์ (e-Book) - วารสารอิเล็กทรอนิกส์ (e-Journal) ทรัพยากรสารสนเทศในรูปแบบดิจิตอล

  50. ความแตกต่างของหนังสืออิเล็กทรอนิกส์กับหนังสือทั่วไปที่พิมพ์บนกระดาษ คือ - การสืบค้นทำได้ง่าย หนังสืออิเล็กทรอนิกส์(e-Book)

More Related