html5-img
1 / 21

ويژگيهاي پايگاههاي داده اي Native XML

ويژگيهاي پايگاههاي داده اي Native XML. مرضيه حسيني نسب ـ تهمينه صنم راد تحقيق دوم درس پايگاه داده پيشرفته دانشکده مهندسي برق و کامپيوتر دانشگاه تهران. ويژگيهاي پايگاههاي داده اي Native XML. ذخيره سازي مستندات XML و مدل هاي داده اي انديس زبان پرس و جو مديريت تراكنشها.

vanig
Download Presentation

ويژگيهاي پايگاههاي داده اي Native XML

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ويژگيهاي پايگاههاي داده ايNative XML مرضيه حسيني نسب ـ تهمينه صنم راد تحقيق دوم درس پايگاه داده پيشرفته دانشکده مهندسي برق و کامپيوتر دانشگاه تهران

  2. ويژگيهاي پايگاههاي داده اي Native XML • ذخيره سازي مستندات XML و مدل هاي داده اي • انديس • زبان پرس و جو • مديريت تراكنشها

  3. ذخيره سازي مستندات XML و مدل هاي داده اي • پايگاههاي داده اي ويژه XML مبتني بر متن • استفاده از شناسه واحد براي آدرس دهي مستندات • پارس اوليه براي ساخت انديس به منظور افزايش سرعت جستجو • پايگاههاي داده اي ويژه XML مبتني بر مدل • Berkeley DB XML • Natix

  4. ذخيره سازي مستندات XML و مدل هاي داده اي • Berkeley DB XML • روش ذخيره سازي ريزدانه • استفاده از B-Tree • فوايد : • قابليت ارجاع به يك عنصر يا شيئ ديگر درون يك مستند، به صورت مستقيم • قابليت پرس و جوي كارا، بدون نياز به پارس كل مستند • قابليت تغيير يك قطعه كوچك از يك مستند بزرگ [Feinberg, 2005]

  5. ذخيره سازي مستندات XML و مدل هاي داده اي • Natix • ذخيره زيردرختان مستندXML اصلي در ركوردها(ي فيزيكي) براساس دسته بندي • حفظ ساختار داخلي زيردرختان به همان شكل اصلي • دسته بندي نيازمنديهاي برنامه هاي كاربردي خاص (با توجه به نياز) و با استفاده از يك ماتريس شكاف (Split Matrix)[Fiebig, 2002]

  6. ذخيره سازي مستندات XML و مدل هاي داده اي • Natix(ادامه) • مدل داده منطقي :

  7. ذخيره سازي مستندات XML و مدل هاي داده اي • Natix(ادامه) • مدل داده فيزيکي : • رکورد : دنباله اي از بايتها حداکثر به اندازه يک صفحه از حافظه • ذخيره هر زيردرخت در يک رکورد • انواع گره ها : • گره هاي تجمعي (Aggregate Nodes) • گره هاي حرفي (Literal Nodes) • گره هاي واسط (Proxy Nodes) [Fiebig, 2002]

  8. ذخيره سازي مستندات XML و مدل هاي داده اي • Natix(ادامه)

  9. انديس • نوع انديس • ساختاري • مقداري • تمام متن • محدوده انديس • هدف انديس • كنترل انديس

  10. انديس • انديس درTamino • انديس استاندارد : نوعي انديس مقداري • انديس متني : نوعي انديس تمام متن • انديس ساختاري : • انديس ساختاري فشرده : براي رديابي اطلاعات مسيرها • انديس ساختاري كامل : قابليت دسترسي به اصل مستندات واقع در مسير (علاوه بر امکان فوق) [Chaudhri, 2003]

  11. انديس • انديس در Natix • انديس تمام متن • انديس XASR : • حفظ روابط پدر/ فرزندي و تقدم/ تأخر • برچسب گذاري درخت مستند براساس پيمايش عمق اول • dmin (هنگام اولين ورود به گره) و dmax (هنگام آخرين خروج از گره) • جدول XASR : ذخيره اطلاعات dmin، dmax، برچسب عنصر، شناسه مستند و مقدار dmin پدر براي هر گره در يک سطر • تبديل پرس و جو به جستجو در اين جدول و عمليات پيوند برروي سطرها [Fiebig, 2002]

  12. زبان پرس و جو • XPath • XSLT • XQuery • پرس و جو در Timber • پرس و جو در Natix • پرس و جو در Tamino

  13. زبان پرس و جو • پرس و جو در Timber • استفاده از جبر رابطه اي TAX : • شامل كليه عمليات جبر رابطه اي مانند Selection، Projection، Join، Ordering، Grouping و ... • استفاده از XPath براي جستجو در ميان درختان [Jagadish , 2002]

  14. زبان پرس و جو • پرس و جو در Natix • استفاده از XQuery • موتور اجراي پرس و جوي Natix (NQE) • جبر فيزيكي Natix (NPA) • ماشين مجازي Natix (NVM) [Fiebig, 2002]

  15. زبان پرس و جو • پرس و جو در Natix(ادامه)

  16. زبان پرس و جو • پرس و جو در Tamino • استفاده از XPath • عملگر رابطه اي جديد ~= (Contains Operator) : براي جستجوي تمام متن • امکان افزودن توابع تعريف شده توسط كاربر به زبان پرس و جو [Chaudhri, 2003]

  17. مديريت تراكنش • مديريت تراكنش در Natix • بازيابي از شكست با پروتكل تطبيق يافته ARIES [Fiebig, 2002]

  18. مؤلفه هاي بازيابي از شكست در Natix • Log Records: ركوردهاي ثبت وقايع خواندن و نوشتن تراكنشها • Segments: قطعات حافظه واسط ميان برنامه هاي كاربردي و حافظه ماندگار(ثانويه) • Page Interpreters: مسؤول ثبت وقايع و بازيابي از شكست در سطح صفحات • Buffer Manager: مسؤول كنترل انتقال صفحات ميان حافظه اصلي و ثانويه • Recovery Manager: هماهنگ كننده فعاليت سيستم در طول فرايند undo، redo و checkpointing • Log Manager: فراهم كننده تسهيلات لازم براي عمليات خواندن و نوشتن در log و هماهنگ كننده دسترسي چندين ريسمان اجرايي به طور همزمان به log • Transaction Manager : نگهدارنده ساختارهاي داده تراكنشهاي فعال

  19. همگام سازي تراكنشها در Natix • استفاده از روش قفل گذاري S2PL

  20. منابع [Fiebig, 2002]: Thorsten Fiebig, et al, "Anatomy of a native XML base management system", The VLDB Journal, Volume 11, Issue 4, Dec 2002, pp. 292-314. [Feinberg, 2005]: George Feinberg, "Native XML Data Storage and Retrieval", Linux Journal, Volume 2005, Issue 137, Sep 2005, pp. 7-9. [Salminen, 2001]: Airi Salminen, Frank Wm. Tompa, "Requirements for XML Document Database Systems", Proceedings of the 2001 ACM Symposium on Document Engineering, USA, 2001. [Jagadish , 2002]: H. V. Jagadish, et al, "TIMBER: A native XML database", The VLDB Journal, Volume 11 , Issue 4, Dec 2002, pp. 274-291. [Chaudhri, 2003]: Akmal B. Chaudhri, et al, "XML Data Management: Native XML and XML-Enabled Database Systems", Addison Wesley, First Edition, Chapter 2, 2003. [Bourret, 2005]: Ronald Bourret, "XML and Databases", www.rpbourret.com/xml/XMLAndDatabases.htm, Spring 2005.

  21. ويژگيهاي پايگاههاي داده اي Native XML با تشكر از توجه شما

More Related