ويژگيهاي پايگاههاي داده اي Native XML

ويژگيهاي پايگاههاي داده ايNative XML مرضيه حسيني نسب ـ تهمينه صنم راد تحقيق دوم درس پايگاه داده پيشرفته دانشکده مهندسي برق و کامپيوتر دانشگاه تهران

ويژگيهاي پايگاههاي داده اي Native XML • ذخيره سازي مستندات XML و مدل هاي داده اي • انديس • زبان پرس و جو • مديريت تراكنشها

ذخيره سازي مستندات XML و مدل هاي داده اي • پايگاههاي داده اي ويژه XML مبتني بر متن • استفاده از شناسه واحد براي آدرس دهي مستندات • پارس اوليه براي ساخت انديس به منظور افزايش سرعت جستجو • پايگاههاي داده اي ويژه XML مبتني بر مدل • Berkeley DB XML • Natix

ذخيره سازي مستندات XML و مدل هاي داده اي • Berkeley DB XML • روش ذخيره سازي ريزدانه • استفاده از B-Tree • فوايد : • قابليت ارجاع به يك عنصر يا شيئ ديگر درون يك مستند، به صورت مستقيم • قابليت پرس و جوي كارا، بدون نياز به پارس كل مستند • قابليت تغيير يك قطعه كوچك از يك مستند بزرگ [Feinberg, 2005]

ذخيره سازي مستندات XML و مدل هاي داده اي • Natix • ذخيره زيردرختان مستندXML اصلي در ركوردها(ي فيزيكي) براساس دسته بندي • حفظ ساختار داخلي زيردرختان به همان شكل اصلي • دسته بندي نيازمنديهاي برنامه هاي كاربردي خاص (با توجه به نياز) و با استفاده از يك ماتريس شكاف (Split Matrix)[Fiebig, 2002]

ذخيره سازي مستندات XML و مدل هاي داده اي • Natix(ادامه) • مدل داده منطقي :

ذخيره سازي مستندات XML و مدل هاي داده اي • Natix(ادامه) • مدل داده فيزيکي : • رکورد : دنباله اي از بايتها حداکثر به اندازه يک صفحه از حافظه • ذخيره هر زيردرخت در يک رکورد • انواع گره ها : • گره هاي تجمعي (Aggregate Nodes) • گره هاي حرفي (Literal Nodes) • گره هاي واسط (Proxy Nodes) [Fiebig, 2002]

ذخيره سازي مستندات XML و مدل هاي داده اي • Natix(ادامه)

انديس • نوع انديس • ساختاري • مقداري • تمام متن • محدوده انديس • هدف انديس • كنترل انديس

انديس • انديس درTamino • انديس استاندارد : نوعي انديس مقداري • انديس متني : نوعي انديس تمام متن • انديس ساختاري : • انديس ساختاري فشرده : براي رديابي اطلاعات مسيرها • انديس ساختاري كامل : قابليت دسترسي به اصل مستندات واقع در مسير (علاوه بر امکان فوق) [Chaudhri, 2003]

انديس • انديس در Natix • انديس تمام متن • انديس XASR : • حفظ روابط پدر/ فرزندي و تقدم/ تأخر • برچسب گذاري درخت مستند براساس پيمايش عمق اول • dmin (هنگام اولين ورود به گره) و dmax (هنگام آخرين خروج از گره) • جدول XASR : ذخيره اطلاعات dmin، dmax، برچسب عنصر، شناسه مستند و مقدار dmin پدر براي هر گره در يک سطر • تبديل پرس و جو به جستجو در اين جدول و عمليات پيوند برروي سطرها [Fiebig, 2002]

زبان پرس و جو • XPath • XSLT • XQuery • پرس و جو در Timber • پرس و جو در Natix • پرس و جو در Tamino

زبان پرس و جو • پرس و جو در Timber • استفاده از جبر رابطه اي TAX : • شامل كليه عمليات جبر رابطه اي مانند Selection، Projection، Join، Ordering، Grouping و ... • استفاده از XPath براي جستجو در ميان درختان [Jagadish , 2002]

زبان پرس و جو • پرس و جو در Natix • استفاده از XQuery • موتور اجراي پرس و جوي Natix (NQE) • جبر فيزيكي Natix (NPA) • ماشين مجازي Natix (NVM) [Fiebig, 2002]

زبان پرس و جو • پرس و جو در Natix(ادامه)

زبان پرس و جو • پرس و جو در Tamino • استفاده از XPath • عملگر رابطه اي جديد ~= (Contains Operator) : براي جستجوي تمام متن • امکان افزودن توابع تعريف شده توسط كاربر به زبان پرس و جو [Chaudhri, 2003]

مديريت تراكنش • مديريت تراكنش در Natix • بازيابي از شكست با پروتكل تطبيق يافته ARIES [Fiebig, 2002]

مؤلفه هاي بازيابي از شكست در Natix • Log Records: ركوردهاي ثبت وقايع خواندن و نوشتن تراكنشها • Segments: قطعات حافظه واسط ميان برنامه هاي كاربردي و حافظه ماندگار(ثانويه) • Page Interpreters: مسؤول ثبت وقايع و بازيابي از شكست در سطح صفحات • Buffer Manager: مسؤول كنترل انتقال صفحات ميان حافظه اصلي و ثانويه • Recovery Manager: هماهنگ كننده فعاليت سيستم در طول فرايند undo، redo و checkpointing • Log Manager: فراهم كننده تسهيلات لازم براي عمليات خواندن و نوشتن در log و هماهنگ كننده دسترسي چندين ريسمان اجرايي به طور همزمان به log • Transaction Manager : نگهدارنده ساختارهاي داده تراكنشهاي فعال

همگام سازي تراكنشها در Natix • استفاده از روش قفل گذاري S2PL

منابع [Fiebig, 2002]: Thorsten Fiebig, et al, "Anatomy of a native XML base management system", The VLDB Journal, Volume 11, Issue 4, Dec 2002, pp. 292-314. [Feinberg, 2005]: George Feinberg, "Native XML Data Storage and Retrieval", Linux Journal, Volume 2005, Issue 137, Sep 2005, pp. 7-9. [Salminen, 2001]: Airi Salminen, Frank Wm. Tompa, "Requirements for XML Document Database Systems", Proceedings of the 2001 ACM Symposium on Document Engineering, USA, 2001. [Jagadish , 2002]: H. V. Jagadish, et al, "TIMBER: A native XML database", The VLDB Journal, Volume 11 , Issue 4, Dec 2002, pp. 274-291. [Chaudhri, 2003]: Akmal B. Chaudhri, et al, "XML Data Management: Native XML and XML-Enabled Database Systems", Addison Wesley, First Edition, Chapter 2, 2003. [Bourret, 2005]: Ronald Bourret, "XML and Databases", www.rpbourret.com/xml/XMLAndDatabases.htm, Spring 2005.

ويژگيهاي پايگاههاي داده اي Native XML با تشكر از توجه شما

ويژگيهاي پايگاههاي داده اي Native XML