1 / 29

مدیریت اطلاعات و داده های سازمان یافته

مدیریت اطلاعات و داده های سازمان یافته. بخش سوم کتاب توربان. مبانی مرتب سازی و دستیابی داده ها. سلسله مراتب داده ها: یک بیت، کوچکترین واحد داده قابل پردازش در کامپیوتر؛ یک بایت، یک کاراکتر ساده را معرفی می کند.

nerea-hale
Download Presentation

مدیریت اطلاعات و داده های سازمان یافته

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. مدیریت اطلاعات و داده های سازمان یافته بخش سوم کتاب توربان

  2. مبانی مرتب سازی و دستیابی داده ها • سلسله مراتب داده ها: یک بیت، کوچکترین واحد داده قابل پردازش در کامپیوتر؛ یک بایت، یک کاراکتر ساده را معرفی می کند. • فیلد: یک ترکیب منطقی از کاراکتر ها در یک کلمه، یک گروه کوچک از کلمه ها، یا یک عدد. • رکورد: یک ترکیب منطقی از فیلد های مرتبط به هم. • فایل: یک ترکیب منطقی از از رکورد های مرتبط به هم. • پایگاه داده: ترکیب منطقی از فایل های مرتبط به هم.

  3. موجودیت: یک شخص، مکان، شی، یا یک رویداد در ارتباط با اطلاعاتی که در یک رکورد نگهداری می شود. • صفت: هر ویژگی یا کیفیتی که یک مشخصه را توصیف می کند. • کلید اولیه: یک فیلد شناسه که به تنهایی یک رکورد را مشخص می کند. • کلید ثانویه: یک فیلد شناسه که بعضی از اطلاعات شناسایی را دارد، اما نوعا یک فایل را با دقت کامل شناسایی نمی کند.

  4. محیط فایلی سنتی • یک فایل داده ای، مجموعه ای از رکورد های منطقا مرتبط به هم می باشد. در محیط سنتی مدیریت فایل ها هر کاربرد(application) یک فایل داده مرتبط به آن دارد که شامل رکورد های داده های مورد نیاز آن کاربرد است.

  5. مشکلات مشی فایلینگ • Data redundancy • Data inconsistency • Data isolation • Data security • Data integrity • Application/data independence • افزونگی داده • ناسازگاری داده • جدایی داده ها • امنیت داده ها • یکپارچگی داده ها • استقلال کاربرد/داده

  6. پایگاه داده: مشی مدرن یا پایگاهی • گروه منطقی از فایل های مرتبط به هم که داده ها و وابستگی های بین آن ها را در خود ذخیره می کنند.

  7. ساختن یک پایگاه داده • برای ساختن یک پایگاه داده طراحان باید یک طراحی مفهومی و یک طراحی فیزیکی انجام دهند. • طراحی مفهومی: یک مدل انتزاعی از پایگاه داده از دید کاربر • طراحی فیزیکی: یک طرح بندی که نشان می دهد داده ها چگونه در حافظه مرتب می شوند.

  8. مدلسازی موجودیت ـ رابطه: فرایند طراحی یک پایگاه داده به وسیله سازماندهی موجودیت داده های مورد استفاده و شناسایی رابطه ای که با هم دارند. • نمودار موجودیت ـ رابطه: نموداری که موجودیت داده ها، صفت ها و رابطه بین آن ها را نشان می دهد. • کلاس های موجودیتی: گروهی از موجودیت های یک نوع داده مشخص. • نمونه: یک موجودیت مشخص از یک نوع موجودیت

  9. شناسه: یک صفت که یک نمونه موجودیت را شناسایی می کند. • رابطه ها: اتصال های مفهومی موجودیت ها در یک پایگاه داده. • تعداد موجودیت هایی که در یک رابطه هستند، درجه آن رابطه نامیده می شود. رابطه بین دو آیتم رایجتر است و اصطلاحا رابطه دوگانی نامیده می شود.

  10. سه نوع رابطه دوگانی: • 1:1 : ارتیاط یک نمونه از یک نوع موجودیت با یک نمونه از نوع موجودیت دیگر • 1:M : ارتباط یک نمونه از یک نوع موجودیت با چند نمونه از نوع موجودیت دیگر • M:N : ارتباط یک نمونه از یک نوع موجودیت با چند نمونه از نوع موجودیت دیگر و برعکس.

  11. نمودار موجودیت ـ رابطه (ERD)

  12. نرمال سازی: یک روش برای تحلیل و بهبود یک پایگاه داده رابطه ای به شکلی ساده و موثر تر به منظور کاستن افزونگی، افزایش یکپارچگی داده ها، و بهبود کارایی پردازشی.

  13. رابطه نرمال سازی نشده

  14. نرمال سازی شده

  15. سیستم های مدیریت پایگاه داده • DBMS: یک برنامه نرم افزاری (یا گروهی از برنامه ها) که دسترسی به پایگاه داده را برای کاربر فراهم می کند.

  16. دیدگاه فیزیکی و دیدگاه منطقی • دیدگاه فیزیکی: طرحی برای آرایش واقعی و فیزیکی و مکان داده ها در DASDهای (حافظه های با دسترسی مستقیم) سیستم مدیریت داده. • دیدگاه منطقی: دید کاربر نسیت به داده ها و برنامه های نرم افزاری که آن داده ها را در سیستم مدیریت داده پردازش می کنند.

  17. مولفه های یک DBMS • مدل داده: تعریف راهی برای اینکه چگونه یک داده در DBMS ساختاردهی می شود.(به صورت مفهومی) • زبان تعریف داده ها(DDL): مجموعه ای از دستور ها که ساختار پایگاه داده را توصیف می کند(انواع رکورد ها و مجموعه داده ها) • شِما(Schema): توصیف منطقی از همه پایگاه داده و لیست همه داده ها و رابطه بین آن ها. • زیرشِما(Subschema): مجموعه مشخصی از داده های پایگاه داده که مورد نیاز هر کاربرد (application) هستند.

  18. زبان تغییر داده ها (Data Manipulation Language): دستورالعمل هایی که از زبان های سطح بالا بهره می برد تا محتوای پایگاه داده را جستجو کند، اطلاعات را ذخیره یا بهنگام کند و کاربردهای پایگاه داده را توسعه دهد. • زبان جستجوی ساخت یافته (SQL(Structured querylanguage)): زبان عمومی پایگاه داده رابطه ای که کاربران را قادر به انجام جستجو های پیچیده با دستورالعمل های نسبتا ساده، می سازد.

  19. جستجو با مثال(QBE): زبان پایگاه داده که کاربر را قادر می سازد تا با پر کردن یک فرم، یک نمونه یا توصیفی از داده مورد نظر را بسازد. • مجموعه واژگان داده ها(Data dictionary collection): تعریف عناصر داده ها، ویژگی های داده هایی که عناصر داده ها استفاده می کند و افراد، توابع کاری، کاربرد ها و گزارشاتی که این عنصر داده ها را استفاده می کنند.

  20. مدل های منطقی داده • سه مدل رایج: سلسله مراتبی، شبکه ای و رابطه ای بقیه مدل ها مثل چند بعدی، شی ـ رابطه ای(object-relational)، ابررسانه ای (hypermedia)،نهفته(embedded) و مجازی • DBMSهای سلسله مراتبی و شبکه ای: معمولا داده های مرتبط به هم را از طریق لینک لیست به هم وصل می کنند. • DBMSهای چندبعدی و رابطه ای: داده ها را با توجه به اطلاعاتی که از آن داده ها به دست می آید به هم مرتبط می کنند.

  21. مدل سلسله مراتبی DB • داده ها را در یک درخت ساختاردهی می کند که در آن هر رکورد شامل دو عنصر، یک ریشه که اصطلاحاً کلید نامیده می شود و یک عدد متغیر از میدان های تابعه، می باشد. • بهترین مزیت این مدل سرعت و کارایی آن برای جستجو در داده ها می باشد. • ایراد ها: دسترسی به داده ها از پیش تعریف شده است.(بوسیله مدیر پایگاه داده قبل از نوشتن برنامه هایی که به داده باید دسترسی داشته باشند). برنامه نویس ها باید از سلسله مراتب ساختار داده ها تبعیت کنند.

  22. مدل سلسله مراتبی DB

  23. مدل شبکه ای پایگاه داده • مدل داده ای که رابطه بین داده ها را به گونه ای برقرار می کند که رکورد های تابعه می توانند با بیش از یک عنصر داده رابطه داشته باشند.

  24. مدل رابطه ای پایگاه داده • مدلی بر پایه یک مفهوم ساده به نام جدول، به منظور تمرکز بر روی ویژگی های سطر ها و ستون های داده ها. • رابطه ها: جدول های سطرها و ستون های استفاده شده در DB رابطه ای • چند تایی(Tuple): یک سطر داده در مدل رابطه ای • صفت: یک ستون داده در مدل رابطه ای

  25. سه عمل اصلی در پایگاه داده رابطه ای • Select: ایجاد یک زیرمجموعه شامل همه رکوردهای فایل با یک معیار خاص. • Join: ترکیب جدول های رابطه ای • Project: ایجاد یک زیرمجموعه از ستون های یک جدول، به کاربر اجازه ی جدول های جدید شامل اطلاعات مورد نیاز می دهد.

  26. مزایا و معایب مدل ها ی منطقی داده ها

  27. مدل های دیگر • مدل داده ای شی ـ رابطه ای(ORDB): یک مدل داده که توانایی ذخیره سازی شی(object) را به پایگاه داده رابطه ای اضافه می کند. • مدل ابررسانه ای(Hypermedia): مدل داده ای که بخش های بزرگاطلاعات (chunk) را در گره هایی ذخیره می کند که می تواند شامل داده هایی از گونه های مختلف باشند؛ و کاربر می تواند به داده مربوطه از هر نوع رابطه ای پرش کند.

  28. مدل های خاص • پایگاه داده اطلاعات جغرافیایی(Geographical information database): مدل داده ای شامل داده های مکانی برای قرار دادن روی نقشه ها و تصاویر. • پایگاه داده دانشی: مدل داده ای شانل قواعد تصمیم گیری که می تواند برای تصمیم گیری های خبره استفاده شود.

  29. Small-footprint database: زیرمجموعه ای از یک DB بزرگتر برای کارکنان یک میدان خاص. • پایگاه داده نهفته (Embedded database): پایگاه داده ای که در دستگاه ها و یا کاربردها ساخته می شوند. طراحی شده برای اینکه مستقل باشند و نیاز خیلی کمی به مدیریت دارند. • پایگاه داده مجازی: یک پایگاه داده که فقط شامل نرم افزار است و داده ها را که از نظر فیزیکی، در هر جایی روی شبکه و از هر نوعی که باشند، مدیریت می کند.

More Related