1 / 50

VẤN ĐỀ TÍCH HỢP DỮ LIỆU VÀO KHO DỮ LIỆU: KHẢO SÁT LÍ THUYẾT VÀ XÂY DỰNG ỨNG DỤNG

VẤN ĐỀ TÍCH HỢP DỮ LIỆU VÀO KHO DỮ LIỆU: KHẢO SÁT LÍ THUYẾT VÀ XÂY DỰNG ỨNG DỤNG. Thực hiện : Nguyễn Minh Hùng – 0712012 Lê Văn Huy – 0712192 GVHD: PGS.TS. Đồng Thi ̣ Bích Thủy. Nội dung. Giới thiệu đê ̀ tài Chuẩn bị dư ̃ liệu

luisa
Download Presentation

VẤN ĐỀ TÍCH HỢP DỮ LIỆU VÀO KHO DỮ LIỆU: KHẢO SÁT LÍ THUYẾT VÀ XÂY DỰNG ỨNG DỤNG

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. VẤN ĐỀ TÍCH HỢP DỮ LIỆU VÀO KHO DỮ LIỆU: KHẢO SÁT LÍ THUYẾT VÀ XÂY DỰNG ỨNG DỤNG Thựchiện: Nguyễn Minh Hùng – 0712012 LêVănHuy – 0712192 GVHD: PGS.TS. ĐồngThị BíchThủy

  2. Nội dung • Giớithiệuđề tài • Chuẩn bị dữ liệu • Công cụ Pentaho Data Integration (Kettle) • Ứngdụngthử nghiệm • Kếtluận

  3. 1. Giớithiệu

  4. 1.1. Nhucầuvề tíchhợpdữ liệu

  5. 1.1. Nhucầuvề tíchhợpdữ liệu (tt)

  6. 1.2. Mụctiêu, đốitượng, phạm vi

  7. 2. Chuẩn bị dữ liệu

  8. 2.1. Khodữ liệu • Cácđặcđiểmcủakhodữ liệu

  9. 2.2. Kiếntrúckhodữ liệu • Kiếntrúc DDS đơn

  10. 2.2. Kiếntrúckhodữ liệu (tt) • Kiếntrúc NDS + DDS

  11. 2.2. Kiếntrúckhodữ liệu (tt) • Kiếntrúc ODS + DDS

  12. 2.3. Môhìnhhóađachiều • So sánhkhodữ liệuvới CSDL tácnghiệp

  13. 2.3. Môhìnhhóađachiều (tt) • Lượcđồ hìnhsao

  14. 2.4. Cáckháiniệmliênquanđếnkhodữ liệu • Cáckháiniệmliênquanđếnkhodữ liệu • Chiềuthờigian • Chiềuthayđổichậm • Loại 1: Ghiđè • Loại 2: Thêmdòng • Loại 3: Thêmcột

  15. 2.4. Cáckháiniệmliênquanđếnkhodữ liệu (tt) • Cáckháiniệmliênquanđếnkhodữ liệu • Chiềuđa trị

  16. 2.4. Cáckháiniệmliênquanđếnkhodữ liệu (tt) • Cáckháiniệmliênquanđếnkhodữ liệu • Chiềuđệ quy

  17. 2.5. Tíchhợpdữ liệu • Quytrìnhtíchhợpdữ liệu • Rúttrích • Biếnđổi • Nạp

  18. 2.6. Rúttríchdữ liệu • Nắmbắtthayđổitrêndữ liệunguồn • Xử lí dữ liệuđầuvào (staging)

  19. 2.7. Biếnđổidữ liệu • Kiểmtratínhhợplệ • Làmsạchdữ liệu • Giảinghĩavà ánhxạ dữ liệu • Tạovà quảnlý khóa • Tổnghợpdữ liệu

  20. 2.8. Nạpdữ liệu • Nạpvà duy trì cácchiều • Nạpdữ kiện

  21. 3. Công cụPentaho Data integration (Kettle)

  22. 3.1. Pentaho BI Suite

  23. 3.2. Pentaho data integration (Kettle)

  24. 3.3. Môhìnhhệ thống Kettle

  25. 3.4. Cácthànhphầncủa Kettle • Giaodiệnpháttriểnđồ họa (Spoon)

  26. 3.4. Cácthànhphầncủa Kettle (tt) • Bộ lậplịch (Quartz)

  27. 3.4. Cácthànhphầncủa Kettle (tt) • Công cụ dònglệnh (Pan/Kitchen)

  28. 3.5. Tíchhợpdữ liệuvới Kettle • Rúttrích (extraction) • Vậnchuyển (transportation) • Biếnđổi (transformation) • Nạp (load)

  29. 4. Ứngdụngthử nghiệm

  30. 4.1. Cácyêucầucủaứngdụng • Yêucầuphântíchtrêndữ liệu • Yêucầuhệ thống • Cácnghiệp vụ liênquan

  31. 4.2. Môhìnhkiếntrúccủaứngdụng

  32. 4.3. Thiếtkế dữ liệu – Vùngxử lí • Vùngxử lí dànhchodữ liệunguồn là CSDL

  33. 4.3. Thiếtkế dữ liệu – Vùngxử lí (tt) • Vùngxử lí dànhchodữ liệunguồn là tập tin

  34. 4.4. Thiếtkế dữ liệu - CSDL chuẩnhóa

  35. 4.5. Thiếtkế dữ liệu – CSDL củakho

  36. 4.6. Xâydựngquytrìnhtíchhợpdữ liệu

  37. 4.7. Nắmbắtthayđổitrêndữ liệu So sánhkhácbiệt Dựatrênthờigian

  38. 4.7. Xử lí sausự cố • Cácsự cố khiến quá trìnhnạp bị giánđoạn: • Trongkhinạptừ nguồnvàovùngxử lí • Trongkhinạptừ vùngxử lí vào CSDL chuẩnhóa • Trongkhinạptừ CSDL chuẩnhóavào CSDL kho

  39. 4.8. Xử lí xungđộtvớicácnguồndữ liệucùngcấutrúc

  40. 4.9. Biếnđổitrêndữ liệu • Kiểmtratínhhợplệ • Làmsạch • Tổnghợpdữ kiện

  41. 4.10. Nạpchiều • Cácchiềuliênquanđếnthờigian • Cácchiềuthayđổichậm

  42. 4.10. Nạpchiều (tt) • Nạpchiềuđa trị • Nạpchiềuđệ quy

  43. 4.11. Nạpdữ kiện

  44. 5. Xâydựngứngdụngthử nghiệm

  45. 5.1. Môhìnhứngdụng

  46. 5.2. Cácchứcnăng • Cấu hình • Ghi log • Lập lịch • Chạy tay(manual)

  47. 5.3. Demo ứngdụngthử nghiệm

  48. 6. Kếtluận

  49. 6. Kếtluận • Cáckết quả đạtđược • Nhữngvấnđề còntồntại • Hướngpháttriển

More Related