1 / 29

Pertemuan II

Pertemuan II. Data Mart dan Metadata Data Warehouse. Cleansing Data . Adalah proses menghilangkan kesalahan-kesalahan data yang berasal dari proses transaksi Merupakan bagian dari proses integrasi

bary
Download Presentation

Pertemuan II

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Pertemuan II Data Mart dan Metadata Data Warehouse

  2. Cleansing Data • Adalahprosesmenghilangkankesalahan-kesalahan data yang berasaldariprosestransaksi • Merupakanbagiandariprosesintegrasi • Jikaproses cleansing inisalah, makainformasi yang dihasilkanoleh data warehouse jugaakansalah

  3. EkstraksiData

  4. Metode yang digunakanuntukmelakukanprosesekstrasisecara logic (logical exctraction) ada 2, yaitu : • Full Extraction, Prosesekstraksidilakukandenganmengambilseluruh data darisource system yang diperlukan • Increment ExtractionProsesekstraksihanyapada data yang berubahataubelumadapada target sistempadaperiodetertentu

  5. Mekanismeekstraksisecarafisik (physical extraction) dibagimenjadiduajenis, yaitu : • Online extractionData diekstrakdari source system ke target system secaralangsung. Prosesekstraksidilakukandengancaralangsungconnectkesource systemuntukmengaksessource table. • Offline Extraction Data tidakdiekstraksecaralangsungdarisource system, namunberadadiluarsource system. Data yang akandiekstraksudahmempunyaistruktur table danstruktur data yang diharapkansudahsesuaidengan data warehouse. Misalnyaflat file.

  6. Granularity • Adalahtingkatkedetailan data dalamsuatu data warehouse. Semakin detail data, makatingkatgranularity-nyaakansemakinrendahjuga. Level yang paling terendahdari granularity adalah data transaksi • Granularity merupakanisupentingdalam data warehouse, karena : • Semakinrendahlavel granularity, makajumlah data yang disimpandalam data warehouse jugaakansemakinbesar. • Semakinrendahlavel granularity, makatingkatkedetailan data jugaakansemakinbesardanberpengaruhpadapertanyaan yang akandijawab.

  7. Data Mart

  8. Perbedaan Data Mart dan Data Warehouse

  9. Dependent Data Mart (Inmon advocated) berlakusebagaikomponenatausuatubagiandari enterprise Data Warehouse, Data Mart dibangundengancara extract data dari Data Warehouse.

  10. Independent Data Mart (Kimball advocated) dibangundengancara extract langsung data dariberbagai Source System. Independent Data Mart tidaktergantungpadapusatpenyimpan data seperti Data Warehouse arsitekturinibiasajugadisebutsebagai “Data Warehouse Bus structure”.

  11. Keduaarsitektur data mart menentukanbagaimana data mart dibangun, dibedakanmenjadiduapendekatan, yakni.

  12. Keuntungandalammembangun Data Mart lebihduludibandinglangsungmembangun Data Warehouse: - Waktu yang diperlukanuntukmembangun Data Mart lebihsedikit.- Volume Data pada Data Mart lebihsedikit- Waktu Query lebihcepat- Biayamembangun Data Mart lebihmurah.

  13. Metadata

  14. Metadata memberikanfungsi yang samasepertikatalogyaitu:

  15. TigaJenisUtama Metadata • 1. Metadata strukturalmenunjukkanbagaimanakumpulanobyekdisusunsecarabersama-samamenjadisatu, semisalbagaimanahalaman-halamanditatauntukmembentuksuatubab. • 2. Metadata administratifmenyediakaninformasiuntukmembantumengelolasumberdaya, semisalterkaitkapandanbagaimanasuatuinformasidiciptakan, tipedokumendaninformasiteknislainnya, sertasiapa yang bisamengaksesnya. • 3. Metadata deskriptifmenggambarkansuatusumberdayadalammaksudsepertipenemuandanidentifikasi. Diabisameliputielemensemisaljudul, abstrak, pengarang, dankatakunci.

  16. Secarakonsep, metadata dikelompokkandalamtigakomponen. 1. KomponenDirektoriTeknikal, berisiinformasitentang data 2. KomponenDirektoriBisnis, berisiperspektifpenggunapada data 3. KomponenNavigasiInformasi, berisicaraaksespadadirektoribisnisdan data warehouse.

  17. KomponenDirektoriTeknikalmenjelaskankepadadata warehouse administratortentangsumber data danbagaimana data dikeloladalam data warehouse. DirektoriTeknikaljugamenjelaskanaturan-aturan (rules) yang digunakanuntukmembersihkan data danmentrasformasikannyauntukkepentinganbisnis.

  18. IsidariDirektoriTeknikal Data souce • Nama file dantipe file • Bagaimananilaididefinisikan data source • Kapan data dibuat • Data dating dari system mana • Siapapemlik data • Siapa yang memberikan data • User yang mana yang berhakmengakses data • Skema database operasional

  19. IsidariDirektoriTeknikal… Data Target • Namadantipe field • Bagaimananilididefinisikandalam data warehouse • Dimanadtaditempatkandalam data warehouse • Versi • Tanggal update terakhir • Frekwensi update terakhir • Siapapemilik data • Siapa yang dapatmengakses data • Skema data dalam data warehouse • Cara end-user melakukanakses data

  20. IsidariDirektoriTeknikal… Clean Up Rules • Record dan field yang akandibersihkan • Mapping antaraelemen data pada original data source dengan data warehouse • Rules yang digunakanuntukmengisinilaipada fields yang kosong • Rules untuk data integrity • Rules untukcekkonsistensi data

  21. IsidariDirektoriTeknikal… Transformation Rules • Bagaimanamenentukanwaktudalammelakukantransformasi • Algoritma (business rules) untukmenentukannilai yang diambil (nilaiasal) • Bagaimanaringkasan data dibuat

  22. IsidariDirektoriTeknikal… Mapping • Rules untukmelakukan filter data danuntukmelakukanpenggabungan data dari field atausumber data yang berbeda.

  23. KomponenDirektoriBisnis. Berorientasipadamekanisme data warehouse, yang meliputi : • Istilahbisnis (business term) yang digunakanuntukmendeskripsikan data • Namateknis (alias) yang berhubungandengan business term yang dapatdigunakanuntukmengakses data • Data Sousedanrules yang digunakanuntukmendapatkan data dantanggaldimana data tersebutdibuat • Catatantetangreportdanquery yang ada • Informasitentangkeamanan data (siapa yang mempunyahakakses)

  24. KomponenNavigasiInformasi Menjelaskan interface yang memungkinkan user untukmengaksesdirektoribisnisdan data warehouse. Denganmenggunakankompunenini, user dapatmelakukan : • Melakukanaksesdan drill down pada data warehouse • Melakukan query ke data warehouse • Meminta data barudari warehouse administrator • Melakukan transfer data dari warehouse kedatamartatau user lain

More Related