1 / 20

Data Warehousing :: Overview

Mata Kuliah :: Data Warehousing Komposisi oleh Budi Prayitno September 2012 Batam. Data Warehousing :: Overview. Data Warehouse. Data Warehouse, dalam konteks Teknologi Informasi, adalah basis data yang digunakan untuk pelaporan dan analisis data

eudora
Download Presentation

Data Warehousing :: Overview

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Mata Kuliah:: Data Warehousing Komposisioleh Budi Prayitno September 2012 Batam Data Warehousing :: Overview

  2. Data Warehouse Data Warehouse, dalam konteks Teknologi Informasi, adalah basis data yang digunakan untuk pelaporan dan analisis data Bahan dasar data yang digunakan untuk Data Warehouse berasal dari sistem operasional/transaksional

  3. E :: T :: L E T L merupakankependekandari Extract, Transform and Load Data Warehouse berbasis ETL memilikitigatahap/layerproses: • Staging Layer • Integration Layer • Access Layer

  4. Staging Layer Staging Layer menyimpan data mentah yang diekstraksi dari berbagai sistem database yang saling lepas

  5. Integration Layer Integration Layer mengitegrasikan berbagai set data yang saling lepas dengan mentransformasikannya dari Staging Layer dan menyimpannya pada Operational Data Store (ODS) Data yang sudah terintegrasi kemudian disimpan ke Data Warehouse dalam struktur hirarki yang disebut Dimension dan Fact Gabungan antara Dimension dan Facts dikenal dengan Star Schema

  6. Access Layer Access Layer adalah tahap dimana data dapat diambil oleh pengguna sesuai kebutuhan

  7. Kelebihan Penggunaanarsitektur data warehouse memberikankelebihan: • Disimpannyasalinaninformasidarisistemsumberakanmempertahankanhistory data • Penggabunganbeberapasistemsumber data memberikansudutpandangmenyeluruhterhadapperusahaan • Memperbaikikualitas data denganmenandaidanmemperbaiki data rusak • Secarakonsistenmenampilkaninformasiterkiniperusahaan • Merestrukturisasi data menjadiinformasi yang bergunabagipengguna • Merestrukturisasi data untukmempercepatperformaquery, terutamauntukqueryanalisis yang kompleks • Semuadilakukantanpamengganggusistemoperasional

  8. Sejarah Konsep Data Warehouse bermula pada akhir era 1980-an ketika peneliti IBM Barry Devlin dan Paul Murphy mengembangkan Business Data Warehouse

  9. Dimensional v.s. Normalized Terdapatduapendekatanumumdalampenyimpanan data di Data Warehouse: • Pendekatan Dimensional • Pendekatan Normalized

  10. Pendekatan Dimensional… Pendekatan Dimensional, yang praktisinya dikenal sebagai kaum Kimballites, menggunakan pendekatan Ralph Kimball yang menyebutkan bahwa model data warehouse harus menggunakan model dimensional/Star Schema

  11. Pendekatan Dimensional… Pada pendekatan Dimensional, data transaksi dibedakan menjadi Fact yang pada umumnya merupakan data numerik dan Dimension yang merupakan informasi yang memberi konteks terhadap Fact Sebagai contoh: data penjualan/Sales dapat dibedakan menjadi Fact seperti jumlah produk yang dijual dan harga produk, kemudian menjadi Dimension seperti tanggal penjualan, nama konsumen, kode produk, alamat tujuan, alamat tagihan serta nama wiraniaga yang menangani penjualan

  12. Pendekatan Dimensional… Kelebihanpendekatan Dimensional untukimplementasi Data Warehouse: • Data lebihmudahdimengertidandigunakanolehpengguna Pendekatan Dimensional lebihmudahdimengertikarenadibagimenjadi Fact/nilaidan Dimension/konteksterkaitprosesbisnispadasistemoperasional/transaksional • Pengambilan data dari data warehouse cenderunglebihcepat Database untuk data warehouse yang diimplementasikandenganpendekatan dimensional menggunakanstruktur OLAP yang memberikankelebihanperformauntuk data retrieval

  13. Pendekatan Dimensional… Kekuranganpendekatan Dimensional untukimplementasi Data Warehouse: • Untukmenjagaintegritas Fact dan Dimension, mengisi data dariberbagaisistemoperasional yang berbedasangatkompleks • Perubahanstruktur data warehouse, yang biasaterjadikarenaperubahanprosesbisnis, menjadisangatrumit

  14. Pendekatan Normalized… Pendekatan Normalized atau biasa disebut model 3NF, yang praktisinya disebut kaum Inmonites, mengikuti pendekatan yang dibuat oleh Bill Inmon yang menyatakan bahwa Data Warehouse harus dimodelkan dengan model E–R/model Normalized

  15. Pendekatan Normalized… • Pada pendekatan Normalized, data disimpan dalam data warehouse mengikuti aturan normalisasi • Tabel dikelompokkan ke dalam kategori tertentu, misal: konsumen, produk dan keuangan • Struktur yang ternormalisasi membagi data menjadi entitas yang menghasilkan tabel yang membentuk basis data relasional • Pada organisasi yang besar, pendekatan ini menghasilkan banyak sekali tabel yang saling terhubung melalui jaringan JOIN karena setiap entitas diimplementasikan menjadi tabel fisik

  16. Pendekatan Normalized… Kelebihanpendekatan Normalized dalamimplementasi Data Warehouse, antara lain: • Penambahandanperubahan data dapatdilakukankedalam basis data sepertisistemtransaksionalbiasa

  17. Pendekatan Normalized… Kekuranganpendekatan Normalized dalamimplementasi Data Warehouse, antara lain: • Jumlahtabelmenjadisangatbanyak • Sulitmelakukan JOIN terhadaptabel yang berasaldariberbagaisumberuntukmemperolehinformasi yang bermakna • Aksesinformasimemerlukanpemahamanmenyeluruhterhadap data warehouse

  18. Dimensional v.s. Normalized Persamaanantarapendekatan Dimensional danpendekatan Normalized adalahbahwakeduanyadapatdirepresentasikandalam Entity Relationship Diagram Perbedaanantarapendekatan Dimensional danpendekatan Normalized adalahtingkatnormalisasi yang digunakan Pendekatan Dimensional menghasilkanukuranfisik basis data yang relatiflebihbesardaripadapendekatan Normalized untukjumlah data yang sama

  19. Data Warehouse v.s. Sistem Operasional • Sistem operasional dibuat untuk menjaga integritas data serta performa dalam melakukan pencatatan transaksi bisnis, dengan memanfaatkan proses normalisasi dan penggunaan model E–R • Normalisasi pada sistem operasional dilakukan menggunakan aturan Codd, yang jika diimplementasikan secara lengkap hingga 5 level, akan menghasilkan lusinan bahkan ratusan tabel fisik • Sistem operasional memiliki performa sangat baik untuk data modification karena perubahan data hanya terkait dengan sebagian kecil data pada setiap tabel tersebut • Data pada sistem operasional mengalami siklus backup dan purge secara berkala

  20. Pemutakhiran Data Berdasarkankontekssiklusdantingkatpemutakhiran data, Data Warehouse dapatdibedakanmenjadi: • Offline Data Warehouse • Online Data Warehouse

More Related