1 / 20

MODUL 2 DATA WAREHOUSE DAN DATA MINING

MODUL 2 DATA WAREHOUSE DAN DATA MINING. DICISION SUPPORT SYSTEM CLUSTERING METODOLOGI ANALISIS DATA. FUNGSI DATA WAREHOUSE BAGI DSS. Definisi Decision Support System

marsha
Download Presentation

MODUL 2 DATA WAREHOUSE DAN DATA MINING

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. MODUL 2DATA WAREHOUSE DAN DATA MINING DICISION SUPPORT SYSTEM CLUSTERING METODOLOGI ANALISIS DATA

  2. FUNGSI DATA WAREHOUSE BAGI DSS Definisi Decision Support System Istilahdaridecision support systemtelahdigunakandenganbanyakcara (Alter 1980) danmenerimabanyakdefinisi yang berbedamenurutpandangandari sang penulis (Druzdzeldan Flynn 1999). Finlay (1994) danlainnyamendefiniskan DSS kuranglebihsebagaisebuahsistemberbasiskomputer yang membantudalamprosespengambilankeputusan. Turban (1995) mendefinisikansecaralebihspesifikdengan, sesuatu yang interaktif, flexible dandapatmenyesuaikandiri(adaptable) darisisteminformasiberdasarkankomputer, khususnyapengembanganuntukmendukungpemecahanmasalahdari non-struktur management, untukmeningkatkanpengambilankeputusan. Denganmenggunakan data, mendukungantarmuka yang mudahdigunakandanmemberikanwawasanuntuk sang pengambilkeputusan. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  3. FUNGSI DATA WAREHOUSE BAGI DSS Definisi DSS menurutpandanganahli : Keen dan Scott Morton (1978), DSS adalahdukunganberdasarkankomputeruntukparapengambilkeputusan management yang berurusandenganmasalah semi-struktur. Sprague dan Carlson (1982), DSS adalahsistemberdasarkankomputerinteraktif yang membantuparapengambilkeputusanmenggunakan data dan model-model untukmemecahkanmasalah yang takterstruktur (unstructured problem). DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  4. FUNGSI DATA WAREHOUSE BAGI DSS Sebuah DSS (tergantungdengan yang disupport-nya) membutuhkan data warehouse agar dapatmenjalankankerjanyadenganbaik. Dan memang data warehouse sendiridibangununtukmemenuhikebutuhan DSS. Keberadaan data warehouse sangat penting sebagai tools dari DSS, karena data warehouse memang digunakan untuk itu. Dengan adanya data warehouse, diharapkan suatu perusahaan dapat lebih unggul dari kompetitornya dan lebih jeli lagi dalam melihat peluang pasar. Kesimpulan DSS yaitusistemkomputer yang bergunabagiparapengambilkeputusanuntukmemecahkanmasalahmereka, yang kuranglebihberhadapandenganmasalahunstructureatau semi-structure. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  5. KARAKTERISTIK DATA WAREHOUSE 1. Subject Oriented (Berorientasi subject) Data warehouse berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu. Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan (customers, products dan sales) dan tidak diorganisasikan pada area-area aplikasi utama(customer invoicing, stock control dan product sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  6. KARAKTERISTIK DATA WAREHOUSE Jadi, data yang disimpanadalahberorientasikepadasubjekbukanterhadapproses. Kita harusbisamembedakan data warehouse dan data operasional (database) Secaragarisbesarperbedaanantara data operasionaldan data warehouse yaitu : Data Operasional a. Dirancangberorientasihanyapadaaplikasidanfungsitertentu. b. Focusnyapadadesain database danproses. c. Berisirincianatau detail data. d. Relasiantar table berdasaraturanterkini (selalumengikuti rule(aturan) terbaru). DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  7. KARAKTERISTIK DATA WAREHOUSE • Data Warehouse • Dirancangberdasarpadasubjek-subjektertentu(utama). • Focusnyapadapemodelan data dandesain data. • Berisi data-data history yang akandipakaidalamprosesanalisis. • Banyakaturanbisnisdapattersajiantaratabel-tabel. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  8. KARAKTERISTIK DATA WAREHOUSE 2. Integrated (Terintegrasi) Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri. Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data. Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable yang memiliki maksud yang sama tetapi nama dan format nya berbeda. Variable tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  9. KARAKTERISTIK DATA WAREHOUSE • 3. Time-variant (RentangWaktu) • Seluruh data pada data warehouse dapatdikatakanakuratatau valid padarentangwaktutertentu. Untukmelihat interval waktu yang digunakandalammengukurkeakuratansuatu data warehouse, kitadapatmenggunakancaraantara lain : • Cara yang paling sederhanaadalahmenyajikan data warehouse padarentangwaktutertentu, misalnyaantara 5 sampai 10 tahunkedepan. • Cara yang kedua, denganmenggunakanvariasi/perbedaanwaktu yang disajikandalam data warehouse baik implicit maupun explicit secara explicit denganunsurwaktudalamhari, minggu, bulandsb. Secara implicit misalnyapadasaat data tersebutdiduplikasipadasetiapakhirbulan, atau per tigabulan. Unsurwaktuakantetapadasecaraimplisitdidalam data tersebut. • Cara yang ketiga,variasiwaktu yang disajikan data warehouse melaluiserangkaian snapshot yang panjang. Snapshot merupakantampilandarisebagian data tertentusesuaikeinginanpemakaidarikeseluruhan data yang adabersifat read-only. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  10. KARAKTERISTIK DATA WAREHOUSE • Non-Volatile ( tidakdi update real time ) • Karakteristikkeempatdari data warehouse adalah non-volatile maksudnya data pada data warehouse tidakdi-update secara real time tetapidi refresh darisistemoperasionalsecarareguler. Data yang baruselaluditambahkansebagaisuplemenbagi database itusendiridaripadasebagaisebuahperubahan. Database tersebutsecarakontinyumenyerap data baruini, kemudiansecara incremental disatukandengan data sebelumnya. • Berbedadengan database operasional yang dapatmelakukan update, insert dan delete terhadap data yang mengubahisidari database sedangkanpada data warehouse hanyaadaduakegiatanmemanipulasi data yaitu loading data (mengambil data) danakses data (mengakses data warehouse sepertimelakukan query ataumenampilanlaporan yang dibutuhkan, tidakadakegiatan updating data). DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  11. OLTP DAN OLAP DALAM DATA WAREHOUSE Sistem informasi adalah sekumpulan fungsi yang bekerja secara bersama-sama dalam mengelola, mengumpulkan, menyimpan, memproses serta mendistribusikan informasi untuk tujuan tertentu. Sistem OLTP ( Online Transactional Processing ) adalah merupakan metode pengolahan data terpadu yang menunjang kegiatan operasional sebuah organisasi. Untuk itu system OLTP yang baik harus ditunjang dengan fungsi sistem basis data ( Database Management System ) yang baik pula. OLAP (OnLine Analytical Processing) adalah jenis perangkat lunak yang digunakan untuk melakukan permintaan terhadap data dalam bentuk yang kompleks dan bersifat sementara serta sewaktu-waktu. OLAP memanipulasi dan menganalisis data bervolume besar dari berbagai perspektif (multidimensi). Oleh karena itu OLAP seringkali disebut analisis data multidimensi. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  12. OLTP DAN OLAP DALAM DATA WAREHOUSE Ciri-cirisistem OLTP yang baikadalah : Mendukungjumlahpengguna yang banyak yang seringmenambahdanmerubah data transaksi. Mengandung data dalamjumlahbesar, termasukdidalamnyavalidasi data transaksi. Memilikistruktur yang kompleksdanrumit. Diarahkansecaramaksimaluntukmelayaniaktivitastransaksiharian. Menyediakanteknologiinfrastruktur yang mendukungoperasionaltransaksi data dalamperusahaan DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  13. OLTP DAN OLAP DALAM DATA WAREHOUSE Beberapa fungsi OLAP a.l : Tujuan OLAP adalah menggunakan informasi dalam sebuah basis data (data warehouse) untuk memandu keputusan-keputusan yang strategic. Beberapa contoh permintaan yang ditangani oleh OLAP: • Menentukan Penjualan Maximum masing-2 kota • Menentukan 5 Penjualan sales tertinggi dalam 1 tahun • Menentukan total penjualan tertinggi pada setiap item produk. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  14. OLTP DAN OLAP DALAM DATA WAREHOUSE • SYSTEM KERJA OLAP • OLAP dapatdigunakanuntukmelakukankonsolidasi, drill-down, dan slicing and dicing. • 1. Konsolidasi • KonsolidasiadalahfungsiPengelompokan data. Sebagaicontoh : • kantor-kantorcabangdapatdikelompokkanmenurutkotaataubahkanpropinsi. • Transaksipenjualandapatditinjaumenuruttahun, triwulan, bulan, dansebagainya. Kadangkalaistilah rollup digunakanuntukmenyatakankonsolidasi  . DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  15. OLTP DAN OLAP DALAM DATA WAREHOUSE 2. Drill-down Drill-down adalah suatu bentuk yang merupakan kebalikan dari konsolidasi, yang memungkinkan data yang ringkas dijabarkan menjadi data yang lebih detail. Sebagai contoh : Mula-mula data yang tersaji didasarkan pada Semester pertama. Jika dikehendaki, data masing-masing bulan pada Semester pertama tersebut bisa diperoleh, sehingga akan tersaji data bulan Januari, Februari, Maret, April, Mei, Juni. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  16. OLTP DAN OLAP DALAM DATA WAREHOUSE 3. Slicing and dicing (pivoting) Untuk menjabarkan pada kemampuan untuk melihat data dari berbagai sudut pandang. Data dapat diiris-iris atau dipotong-potong berdasarkan kebutuhan. Sebagai contoh : Mencari data penjualan berdasarkan semua lokasi atau hanya pada lokasi-lokasi tertentu. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  17. TEKNIK CLUSTERING • TujuanPembelajaranTeknik Clustering adalah : • 1. Mengetahuitehnik cluster danidedasar clustering • 2. Mengetahuiukurankemiripandanketidakmiripan • 3. Mengenaltehnik cluster partisidanhirarki • Mengetahuiimplementasinyakedalamkasusnyata. • Tujuanutamatehnik cluster adalahuntukmengelompokkansejunlah data/objekkedalam cluster atau group sehinggadalamsetiap cluster terdapatsejumlah data yang miripsatusama lain. • Teknik cluster sudahbanyakdikenalpadapenggunaan data mining, tetapihinggasekarangparaahlimasihmencaritehnikdanmetodepengklusteran yang baikdanefektif. Sehinggasebenarnyasampaisekarangsistem cluster belummerupakanhasil yang optimal. Tetapihasildenganmetode yang akankitapelajariiniadalahmetode yang sudahcukupbagusdanpraktis. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  18. TEKNIK CLUSTERING • Diharapkannantinyamahasiswadapatmengembangkanmetode clustering yang baikatauadateknik yang lebih optimal. MetodeAnalisis data Mining dikelompokkandalam 2 tehnik : • Unsupervised learning • Prosespengelompokkan yang dikerjakantidakperludilakukanpembelajaran/training/pengujian data terlebihdahulu. jadimetodeinitidakmembutuhkan label darihasilkeluaran yang dihasilkan. • Misalnya : segalatehnik clustering data. • b. Supervised learning • Adalahmetode yang memerlukanpelatihan/training dan testing. Karenahasilkeluaran yang diharapkanharusmerupakankeluaranterbaik. Misalnya : ANN ( Artificial Neural Network ), AnalisisDiskriminan ( LDA ), Support Vector Machine ( SVM ) DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  19. CLUSTERING HIRARKI ( Hierarchical Clustering ) • Tehnik clustering hirarki, kitahitungjarak masing-2 titik / objekdenganobjeklainnya, selanjutnyaakanditemukanjaraktitik-titkterdekat, sehinggaakandkelompokkanobjekdenganjarakmasing-masingterdekat. • Langkah clustering hirarki : • Kelompokkanobjekkedalamclusternyasendiri. • Menemukan data denganpasangan paling miripuntukdikelompokkandalam cluster samadenganmelihat data dalammatrikkemiripan. • Gabungkankeduaobjekdalamsatukelompokdanlakukanselanjutnyadengan data yang lain sampaitinggalsatu cluster. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

  20. CLUSTERING HIRARKI ( Hierarchical Clustering ) • Contohtehnik Clustering Hirarki : • SIMILARITY DAN DISIMILARITY ( KemiripandanKetidakmiripan) • Untukmenggabungduaobjekdalam cluster dibutuhkankonsepmirip () dantidakmirip ( disimilarity ), jadisemakinmiripobjek, makadapatdikelompokkandalamsatu cluster. Sebaliknyabilatidakmiripmakamasuk cluster lain. Pengukurankemiripandapatdilakukandengan : Cosinus, KovariandanKorelasi. • Semakinbesarnilainyamakasemakinmirip, tetapibilanilainyakecilberartitidakmirip. • 2. DENDOGRAM ( PohonKluster ) • Tehnikiniadalahmenunjukkanbagaimanaurutansebagaimanaobjekdikelompokkandalam cluster. Sedangkandistribusipengelompokkandapat pula dikerjakandenganpola cut off ( potong) padajarakataunilaitertentu, sehinggadapatmembentukkelompok cluster lainnya. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO

More Related