Download
data mining prediksi n.
Skip this Video
Loading SlideShow in 5 Seconds..
DATA MINING : PREDIKSI PowerPoint Presentation
Download Presentation
DATA MINING : PREDIKSI

DATA MINING : PREDIKSI

281 Views Download Presentation
Download Presentation

DATA MINING : PREDIKSI

- - - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

  1. DATA MINING : PREDIKSI Overview Regresi Linear Regresi Linear Sederhana Regresi Linear berganda Analisis Garis Regresi menggunakan Koesifien Determinasi Conclusion

  2. Overview • Sbg gambaran, diberikan data mengenai lamanya wkt yg dihabiskan oleh seorang pegawai resto cepat saji utk mengantarkan pesanan ke rumah pelanggan. • Wkt sejak pegawai meninggalkan resto hingga mencapai pintu rmh pelanggan di tampilkan sbb:

  3. Overview

  4. Overview • Berapa waktu yg ditempuh utk pesanan ke-26? • Dlm prediksi menggunakan data yg sdh ada utk memprediksi hasil dari satu hal yg baru yg akan muncul selanjutnya. • Prediksi dapat memperkirakan hasil dari hal yg belum terjadi. • Cara prediksi  Regresi Linear

  5. Regresi Linear • Regresi Linear (RL) yg dibahas: • RL Sederhana  melibatkan 1 variabel pemberi pengaruh • RL Berganda  melibatkan >1 variabel pemberi pengaruh • Variabel  besaran yg berubah2 nilainya • Contoh variabel: nomor rmh pelanggan, luas rmh pelanggan, jam pemesanan, suhu udara saat pemesanan, jumlah anggota keluarga pemesan, dll • Belum tentu semua variabel relevan dgn kasus yg dihadapi • Variabel dipilah 2  • Variabel pemberi pengaruh  dianalogikan sbg “sebab” • Variabel terpengaruh  dianalogikan sbg “akibat”

  6. Regresi Linear Variabel pemberi pengaruh (Sebab) Variabel terpengaruh(akibat)

  7. RL Sederhana • RL Sederhana  salah satu cara prediksi menggunakan garis lurus utk menggambarkan hubungan di antara 2 atw lebih variabel • Sbg contoh: • Berdasarkan tabel, kita coba menggambarkan jarak sbg sumbu x (dlm km) dan Waktu sbg sumbu y (dlm menit) • Setiap pasang jarak dan waktu di gambarkan sebagai titik.

  8. Tujuan:Membuat garis lurus sedekat mungkin dgn titik2 tsb  B lebih baik • Scr umum, grs tsb dpt kita tulis dlm bentuk persamaan: • Y = β0 + β1x

  9. n ∑ yi i=1 n ∑ xi i=1 n ∑ yixi i=1 _ _ β0 = y - β1x n β1 = 2 n ∑ xi i=1 n ∑ xi2 i=1 n

  10. Perincian perhitungan RL-S

  11. 29,02 – (4,35)(3,32) = = 14,58 n ∑ yi i=1 n ∑ xi i=1 _ _ β0 = y - β1 x n ∑ yixi i=1 (725,42) (82,94) 2745,81 25 n β1 = 4,35 = = 2 (82,94) 2 n ∑ xi i=1 353,18 25 n ∑ xi2 i=1 n

  12. Persamaan grs regresi yg kita cari berbentuk: • Y = β0 + β1x • Berdasarkan perhitungan tsd, maka diperoleh: • Y = 14,58 + 4,35 x • Pengetahuan apa yg didapat? • Bhw wkt tempuh pengiriman  14,58 menit ditambah 4,35 kali jarak rumah pelanggan. • Artinya bila jaraknya 1 km maka, wkt tempuhnya jadi 18,93 menit • Maka, utk pelanggan ke-26 dgn jarak 1,5 km  • Y = 14,58 + 4,35 (1,5) • Y = 21,1 menit

  13. Regresi Linear Berganda • Menyusun persamaan linear dgn byk variabel X (pemberi pengaruh) • Bila kita memiliki k buah variabel pemberi pengaruh, maka bentuk persamaan garis regresinya: Y = β0 + β1x1 + β2x2 + ... + βkxk • Sehingga kita dpt menyelesaikan persamaan, sbb:

  14. n n n n • nβ0 + β1 ∑ xi1 + β2 ∑ xi2 + ... + βk ∑ xik = ∑ yi • i=1 i=1 i=1 i=1 • n n n n n • β0 ∑ xi1 + β1 ∑ xi12+ β2 ∑ xi1xi2 + ... + βk ∑ xi1xik = ∑ xi1yi • i=1 i=1 i=1 i=1 i=1 . . . • n n n n n • β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 + ... + βk ∑ Xik2 = ∑ XikYi • i=1 i=1 i=1 i=1 i=1

  15. Penambahan variabel pemberi pengaruh  banyaknya lampu merah

  16. Perhitungan RL-B

  17. Perhitungan RL-B (lanjutan)

  18. n n • n β0 + β1 ∑ xi1 + β2 ∑ xi2 = 725,42 • i=1 i=1 • n n n • β0 ∑ xi1 + β1 ∑ xi12+ β2 ∑ xi1xi2 = 8.001,67 • i=1 i=1 i=1 • n n n • β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 = 2.745,81 • i=1 i=1 i=1

  19. β0 25 + β1 206 + β2 82,94 = 725,42 β0 206 + β1 2.396 + β2 771,77 = 8.001,67 β0 82,94+ β1 771,77 + β2 353,18 = 2.745,81 • Ketiga persamaan diatas diselesaikan shg diperoleh β0 = 2,31 ; β1 = 2,74 ; β2 = 1,24 • Maka persamaan RL nya: Y = β0 + β1x1 + β2x2 menjadi Y = 2,31 + 2,74 x1 + 1,24 x2

  20. Pengetahuan yg diperoleh: • Dari 2,31 waktu tempuh, akan melewati 2,74 kali lampu merah ditambah 1,24 kali jarak rmh pelanggan • Dari kasus diatas diketahui 1 lampu merah dan 1,5 km jaraknya, maka X1= 1 (lampu) dan X2=1,5 (jarak) shg kita dpt memprediksi lamanya wkt pesanan tiba di rmh pelanggan dgn cara: Y = 2,31 + 2,74 X1 + 1,24 X2 Y = 2,31 + 2,74 (1) + 1,24 (1,5) = 6,91 menit

  21. Analisis Garis Regresi Menggunakan Koefisien Determinasi Kita telah pelajari subbab sblmnya bhw: • Pers. Grs linear pertama dgn var. pemberi pengaruh x = jarak Y = 14,58 + 4,35 X • Pers. Grs linear kedua dgn var. pemberi pengaruh x1 = jml lampu merah dan x2 = jarak tempuh  Y = 2,31 + 2,74 X1 + 1,24 X2 • Pertanyaan  manakah yg lebih baik? • Solusi  dpt menggunakan ukuran koefisien determinasi yg dinotasikan sbg R2

  22. Koefisien Determinasi dpt dihitung dgn rumus: SSE Syy R2 = 1 - n n SSE = ∑ ei2 = ∑ (yi – yi)2 i=1 i=1 ^ n Syy = ∑ (yi – y)2 i=1

  23. Perhitungan Koefisien Determinasi Y = 14,58 + 4,35 X Y = 2,31 + 2,74 X1 + 1,24 X2

  24. Perhitungan Koefisien Determinasi (2)

  25. Hasil • Pers. Regresi pertama (Y=14,58 + 4,35 X): SSE Syy • = 1 – (4.609,78 / 6.084,02) = 0,2423 = 24,23 % R2 = 1 - • Pers. Regresi kedua (Y = 2,31 + 2,74 X1 +1,24 X2): SSE Syy • = 1 – (115,05 / 6.084,02) = 0,9811 = 98,11 % R2 = 1 -

  26. Hasil • Grs regresi kedua ternyata memiliki Koefisien Determinasi yg lebih tinggi, grs tsb lbh dpt menjelaskan keberagaman wkt pengantaran pesanan. • Utk memprediksi wkt pengantaran sebaiknya menggunakan garis regresi kedua yg mempertimbangkan dua variabel pemberi pengaruh, yaitu banyaknya lampu merah dan jarak rumah pelanggan

  27. Kesimpulan • Kegunaan fungsi prediksi • Cara membuat persamaan garis regresi utk satu atw lbh variabel pemberi pengaruh • Cara melakukan analisis perbandingan antara dua garis regresi berdasarkan koefisien determinasi