1 / 39

ANALISA POLA KEYWORD PENCARIAN PADA GOOGLE MENGGUNAKAN MARKET BASKET ANALYSIS. (STUDI KASUS : STIKOM Wireless Connection

ANALISA POLA KEYWORD PENCARIAN PADA GOOGLE MENGGUNAKAN MARKET BASKET ANALYSIS. (STUDI KASUS : STIKOM Wireless Connection). Bayu Hendra Krisdhianto 1) S1 / Jurusan Sistem Informasi , STIKOM Surabaya, email : bhkrisdhianto@gmail.com

jena
Download Presentation

ANALISA POLA KEYWORD PENCARIAN PADA GOOGLE MENGGUNAKAN MARKET BASKET ANALYSIS. (STUDI KASUS : STIKOM Wireless Connection

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ANALISA POLA KEYWORD PENCARIAN PADA GOOGLE MENGGUNAKAN MARKET BASKET ANALYSIS.(STUDI KASUS : STIKOM Wireless Connection) BayuHendraKrisdhianto1) S1 / JurusanSistemInformasi, STIKOM Surabaya, email : bhkrisdhianto@gmail.com Abstract:Market Basket Analysis with the Association Rules is one way to search for patterns of associations based on spending patterns by consumers, which will then be known to those items purchased any item simultaneously. And later can be used as an ingredient in the decision analysis, to increase profits or to determine marketing strategies. In this research, apriori methods used to obtain the association rules that describe the relationship between the keywords searched by users in the Google search engine on the network STIKOM Wireless Connection. From the results of empirical testing can be concluded that the computing time for generating association rules is influenced by the number of transactions, and the number of association rules is influenced by the value of minimum support and minimum confident. Keyword: Google, Apriori, Market Basket Analysis, Client – Server, Networking.

  2. Kata “informasi” telahmenjadisuatutopik yang cukupmenarikuntukdibicarakandanseolahtakadahabisnyauntukdikajikarenapertumbuhannyadankebutuhannya yang sangatcepatdanmendesak. TeknologiInformasimemacudalamsuatulingkungandimanainformasimenjadisangatpentingdalamsegalasisikehidupankitabaikdidunianyataataupundiduniamayaataubiasadisebut internet. Internet telahsecara dramatis mengubahcaraorangdalammencarisuatuinformasi. Berbagai web mesinpencari (search engine) banyakbermunculandansalingbersainguntukmenjadi yang teratasdalammenyediakaninformasi. Salahsatumetode yang dapatdigunakansearch engineuntukmengumpulkansemua data yang adadi internet danmenyajikannyakembalisebagaisebuahinformasibagi user adalahweb mining. “Web mining adalahsebuahpenemuandananalisisinformasi yang bergunadari World Wide Web. Inimenggambarkanpencarianotomatissumberinformasi on-line yang tersedia, yaitu, konten Web mining, danpenemuanpola-polaaksespenggunadarilayanan web, yaitupenggunaan Web mining”. (Cooley, Mobasher, & Srivastava (1997).

  3. SekolahTinggiManajemenInformatikadanTeknikKomputer (STIKOM) Surabaya memberikanbanyakfasilitastambahanuntukmendukungproseskegiatanpembelajarandi area kampus STIKOM Surabaya. Salahsatunyaadalah STIKOM Wireless Connection (SWC). Dengantersambungpada SWC, civitasakademik STIKOM Surabaya dapatmengakses internet secara gratis untukmendapatkaninformasipenunjangpembelajarankuliahataupuninformasilainnya. Usaha yang dilakukanolehsearch engineuntukmengumpulkaninformasijugaberbandinglurusbiladilihatdarisudutpandangpihakmanajemen STIKOM Surabaya. Pihakmanajemenmenginginkansemuafasilitas yang adadikampusdapatdimaksimalkanfungsinyabagikepentingancivitasakademik STIKOM Surabaya. Banyaknyaaudience yang menghadiripelatihanatau seminar yang diadakanpihakkampus, padatnyakerumunanmahasiswadiperpustakaankarenaselalutersediakoleksibaru yang sekaranginisedang trend, danmasihbanyaklagitujuan yang lain.

  4. Internet seakan-akantelahmenjaditempatrujukankeduabilaadasesuatuhal yang tidakbisadidapatkanlangsungdidunianyatakarenaadanyabeberapaketerbatasansepertiletakgeografisataupunwaktu. Google adalahsalahsatuwebsearchterkenal yang seringdipakaiolehcivitas STIKOM Surabaya untukmencariinformasi yang tidakbisadidapatkanlangsungdikampus STIKOM Surabaya. Tidakdiadakannya seminar ataupelatihanpadatopiktertentu, minimnyajumlahkoleksipustaka yang dimilikiperpustakaanditopiktertentu, mendorongmerekaharusmencariinformasidimanadanbagaimanahaltersebutbisamerekadapatkan. Diantaranyadenganmencariinformasidi Google. Hal inimenjadipeluangbagipihakmanajemen agar event yang diadakandikampusataupunfasilitas yang disediakanselaludipadatiolehcivitasakademik STIKOM Surabaya. Diantaranyaadalahdenganmengetahui trend apa yang sekaranginisedangdiminatidikalangancivitasakademik STIKOM Surabaya.

  5. Untukmengetahui trend apa yang sekaranginisedangdiminatiolehcivitas STIKOM Surabaya, pihakmanajemen STIKOM Surabaya merasaperlumemantauhasilpencarian yang dilakukanoleh user internet di STIKOM Surabaya padawebsearchGoogle. Dari kumpulan keyword yang dicarioleh user internet di STIKOM Surabaya, baik yang terkoneksilewatwired local area network ataupun STIKOM wireless Connection, dapatdijadikansumber data untukkemudiandianalisasehinggadapatdiketahuikata-kata yang berkaitandengantopiktertentudengankadarrelasiinterest yang tinggisedangmenjadi trend dikampus STIKOM sekarangini. Dari hasilpencarian user internet di Google, dirasaadabeberapahubungan yang unikantarakataataupuntopik yang dimasukkansebagai keyword pencariandi Google.

  6. Penelitianinimembahastentanganalisakeywordpencariandi Google berdasarkanaktivitas Google searchdarijaringan STIKOM Wireless Connection (SWC) denganmetodeMarket Basket Analysis (MBA). Dari hasilanalisaakandidapatkansuatupolaassosiasidarikeywordtertentubesertanilaiconfidence yang dimiliki. Hasilanalisatersebut yang kemudiandapatmenjadimasukanbagipihakmanajemen STIKOM Surabaya selakupembuatkeputusanuntukmemaksimalkanfungsifasilitas yang adaberkaitandenganhasilanalisasistemini. Misalnyabagipihak PSDM dapatmengadakanpelatihanatau seminar yang berkaitandengantopik yang sedangmenjaditrenddikalangancivitasakademik STIKOM, bagipihakPerpustakaandapatmenyediakankoleksipustaka yang baruberkaitandengantopik yang sama. Dan masihbanyaklagimanfaattidaklangsungdaridiketahuinyatopik yang sekaranginisedangmenjaditrend interestdikampus STIKOM sebagaimanadidapatdarihasilanalisasistem yang akandibuatini.

  7. Tujuan • Menghasilkanperangkatlunak (Client Side) yang dapatmengumpulkan data history keywordpencarianpada Google. • MengetahuibahwaMarket Basket Analysisdapatdigunakanuntukmenganalisapolakeywordpencarianpada Google. • Menghasilkanperangkatlunak (Server Side) yang dapatmenganalisa data history keywordpencarianpada Google yang dikirimkanolehsistem (Client Side) menggunakanmetodeApriori. • Menghasilkanperangkatlunak yang dapatmenyusundaftarhubunganassosiasiantarkeywordbesertatingkatconfidence yang dimilikiberdasarkan parameter minimum frequent, minimum supportdanminimum confidence.

  8. DATA MINING • Secarasederhanadata miningadalahsuatuprosesuntukmenemukaninteresting knowledgedarisejumlah data yang disimpandalam basis data atau media penyimpanan data lainnya. Denganmelakukandata miningterhadapsekumpulan data, akandidapatkansuatuinteresting pattern yang dapatdisimpansebagaiknowledgebaru. Pattern yang didapatakandigunakanuntukmelakukanevaluasiterhadap data-data tersebutuntukselanjutnyaakandidapatkaninformasi. • Tehnikdalamdata miningdatangdari Basis Data, Machine Learning, danStatistik. Elemen-elemenkunciuntukdata mininginitelahdibuatdalambeberapatahunterakhir. Secaraumumtugasdaridata miningdapatdibagikedalamduatipe, yaituPredictive Data MiningdanKnowledge Discovery / Description Data Mining. • Predictive Data Miningadalahtipedata mininguntukmemprediksinilaisuatuvariabeldimasa yang akandatangataunilaivariabel lain berdasarkanbeberapavariabel yang saatinitelahdiketahuinilainya. Yang termasukdalamtipeiniantara lain: klasifikasi, re gresi, dandeteksideviasi. • Knowledge Discovery / Description Data Mining yang jugaseringdisebutsebagaipencarianpola (pattern discovery) adalahtipe data mining yang digunakanuntukmendapatkanpola yang tersembunyidalam data danbisadipahamiolehmanusia, biasanyaditampilkandalambentukkalimat yang mudahdimengerti, misalnya “Jikaseseorangmembeliproduk A makajugamembeliproduk B”. Meskipunpolainibisaditemukanolehmanusiatanpabantuankomputer – khususnyajikajumlahvariabeldandatanyakecil – namunjikajumlahvariabelpuluhanbahkanratusandanjumlah data ribuanbahkanjutaanmakadiperlukanwaktubertahun-tahununtukmendapatkanpola-polatersebut. Disinilahperanteknologiinformasidengandukungansistem data mining membantudalampenyelesaianpermasalahanini. Yang termasuktipeiniadalah: klusterisasi, aturanasosiasi, danpenemuanpolasekuensial. • Dengandata miningpemiliktokobisamendapatkaninformasipentingdanprofitabletentangkonsumen yang padaakhirnyabisameningkatkankeuntungantokodanangkapenjualan. Kegunaaninformasipada data mining sepertidiatasseringdisebutsebagaiMarket Basket Analysis. Dalamjangkapanjang, data miningdapatmembuatsebuahtokomenjadilebihkompetitif.

  9. MARKET BASKET ANALYSIS (MBA) Market Basket Analysismerupakansebuahanalisisterhadapkebiasaancustomerberbelanjapadasupermarketdengancaramenemukanasosiasidankorelasidiantaraberbagaimacamitem yang dimasukkan customer didalamshopping basketmereka. SecaralebihspesifikMarket Basket Analysisbertujuanuntukmengetahuiitemapasaja yang seringdibelibersamaanolehcustomer. Itemdisinidiartikansebagaiberbagaimacamprodukataubarangpada supermarket (Han, Yongjian Fu, 1999).

  10. MBA (2) PadaumumnyaMarket Basket Analysisdapatdiaplikasikanpada : 1. Transaksikartukredit : barang-barang yang dibelimenggunakankartukreditdapatmenjadianalisaatasproduksejenislainnya yang jugadibelisecarabersamaan. 2. Transaksi Supermarket : kombinasidaribarang-barang yang telahdibeliolehpelanggandapatdigunakanuntukmenentukanpeletakanposisibarangdirak. 3. Transaksiproduktelekomunikasi : fasilitas yang salingberhubungan (Seperti nada sela, tampilannamapemanggil, fungsi multimedia, kamera, koneksidan lain-lain) membantumenentukanpaketdanfungsidarisuatuproduk. 4. Transaksiperbankan : poladaripelayanan yang digunakanolehnasabahdigunakanolehpihak bank untukmenawarkanpelayanan yang jugabanyakdigunakanolehnasabahlainnya. 5. Transaksiasuransi : kombinasi yang tidaklazimdarisebuahklaimasuransimenunjukkanterjadinyakecurangansebuahklaim (klaimfiktif/ rekayasa). 6. Prosedurabsensimesin : kombinasi yang tidaklazimdari jam kedatanganseseorangmenunjukkanterjadinyakecurangandalamprosesabsensi. 7. Catatanmedispasien : kombinasitertentudarisuatukondisidapatmenggambarkanbertambahnyaresikodarisebuahkomplikasidarisuatupenyakit.

  11. MBA (3) Untuk beberapa kasus, pola dari item-item yang dibeli secara bersamaan oleh konsumen mudah untuk ditebak, misalnya susu dibeli bersamaan dengan roti. Namun, mungkin saja terdapat suatu pola pembelian item yang tidak pernah terpikirkan sebelumnya. Misalnya, pembelian minyak goreng dengan deterjen. Mungkin saja pola seperti ini tidak pernah terpikirkan sebelumnya karena minyak goreng dan deterjen tidak mempunyai hubungan sama sekali, baik sebagai barang pelengkap maupun barang pengganti. Hal ini mungkin tidak pernah terpikirkan sebelumnya sehingga tidak dapat diantisipasi jika terjadi sesuatu, seperti kekurangan stok deterjen misalnya. Inilah salah satu manfaat yang dapat diperoleh dari melakukan market basket analysis. Dengan melakukan proses ini secara otomatis, seorang manajer tidak perlu mengalami kesulitan untuk menemukan pola item apa saja yang mungkin dibeli secara bersamaan.

  12. ASSOCIATION RULES Association rulesdigunakanuntukmenemukanhubungandiantara data ataubagaimanasuatukelompok data mempengaruhisuatukeberadaan data yang lain (M. Kantardzic, 2003). Metodeinidapatmembantumengenalipola-polatertentudidalamkumpulan data yang besar. Association rulemeliputiduatahap (Ulmer, David, 2002) : 1. Pencarianfrequent itemset, dengancaramencarikombinasi yang paling seringterjadidarisuatuitemset. 2. Penyusunanrules, dengancaramendefinisikanConditiondanResult (conditional association rule).

  13. ASSOCIATION RULES (2) Dalammenentukansuatuassociation rule, terdapatsuatuinterestingnessmeasure (ukurankepercayaan) yang didapatkandarihasilpengolahan data denganperhitungantertentu. Umumnyaadatigaukuran, yaitu: - Support : suatuukuran yang menunjukkanseberapabesartingkatdominasisuatuitem/itemsetdarikeseluruhantransaksi. Ukuraniniakanmenentukanapakahsuatuitem/itemsetlayakuntukdicariconfidence-nya (misal, dariseluruhtransaksi yang ada, seberapabesartingkatdominasi yang menunjukkanbahwaitem A dan B dibelibersamaan) dapatjugadigunakanuntukmencaritingkatdominasi item tunggal. - Confidence : suatuukuran yang menunjukkanhubunganantar 2 itemsecara conditional (misal, seberapaseringitem B dibelijikaorangmembeliitem A). - Improvement : suatuukuran yang menunjukkanbesarnyakemungkinan 2 itemdapatdibelisecarabersamaan. Ketigaukuranininantinyaakanbergunadalammenentukaninterestingassociation rules, yaituuntukdibandingkandenganthreshold (batasan) yang ditentukan. Batasantersebutumumnyaterdiridariminimum support, minimum cofidence, dan minimumimprovement. Sebuahassociation ruledenganconfidencesamaataulebihbesardari minimum confidence γ dapatdikatakansebagaivalid association rule (Agrawal R, Srikant, R.,1994).

  14. ALGORITMA APRIORI AlgoritmainidicetuskanolehAgrawal (1994). Idedasarnyaadalahmenghitungpolakemunculanitem yang munculdalam data transaksidenganbeberapaiterasi. Iterasikeiberartimendapatkansemua frequent i-itemset (suatuitemset yang jumlahitemanggotanyasejumlahi). Langkahumumtiapiterasiadalahmenghasilkancandidate itemsetkemudiandihitungnilaisupportdaritiapcandidate. Untukmenghasilkancandidate, padadasarnyadapatdilakukandenganmenyusunkombinasiitem-item yang sudahditemukansebelumnya. Algoritmainididasariolehhukumapriori, jikasebuahitemsetternyatainfrequent, makaseharusnyasuperset-nyajugainfrequentsehinggatidakperludiperiksalagi. Padaiterasipertama, setiapjenisitem yang ditemukandalam data dijadikancandidateuntukfrequent 1-itemsets. Sedangkancandidatediiterasiberikutnyadidapatkandarifrequentitemset yang ditemukandiiterasisebelumnya. Prosesakanberhentijikatidakadalagikombinasicandidate yang bisadibuat. SelainalgoritmaApriori yang diimplementasikansendiri, dalam data mining workbench yang dibangunjugadiintegrasikanimplementasialgoritmaApriorioleh Christian Borgelt (2003) yang seringdiacudandigunakanolehpenelitidibidangalgoritmadata mining.

  15. GOOGLE Google adalahplesetandarikata'googol', yang dipakaioleh Milton Sirotta, keponakandariahlimatematikaAmerika Edward Kasner, untukmenyebutkanangka 1 danmempunyai 100 angkanoldibelakangnya. Google memakaikatainidalammenjelaskanmisiperusahaanuntukmengorganisasisedemikianbanyaknyainformasi yang tersediadi Internet dandiduniaini. Google adalahsebuahraksasapencarian yang banyakdiminatisebagai search engine favorit. Google seolahtelahmenembusruangwaktudiberbagaibelahandunia. Google merupakanmesinpencari yang mempunyainama yang cukuppopulerdimataparapengguna internet sedunia. Tampilan Google sangatsederhana, tetapimengandungkekuatandanmultifungsi. Selainitu, web Google sangatlengkapdanhampirmenampungsemuaperbendaharaankatadalamberbagaibahasadiseluruhdunia. Mesinpencari (search engine) merupakancara yang efektifuntukmencariinformasisecara online berdasarkankatakunci (keyword) yang dimasukkan. Dalamsistem database, halitudisebutsebagai query, merupakansistematikabahasaoperasiuntukmelakukanpencarian data berdasarkankedekatandengan keyword yang dimasukkan.

  16. ANALISA SISTEM

  17. Blok Diagram AplikasiGo ‘N Run

  18. Go ’n Run nantinya akan terbagi menjadi 2 (dua) bagian, yaitu aplikasi yang berada di sisi server sebagai penganalisis data, dan aplikasi yang berada di setiap client baik yang terhubung secara wired ataupun wireless local area network sebagai pengumpul data.Server dan Client akan berada dalam satu jaringan yang sama meskipun tersambung dari hub wired network dan wireless access point yang berbeda. • Aplikasi client hanya akan memonitor aktivitas dari browser Internet Explorer. Setiap url yang diketikkan pada addressbar Internet Explorer akan dicatat dan kemudian dikirimkan ke aplikasi server. Sebagaimana umumnya aplikasi yang berjalan secara client-server, makaterlebihdahuluharusditentukan IP addressdariserverdanjugaport yang digunakansebagaijalurkomunikasiantaraclientdanserver.

  19. System Flow Aplikasi Client

  20. Agar Go ’N Run client dapatdigunakandengansempurna, terlebihdahuluharusditentukanalamat IP server yang terpasangaplikasi Go ’N Run Server beserta port yang sedangaktifdigunakanmenerimakirimanpaketkeyword Google. Begitukonfigurasijaringansudahdilakukandan client sudahdapatterkoneksidengan server, padastartupaplikasi Go ’N Run client berikutnyasetiapaktifitaskeluarmasuknya client kesistem server akanselaludicatatdi log server. Pencatataninibergunauntukmembantuidentifikasi client, sehinggadapatdiketahui client manasaja (siapasaja) yang sedangonline danterhubungdenganaplikasi Go ’N Run server. • Fitur password dapatdiaktifkanuntukmencegahpengubahankonfigurasijaringankomunikasidenganaplikasi server olehpihak lain. • Aplikasiclient akanmencatatsemuaurlyang diketikkandiaddressbarInternet Explorer. Urlakandisaringsehinggahanyaakandidapatkanurl yang berasaldari domain Google. Data urlGoogle akandisaringulang, hinggaakhirnyaakandidapatkankumpulankatakunci yang dicariolehuser. • Secaraperiodikkatakunciakandikirimkankeaplikasi server untukkemudiandisimpan. Sehingga data dapatdianalisadikemudianharisesuaidengankebutuhananalisis

  21. System Flow Aplikasi Server

  22. Agar Go ’N Run server dapatdigunakandengansempurna, terlebihdahuluharusditentukan port manakah yang digunakanuntukmelayanikirimanpaketkeyworddariclient. • Kumpulan pola keyword pencarian yang telahterkumpuldi server kemudiandilakukananalisadenganmemberikanbatasannilai Minimal Support dan Minimal Confident. Daftar yang dihasilkanadalah data yang memenuhipersyaratannilai Minimal Support dan Minimal Confident. • User diberikanpilihanapakahdaftartersebutakandicetakmenjadisebuahdokumen. ModulPDF Generator akanmemprosesdaftartersebuthinggadihasilkansebuah file PDF yang memuatdeskripsisingkatdarihasilanalisisMarket Basket Analysis, grafikfrekuensi data, dandaftarkesimpulananalisis data. • Di akhirproses user kembalidiberikanpilihan, apakah file PDF tersebutakandidistribusikanatautidak. Media email dipilihsebagai media distribusiberkaskepadapihak-pihakterkait. Untukmempermudahidentifikasi user penerima email, terlebihdahulubisadiisikan data user padabukualamatemail Go ’N Run Server.

  23. Algoritma Market Basket Analysis • Proses terpenting pada aplikasi ini adalah penerapan metode Market Basket Analysis. Proses dimulai dengan pencatatan url dari browser Internet Explorer. Dari url yang berhasil dicatat, hanya akan diambil url yang berasal dari domain Google. Dari daftar baru yang hanya berisi url dari Google, akan dipecah-pecah sehingga didapatkan pola keyword yang dicari oleh user. • Pola-pola keyword kemudianakan dipecah menjadi daftar keyword tunggal. Kemudian dibuat tabel tabulasinkeyword untuk mengetahui jumlah keyword yang ditemukan per pola keyword yang ada. Dari tabel tabulasi dapat diketahui nilai support dan nilai confident dari tiap pola. Dengan membandingkan dengan batasan nilai Minimal Support dan Minimal Confident didapatkan daftar akhir pola keyword yang ber-asosiasi dan memenuhi batasan nilai Minimal Support dan Minimal Confident.

  24. Flow Chart MBA

  25. Context Diagram Sistem Go ’n Run

  26. HASIL DAN PEMBAHASAN Bahasapemrograman yang digunakanuntukmelakukanimplementasiadalah Microsoft Visual Basic.NET.

  27. Aplikasi Client

  28. AplikasiServer

  29. UJI COBA DATA Perangkatkeras yang dipergunakanpadaujicobainiadalahkomputerdenganprosesor Intel Pentium IV Core2Duo 2.0GHz denganmemorisebesar 2048 MB. Sedangkansistemoperasi yang dipergunakanadalah Windows XP Profesional Edition Service Pack 2. Padaujicoba yang akandilakukan, digunakan 3 sumber data transaksional yang berbeda.

  30. Padaujicobaini, yang akandilakukanadalahmenjalankanperangkatlunakdengan parameter yang samapadatabel yang berbeda. Sumber data yang akandigunakanada 3 (tiga), yaitu: Data 1, Data 2, dan Data 3. Sedangkan parameter yang digunakanadalahminsupdanminconf. Nilaiminsup yang akandimasukkanadalah 0%, 25%, 50%. Sedangkannilaiminconf yang dimasukkanadalah 20%.

  31. HasilUjiCoba 1 menggunakan Data1 HasilUjiCoba 1 menggunakan Data2 HasilUjiCoba 1 menggunakan Data3

  32. Berdasarkanhasilpengujian yang telahdilakukan pada tabeluji coba makadapatditarikkesimpulan sementara hasilpengujiansebagaiberikut : 1. Semakinbanyakjumlahtransaksimakaakansemakinbanyakwaktu yang diperlukanuntukprosesanalisa Market Basket Analysis. 2. SemakintingginilaiMinimum Support makaakansemakinmemperpendekwaktu yang diperlukanuntukprosesanalisa Market Basket Analysis. 3. SemakintingginilaiMinimum Support makaakansemakinsedikitjumlahkaidahasosiasi yang dihasilkan.

  33. UJI DATA LAPANGAN • Perangkatkeras yang dipergunakanpadaujilapanganiniadalahkomputerdenganprosesor Intel Pentium IV Core2Duo 2.0 GHz denganmemorisebesar 2048 MB. Sedangkansistemoperasi yang dipergunakanadalah Windows XP Profesional Edition Service Pack 2. Ujilapanganinidilakukanselama 2 mingguyaitumulaitanggal 1 Agustus 2011 sampaidengantanggal 16 Agustus 2011. • Dari hasilujilapangandiketahuibahwaselamaperiodeujilapangantelahterjadi 897 kali polapencariandiwebsearchGoogle.Untukmengetahuisemuaaturanasosiasi yang dihasilkan, prosesanalisaMarket Basket Analysis dilakukandenganmemberikanbatasanminimum support sebesar 0% danminimum confidence sebesar 0%. • Dari prosesanalisadihasilkan 796 aturanasosiasiUser pencarikata (buku) jugamencarikata (blog) dengannilaiconfidencetertinggisebesar 97%dannilaiconfidence terendahsebesar 1%. Untukmelakukanprosesanalisainidiperlukanwaktuselamahampir 3,5 jam (03:24:44)

  34. KESIMPULAN • MetodeMarket Basket Analysis dapat digunakan untuk menganalisa pola keyword pencarian pada Google. • ArsitekturaplikasiKeyword Patern Searching Analyzerpadadasarnyaterbagimenjadi 2 (dua) bagianutama, yaituclient side (aplikasi yang di-installdiclient)danserver side (aplikasi yang di-installdiserver). • Client side dapatmencataturl yang diketikkan user pada Internet Explorer padamasing-masingclient PC. Padasaatusermelakukanpencariandi Google, dapatdiketahupolakeyword yang pernahdicariolehuser. Keyworddikirimkanke server untukkemudiandilakukananalisalebihlanjutolehaplikasipadaserver side. • Server side dapatmenangkapsemuakirimanpolakeyword dari client yang terkoneksidijaringan. Berdasarkanpolakeyword yang telahterkumpul, aplikasiserver side dapatmenemukanassociation rule darikeyword yang dicariolehuser client di Googlesesuaikebutuhandengan parameter pembatasberupaminimum support danminimum confident.

  35. KESIMPULAN (2) • Output dariaplikasiKeyword Patern Searching Analyzeryang berupainformasimengenaikeywordapa saja yang dicari secara bersamaanolehpenggunasearchengineGoogle, masihberupalaporanumum. Daftarinidapatdidistribusikankepihak-pihakterkaitsebagaibahanmasukanpembuatankeputusan. • Contohmenerapkaninformasi yang dihasilkanolehaplikasiKeyword Patern Searching Analyzeriniadalahdapatdisimpulkanbahwasemakintingginilaiconfidentdarisuatupattern, semakinbanyak pula peminatpatterntersebut.Dan bilapatterntersebutditerapkansebagaitopikdiskusidalamsebuahseminar/workshop, makadiharapkansemakintinggi pula jumlahpeserta yang mengikutinya. Baikpesertadarikalanganumummaupundarikalangancivitasakademik STIKOM Surabaya. Dengandemikiansemakinbaik pula imagekampus STIKOM Surabaya di pandanganmasyarakatsekitar. • Padaanalisaterhadapsejumlah data ditemukanbahwasemakinbanyak data yang dianalisa, waktuprosesakanlebih lama karenasemakinbanyak pula frequent itemsdanrules yang dihasilkan.

  36. KESIMPULAN (3) • Padaanalisaterhadapsejumlah data ditemukanbahwasemakintingginilai minimum support dan minimum confident yang ditentukan, semakinsedikit jumlah kaidah asosiasi yang dihasilkan yang dihasilkan.

  37. DAFTAR RUJUKAN • Agrawal R, Srikant, R.(1994). Fast Algorithms for Mining Association Rules, Proceedings of the 20th International Conference on Very Large Data Bases (VLDB), Santiago, Chile, pp. 487-499. • Amanda Spink, Dietmar Wolfram, Bernard J. Jansen, and TefkoSaracevic. Searching the Web: the public and their queries. Journal of the American Society for Information Science and Technology, 52(3), 226-234, 2001. • Borgelt C. (2003). Efficient Implementations of Apriori and Eclat. Proceeding of the 1st IEEE ICDM Workshop on Frequent Item Set Mining Implementations (FIMI 2003, Melbourne, FL). CEUR Workshop Proceedings 90, Aachen, Germany. • Cooley, R., Mobasher, B., & Srivastava, J. “Web mining: Information and pattern discovery on the world wide web”, 1997 • Google.com. “Official Supported Domains”, http://www.google.com/supported_domains (diaksespadatanggal 9 Februari 2010) • Han, Jiawei, MichelineKamber, “Data Mining: Concepts and Techniques”, Morgan Kaufmann, 2001 • Han, Jiawei, Yongjian Fu, “Discovery Of Multiple-Level Association Rules From Large Databases”, IEEE Transactions On Knowledge And Data Engineering, Vol. 11, No. 5, September/October 1999 • Jansen, B. J., & Spink, A., “An Analysis of Document Viewing Patterns of Web Search Engine Users”,2003 • Kantardzic, M. (2003). Data Mining Concepts Models, Methods, and Algorithms. New Jersey: IEEE. • Ulmer, David; “Mining an Online Auctions Data Warehouse.” The Mid-Atlantic Student Workshop on Programming Languages and Systems. 19 April 2002. Pace University. http://csis.pace.edu/csis/masplas/p8.pdf (diaksespadatanggal 9 Februari 2010) • Wicaksono, Soetam Risky, 2005, KuliahInteraksiManusiadanKomputer, STIKOMP, Surabaya

More Related