210 likes | 323 Views
Explore customer segmentation and service satisfaction in the airline industry using data mining methods to improve repurchase intentions and satisfaction.
E N D
資料探勘技術應用於航空業顧客再搭意願區隔與服務滿意項目組合之分析Data Mining Techniques Applied in Airline Industry to Explore Segmentation of Repurchase Intentions and the Best Service Items Mix on Custormer Satisfaction 指導教授: 胡凱傑老師 企碩專一00753003王家珍
報告大綱 • 觀光研究學報第12卷第2期 (95年) P139~154頁 • 摘要 • 緒論 • 文獻探討 • 研究方法 • 資料分析結果 • 結論與建議
摘要 一、背景 : 高鐵營運後(96年),國內航空業面臨競爭和挑戰 ,在有限旅客巿場,保留顧客與增加再搭意願 是各家航空關注的顧客管理問題。 二、研究範圍: 1、以國內某航空公司的顧客資料庫為例 2、C4.5決策樹的資料探勘:不同再搭意願旅客之服務 品質區隔,分析不同區隔之服務品質需求與顧客屬性 之差異。 3、購物籃分析:挖掘區隔的旅客中有高滿意度之 服務品質的組合。
緒論 • 主要研究問題: 1.再搭意願高之旅客,是滿意那些服務項目? 2.旅客滿意那些服務項目,可使滿意度較易提升? • 決策支援系統DSS中的資料探勘方法(Data Mining,DM) 1. 從大量資料中探勘出有價值但不易被發現的資訊 與知識(BerryandLinoff,2004) 2. 以人工智慧方法克服統計方法之線性限制(Dutta and Shekhar,1988) 3. 最熱門使用的決策樹與購物籃分析: 應用於服務業預測顧客需求與偵測區隔屬性的管理 4. 航空業曾使用於:資料探勘飛機維修系統找出機件 問題
研究概念及目的 1.探勘不同再搭意願的顧客對服務品質感受差異 2.探勘顧客滿意的服務要素組合
文獻--資料探勘 一、資料探勘:近年來隨著人工智慧和資料庫技術 發展而崛起的新興應用技術(林傑斌, 劉明德,2002) 二、本研究是知識發現的過程( knowledgediscovery in database,KDD) KDD—以自動或半自動方式將資料中有意義規則 或知識探勘出來(Fayyad et al.1996; Sriknt and Agrawal,1996;Berry and Linoff,2000,2004) 三、KDD流程:定義問題資料選取處理 使用探勘技術 解釋探勘結果。
四、資料探勘的任務及方法:分類、推估、預測、四、資料探勘的任務及方法:分類、推估、預測、 關聯分組、集群化與描述等六任務,每一項任務可 由不同探勘技術達成,正確選擇方法將使結果更正 確且有益。
文獻--決策樹 • 1.分析結果是以樹狀圖呈現,易讓使用者了解。 • 2.計算過程採遞迴結構方式來表示分類法的規則 • (Moshkovich,MechitovandOlson,2002)。 路徑代表 一個分類規則 根節點(母體) (root node) 子節點 (child node) 葉節點 (leafnode)
C4.5決策樹:是Quinlan(1993)提出 • 1.可處理連續與名目型態的獨立變數 • 2. 資料可以是離散或連續值,所分裂枝葉數不受限制的擴展。 3.主要透過用熵(entropy)計算資訊量(information gain), • 分類屬性選擇標準是獲得量比值(gainratio,或增益 • 比例)。 • 熵:「亂度」,表示母體中預測變數分布的分散狀況, • 亂度越高,越無規則,因此演算的目標是希望降低 • 資料分類結果的亂度。 • 增益比例gainratio=母節點與子節點的亂度差,除以 • 分割資訊量(splitgain) • 當分割資訊量值越大,相對比值越小,分類純度越高。
購物籃分析 一、利用關聯規則(Association Rule)說明事件之間的相關 性和組合,Agrawal, lmilienski and Swami(1993)提出 用「if…then…」表示發掘顧顧客連續滿意了哪些服務項 目,會有較高的整體滿意度。 二、服務項目組合的關聯大小,須由支持度support、 信心水準confidence、與增益improvement來衡量。
三、支持度:符合關聯組合規則的機率有多少(A與B 同時發生交集的聯合機率)信心水準:因A發生後,使B 也發生的條件機率有多少;信心水準越高,越有參考價值增益:A,B事件間的相關性機率,比隨機發生的機率大多少例: 滿意A項服務的顧客有80人,B項的顧客100人,同時滿意A和B項的顧客有65人滿意A項顧客中有65人也滿意B, 滿意B項中同時也有65人滿意A支持度A=65/80= 81.25% B=65/100= 65%信心水準= 0.65 ÷ 0.8125 = 80%
四、BerryandLinoff(2004)產生關聯規則的4步驟: 1.產生單一服務項目的佔有率---A項滿意度發生的機率 2.產生兩項服務的佔有率,並依最小支持度、最小信心 水準、和增益大於1等門檻值,找出兩項服務關聯規則。 3、產生三項服務的佔有率,並依最小支持度、最小信心水 準、和增益大於1等門檻找出三項服務項目關聯規則。 4.繼續增加服務項目。 • 藉由設定最小支持度,最小信心水準的門檻值來修剪關聯規 則,是為了找出高滿意度之服務組合項目。 • 最小支持度、信心水準之設定無一定標準,而門檻值設定越 高,篩選出來的組合越具有效度,但得到的關聯組合資訊量 也相對較少。
研究方法 • 一、資料來源: 某航空公司91~93年的1801筆顧客資料, 27個服務品質滿意項目
資料分析結果 • 一、C4.5決策樹:設定門檻值0.1, 錯誤率<30的顧客再搭意願之區隔結果
C4.5決策樹區隔人口統計變數及顧客消費特性:*越常搭機VS居住北部旅客再搭意願低*居住外島VS搭機頻率較低再搭意願高C4.5決策樹區隔人口統計變數及顧客消費特性:*越常搭機VS居住北部旅客再搭意願低*居住外島VS搭機頻率較低再搭意願高
二、購物籃分析最佳服務項目組合: • 發生A與B項服務情況下則C服務項目也會發生 • 設定最小支持度70﹪,最小信心水準90﹪ 此3項組合與整體滿意度,關聯性強 飛安與機場服務與整體滿意度, 具高度關聯性
購物籃分析--最佳服務項目關聯規則之消費特性與人口統計變數購物籃分析--最佳服務項目關聯規則之消費特性與人口統計變數
後續研究建議 • 研究來源是某國內航空公司的資料庫,分析變數的完整性受限於既有顧客的資料屬性。 • 可針對內部員工資料進行關聯規則的資料探勘,以提供內外部服務品質之改善。 • 可針對競爭者—高鐵的服務品質滿意項目進行分析 • 購物籃分析主要應用技術在零售業(Wal-Mart尿布與啤酒案例),藉由分析銷售點(Point-of-Sale)資料,找出商品交叉銷售或推薦組合的規則。除外也可以 應用在其他領域之決策分析: • 信用卡消費 • 手機使用的附加功能 • 消費者的常用銀行服務 • 社會保險的配套方式 • 醫院病患歷史資料的關聯性
The End. Thanks for your listening.