310 likes | 619 Views
商業智慧 (BI). 謝邦昌 教授 輔仁大學統計資訊系教授 中華資料採礦協會 理事長 STAT1001@MAILS.FJU.EDU.TW WWW.CDMS.ORG.TW. 商業智慧. 讓資料為您開啟智識大門. KDD 過程 ---. 資料轉換到可採取行動結果上. 根據結果 採取行動. 評估結果. 資料採礦流程. 識別商業問題. Decision Trees. Clustering. Time Series. Naïve Bayes. Association. 完整與強大的演算法. 資料來源 :Microsoft Taiwan.
E N D
商業智慧 (BI) 謝邦昌 教授 輔仁大學統計資訊系教授 中華資料採礦協會 理事長 STAT1001@MAILS.FJU.EDU.TW WWW.CDMS.ORG.TW
商業智慧 讓資料為您開啟智識大門
資料轉換到可採取行動結果上 根據結果 採取行動 評估結果 資料採礦流程 識別商業問題
Decision Trees Clustering Time Series Naïve Bayes Association 完整與強大的演算法 資料來源:Microsoft Taiwan Sequence Clustering Logistic Regression Neural Net Linear Regression
Text Mining • 有90%地資訊以非結構性文件儲存 • Text Mining主要是用來處理這些非結構化資訊,以找出規則與結構 • 可應用在專利文件、病例、論文研究、文件分類、知識管理、信用評等…. • 市場上工具: • SQL 2005 SSIS/ AS • IBM Intelligent Miner for Text • SAS Enterprise Miner for Text • SPSS Clementine for Text 資料來源:Microsoft Taiwan
PMML (Predictive Mark-up Language) • Data Mining Group推出之資料採礦模型產業XML標準 • 1998年十一月芝加哥伊利諾大學的國家資料採礦中心推出了PMML 0.9版本 • 1999年正式推出1.0版本 • 微軟於2000年正式加入會員 • 會員包括IBM (Intelligent Miner) 、KXEN、Magnify、Microsoft 、MicroStrategy、Oracle 、Prudential Systems Software 、Salford Systems、SAS (Enterprise Miner)、SPSS (Clementine)、StatSoft 資料來源:Microsoft Taiwan
使用方法論的同時必須注意事項 • (1)演算法之基本假設(Hypothesis) • (2)每個方法論中所隱藏的偏差(Bias) • (3)資料變數之間的關連性(Dependency/ Independency) • (4)資料分佈狀況(Distribution) • (5)資料型態及其所代表的含意。
It’s Hot !!! • Data mining didn't exist as a field until he helped pioneer it.--Usama M. Fayyad 林共進 教授 提供
It is New • 資源與資訊共享Information Delivery • Data mining (DM)是一個當紅的專題, 也是蠻新的一個專題 • 多半的人,並不知道它能做甚麼。 • 但是不能太晚上車。 (中研院 趙民德)
Business Understanding (Domain) • 找問題-確定商業目標 • 對現有資源的評估 • 確定問題是否能夠通過資料採礦來解決 • 確定資料採礦的目標 • 制定資料採礦計畫
Credit risk analysis Fraud detection Attrition management Market basket analysis Type of Application Targeted marketing Customer profiling 0 20 40 60 80 % of Respondents Data Mining的應用
美國國防財務部需要從每年上百萬比的軍火交易中發現可能存在的欺詐現象。美國國防財務部需要從每年上百萬比的軍火交易中發現可能存在的欺詐現象。 發現可能存在欺詐的交易,進行深入調查,節約了大量的調查成本
英國電信需要發佈一種新的產品,需要通過DM的方式向客戶推薦這種產品。英國電信需要發佈一種新的產品,需要通過DM的方式向客戶推薦這種產品。 使DM的回應率提高了100%
GUS日用品零售商店需要準確的預測未來的商品銷售量,降低庫存成本。GUS日用品零售商店需要準確的預測未來的商品銷售量,降低庫存成本。 通過資料採礦的方法使庫存成本比原來減少了3.8%
滙豐銀行需要對不斷增長的客戶群進行分類,對每種產品找出最有價值的客戶。滙豐銀行需要對不斷增長的客戶群進行分類,對每種產品找出最有價值的客戶。 行銷費用減少了30%
美國國內稅務局需要提高對納稅人的服務水平。美國國內稅務局需要提高對納稅人的服務水平。 合理安排稅務官的工作,為納稅人提供更迅捷、更準確的服務
CRM ePlatform應用組合 迅速提供高階管理決策者視覺化的摘要資訊。 應用特性: 資料具歷史性、彙總依業務或主題。 應用項目: 高貢獻度重點客戶查詢、集團客戶管理 提供分析人員觀察或驗證資料的各種特性或模式。 應用特性: 資料具多維度、可鑽取、可動態操控。 應用項目: 客戶落差分析、期間貢獻度分析 分析者 提供專員或客服人員己完成的數據資訊查詢。 應用特性 :固定樣版、依業務主題。 應用項目: 產品交叉分析、分行重點客戶管理
整合客戶資料倉儲 Information Preparation & Storage Analytic Services Value-added BI & Presentation Business Discovery 多維度 資料結構 客製AP 企業問題探討 B2C平台 API Internet EIS / OLAP/ Reporting 商業模型設計 Intranet 線上交易資料 會計科子目數據 CRM SFA 資料清洗轉換 主題 資料超市 系統架構設計 資料容量規劃 工具規劃設計 資料品質稽核 系統效能調整 主題 資料採礦 Data Mining 行銷名單 • BI範本與資料來源的對照 • 原始資料評估、資料品質分析 • 資料來源規劃、強化動態資料 • 資料轉製流程設計 • 設計資料倉儲架構 • 評估資料量對系統效能的影響 • 問題需求評估分析 • 分析模組建立 • 資料超市系統建立 • 決策支援雛型建立 • 資料轉製流程與整合 程序設計 • 下階段建構評估 • 應用模組建立 • 統計雛型系統建立 • 決策支援雛型系統建立 • 單元功能測試 • 功能修正強化 • 整體整合與上線測試 • 下階段建構評估 • 依最佳化BI範本定義 業務價值及發展策略 • 定義企業資訊流程規劃 • 定義技術架構 • 開發計畫之擬定 • 固定資料模型設計
客戶歸戶 綜合剖析 營運績效 分析 損益 趨勢分析 交叉銷售/ 通路分析 信用卡 評等 其它 多維度分析 資料彙整檔 資料前置衍生處理 財會 投資信託 逾放 信用卡 分行 行銷企劃 徵信 資訊室 其它業務 營業管理單位 Portal Security Single Sign on BI整合平台 BI 管理應用 模版 智 慧 分 析 模 版 經理人資訊版 客戶行銷名單產出(X-Sell) 關係戶客戶 分析 企業集團客戶分析 單一客戶分析 重點客戶管理分析 客戶往來產品與通路分析 客戶信用卡評等 客戶價值區隔 營運管理分析 損益管理分析 行銷績效分析 星狀結構圖 業務圖表模版 績效管理 活動管理 資料採礦 Ad hoq Query S F A C R M BI管理應用 功能模組 客戶、 營運 資訊智庫 業務 交易資料 管理會計 帳務資料 客戶 基本資料 各業務 資料超市 Single User Single View!! 資料批次處理 匯入作業 交易資料、 會計檔
資料採礦對電子商務的重要性 • 專家預測在今後十年中,“資料採礦”將是具有革命性進展的舉措之一,是提供“個性化網路”的關鍵,即通過採集資訊、識別有用結構並進行即時分析,從而滿足用戶個性化選擇。 • 無論這種技術複雜與否,近年來各公司都在進行各種各樣的資料採礦研究,以期讓那些近年來急速堆積增長的原始資料,變得有意義。 • 電子商務現在是最新和最炙手可熱的一個行業,無論在哪都有歷史資料,用這些資料可以得到用眼睛無法看到的模式結論。
資料採礦能為電子商務做什麼? • 通過資料採礦,市場商人可以瞄準目標客戶,採用個人股票行市、最新資訊、特殊的市場推廣活動或其他一些特殊的資訊手段,從而極大地減少廣告預算和增加收入。 • 百貨商場、超市和一些老字型大小的零售店也在進行資料採礦,以便猜測這些年來顧客的消費習慣。
資料採礦的挑戰 • 資料採礦軟體繁多 • 軟體商正在為非統計學專業人士們開發一些更加自動化的資料採礦應用軟體,讓科學技術更加實用化。 • 迎合市場需求,資料採礦簡單化操作 • 過分簡單將會使結果出現偏差,使執行者基於錯誤的推理作出定價和盤貨決定。
結語 目前,神經網路技術提出了對傳統統計技術的攻擊檢測方法的改進方向,但尚不十分成熟,所以傳統的統計方法仍將繼續發揮作用,也仍然能為發現用戶的異常行為提供相當有參考價值的資訊。
SGI MindSet (cp) Knowledge Explorer (cp) DataEngine (cp) Delta Miner (cp) S-PLUS (cp) MATLAB (cp) Mathematica (cp) XGOBI (pd) Crystal Vision neé ExplorN sphinxVision Graf-FX IRIS Spotfire Netmap Visible Decisions Inc. Visual Mine Data Mining軟體—找解決方案 而非工具 • MicroSfot SQL Server 2005 • UNICA (ZENII) • INDEX MINER • Kepler (rp) • Clementine (cp) • DataMind DataCruncher (cp) • Darwin (cp) • Intelligent Miner (cp) • INSPECT (cp) • NeoVista Solutions (cp) • Nuggets (cp) • Partek (cp) • Polyanalyst (cp) • SAS Data Mining (cp) • Statiatica
現象=模型+誤差 Data Mining -- Find the MODEL 黃山飛來石
做的好不如做的早 Data Mining It’s New ! It’s Hot ! What are you waiting for ? 德相非空非有 應隨機以恆周 法身無去無來 住寂光而不動 峨眉山金頂