731 likes | 963 Views
כריית נתונים. כריית נתונים. אנטיליגנציה עסקית ( BI ) סטטיסטיקה יישום חשוב של מחסן אלגוריתמים לומדים. מטרת כלי ה- Data mining.
E N D
כריית נתונים • אנטיליגנציה עסקית (BI) • סטטיסטיקה • יישום חשוב של מחסן • אלגוריתמים לומדים
מטרת כלי ה- Data mining • המטרה: * גילוי קשרים, הקבצות, מגמות, חוקים * רכישת ידע • על מנת: * הפיכת ידע להחלטה עסקית * רכישת יתרון אסטרטגי
כריית נתונים • כמו בכריית זהב - • הקשרים קיימים • אך נסתרים
טכנולוגיות מחשוביות ואלגוריתמים • שיטה אחת לכל הצרכים ? • טכניקות שונות - לבעיות שונות • אתגר – הבנה והתאמה
- BIהשגת ידע - Knowledge • לא רק הבנה (מה קורה ) • צעד אחד קדימה • חיזוי קדימה
BI השגת ידע - Knowledge • מי הם הלקוחות הפוטנציאלים למוצר החדש ? • בחירה לפי תיעדוף • איך לפרסם? • באיזה אמצעי מכירה לנקוט ?
BIהשגת ידע - Knowledge • UPA • Understand • Predict • Act • ONLINE– REAL TIME
EFM–Enterprise Feedback Management • Approach • ארגון ממוקד לקוח • מיקוד על ערך המגע עם הלקוח • הלקוח שותף להחלטות הארגון • תקשורת דו-כיוונית - * מהנתונים לכיוון הלקוח * מהלקוח לבסיס הנתונים (השלמת נתונים)
EFM–Enterprise Feedback Management • לאחר ביקור בתחנת שירות – מחכה אימייל • הלקוח נשאל על טיב השירות • תובנות הלקוח מצורפות לתמונת לקוח • תשובותיו לסקרים מצורפות לתמונת לקוח
EFM–Enterprise Feedback Management • נשמרים: "נתונים קשים" וכן נתונים "רכים" • "קשים" - נתוני פעילות עסקית • "רכים" - מחשבות/השקפות/דעות • נתונים "רכים" יותר יציבים וקבועים • יתכן שארעה נטישה בגלל מעברדירה • אבל השקפהוהעדפה - אינןמשתנות
דוגמא: בנק • מי שנכנס לאתר – נשאל שאלות • בפעם הבאה כשיכנס לאתר יקבל הצעות ספציפיות • הצעות המתאימות לתמונת הלקוח
דוגמא: Yamaha Motors • רצון הלקוח קובע את תכונות האופנוע הבא • בעזרת סקרים מתכננים - * כידון * אגזוז * צבע * מראה
סוגי בעיות • בעיות חיזויPredictive Analytics, Classification / Forecasting • בעיות פילוח לפי אשכולות – Clustering • מציאת רצף פעילויות – Association Analysis
הנתונים שבמחסן • נתונים מטויבים • טיוב - ? • נתונים לאאיכותיים - * מסקנות מוטעות * החלטות שגויות
תהליך ניתוח מבוסס גילוי • אין הנחות • בסיס נתונים גדול • הצפת - קשרים, הקבצות, תבניות וחוקים
דוגמא • מטרה: הגדרת אוכלוסיית לקוחות למבצעמכירות • גילוי הקבצות שונות • אין הנחה מי הקבוצה המתאימה למבצע • בסיום - ההחלטה
יישומים • תחום המכירות
יישומים • פילוח לקוחות (Customer Profiling): * פרופיל הלקוחות - - זיהוי ? - הגדרה ? * טכניקה ? * מטרה - ?
יישומים • ניתוח נטישה • (Churn Management) • קשרים בין נתוניפעילות ובין נטישה • זיהוי סיבות הנטישה • זיהוי תכונות לקוח נוטש
ניתוח נטישה • מה ניתן לעשות ? • עלות שימור – עלות גיוס • מידת הצ'יפור כפונקציה של ההסתברות לנטישה • דוגמא: ? • טכניקה ?
יישומים • ניתוח סל קניות • (Market Basket Analysis) • ניתוח הרגלי הקנייה של לקוחות • המטרה: * מוצרים – לקוח לאורך זמן * מוצרים הנרכשים יחד • ההבנה מסייעת: ?
ניתוח סל קניות • ההבנה מסייעת: * קביעת רמות מלאי * תכנוןשטח המדפים * הצגת מוצרים על מדפים • טכניקה:?
יישומים • שיווק ממוקד • (Targeted Marketing) • ניתוח צורות שונות של אמצעי שיווק שהביאו בעבר לבצוע קניה • המטרה: ?
שיווק ממוקד - מטרות • התאמת אמצעי השיווק לסוגי הלקוחות * דיוור ישירים * קטלוגים * תכנון אתר הבית * תכנון מספר סוכנים *זיהוי תכונות של ?
יישומים • איתור הונאות • (Fraud Detection) • תחומים: בנקאות, מסחר בניירות ערך, טלקומוניקציה, ביטוח, ושירותי בריאות • יישומים: ?
איתור הונאות • יישומים: * כרטיסי אשראי * שיחות טלפון * מונה חשמל * מונה מים
יישומים • דירוג אשראי-ניהול סיכוני אשראי • (Credit Scoring) • תקנות רגולטוריות באזל2 • זיהוי סיכונים במתן אשראי • זיהוי לקוחות העומדים לשנות את דירוג האשראי שלהם
יישומים • יישומי ביטוח ובריאות • (Insurance and Health Care) • ניתוח תביעות מבוטחים • ההסתברות • תוחלת התביעה • פרמיית הוגנת
יישומי ביטוח ובריאות • זיהוי טיפולים רפואיים המתבצעים ביחד • זיהוי טפולים מוצלחים למצבי מחלה מסוימת
יישומים • בקרת איכות • (Quality Control) • ניתוח תקלות בקווי הייצור • חיזוי גורמים לתקלות
טכניקות • הצגה ויזואלית של הנתונים • (Visualization) • גרפים - תרשימים • צבעים - הצגה תלת-מימדית • טכניקה נפוצה - דיאגרמת פיזור (Scatter Diagram) • דיאגראמת דו מימדית המציגה פיזור הנתונים לפי שני פרמטרים
דוגמא לדיאגרמת פיזור • מה ניתן ללמוד?
טכניקות • מציאת רצף של פעילויות (Association Rules) • זיהוי נתוניםהקשורים עם נתונים אחרים • הצגת חוקיות הסתברותית • 80% מרכישות בהן נרכשה גבינת צאן כללו גם רכישת מעדן חלב דל שומן • עוד ? • מתאימה לבעיות מסוג ניתוח סל הקניות
מציאת רצף של פעילויות (Association Rules) • 92%מהלקוחות להם מנוי לעיתון "גלובס" ומנוי העוסק במוסיקה - יש להם גם מנוי לירחון העוסק במכוניות
טכניקות • ניתוח סדר הופעה • Sequence Based Analysis • הבנת סדר ביצוע העסקאות על ציר הזמן • מטרה: ? • לדוגמא: ?
מטרה • הבנת תבנית ההתנהגות לגבי קרות אירוע מסוים (רכישת מוצר באינטרנט) כדי לצפות מראש קרות האירוע בעתיד
דוגמאות • מסלול מנצחשל לינקים המביאלביצוע קניהבפועל
דוגמאות • איתור תהליכי טיפול מוצלחים למחלה • זיהוי הסתבכויות ממתן תרופות • "אם ניתן טיפול x אזי ההסתברות להופעת דלקת y לאחר חודש הינה p%" • "אם מניה x עולה ביותר מ- 20% בעוד מדד המניות יורד אזי מניה y תעלה כעבור שבוע בהסתברות p%"
טכניקות • ניתוח אשכולות • (Cluster Analysis) • פילוח אוכלוסייה לאוסף אשכולות • דמיון בין אובייקטים השייכים לכל אשכול • המטרה: ?
תהליך בניית האשכולות • אלגוריתם - * מגדיר דפוס התנהגות * בונה אשכולות * משייך לקוחות * מזהה מאפיינים • הבנת תוצאות ההקבצה מחייבת הבנה בנתונים
טכניקות • סיווג (Classification) • נפוץ • תהליך חיזוי • מודל סיווג ע"פ היסטוריה • הקבצות ידועות • יישומים: ?
סיווג (Classification) • יישומים: * כשל אשראי * כשל תהליך ייצור * הונאות * נטישה
סיווג (Classification) • סוגיאלגוריתמים - * רגרסיה איזה ? * עצי החלטות * רשתות עצביות
אלגוריתמים • עצי החלטה ( Decision Tree) • העיקרון: * זיהוי גורמים * ז"א: חיפוש תכונה/פרמטר המנבאת התנהגות * מיון ע"פ חשיבות * הצגה - עץ
אוסף של כללי החלטה • Rules for 1 - contains 4 rule(s) • Rule 1 for 1 • if AGE = 2 • and PAY_WEEK = 2.0 • then 1 • Rule 2 for 1 • if CLASS = 1 • and PAY_WEEK = 2.0 • then 1 • Rules for 0 - contains 2 rule(s) • Rule 1 for 0 • if PAY_WEEK = 1.0 • then 0 • Rule 2 for 0 • if AGE = 1 • then 0
שלבים בשימוש בעצי החלטות • בנית העץ(Decision Tree Induction) - סיווג לקוחות פוטנציאלים * שהפכו * שלא הפכו - האלגוריתם בונה עץ החלטות