slide1 n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Lehrstuhl für Wirtschaftsinformatik und Betriebliche Kommunikationssysteme Prof. Dr. Reinhard Jung PowerPoint Presentation
Download Presentation
Lehrstuhl für Wirtschaftsinformatik und Betriebliche Kommunikationssysteme Prof. Dr. Reinhard Jung

Loading in 2 Seconds...

play fullscreen
1 / 38

Lehrstuhl für Wirtschaftsinformatik und Betriebliche Kommunikationssysteme Prof. Dr. Reinhard Jung - PowerPoint PPT Presentation


  • 97 Views
  • Uploaded on

Data Mining. Sascha Enders / Tim Dreesen Wintersemester 07/08 Version 1.0. Lehrstuhl für Wirtschaftsinformatik und Betriebliche Kommunikationssysteme Prof. Dr. Reinhard Jung. Wegweiser. Ausgangslage. Data Mining Prozess. Überblick Techniken. Ausprägungen. Anwendung. Fazit. Wegweiser.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Lehrstuhl für Wirtschaftsinformatik und Betriebliche Kommunikationssysteme Prof. Dr. Reinhard Jung' - aelwen


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1

Data Mining

Sascha Enders / Tim Dreesen

Wintersemester 07/08

Version 1.0

Lehrstuhl für Wirtschaftsinformatik undBetriebliche KommunikationssystemeProf. Dr. Reinhard Jung

wegweiser
Wegweiser

Ausgangslage

Data Mining Prozess

Überblick Techniken

Ausprägungen

Anwendung

Fazit

wegweiser1
Wegweiser

Ausgangslage

Data Mining Prozess

Überblick Techniken

Ausprägungen

Anwendung

Fazit

einleitung
Einleitung

Was ist Data Mining?

"Als Data Mining (engl.: datamining; deutsch: Daten-Bergbau, Daten schürfen) bezeichnet man die softwaregestützte Ermittlung bisher unbekannter Zusammenhänge, Muster und Trends aus dem Datenbestand sehr großer Datenbanken bzw. des Data Warehouse. […] “

[HaNe2005]

„Data Mining ist die Anwendung spezifischer Algorithmen zur Extraktion von Mustern und Daten“ (nach Fayyad)

[AlNi]

4

ausgangslage
Ausgangslage

Wieso Data Mining?

  • Automatische DV auf dem Vormarsch
    • Datenflut!
  • Entscheidungsfindung über Unternehmensgrenze hinweg
    • Data Warehouse als Lösung
  • Aber was mit dem ganzen Datenwust anstellen???
  • Herkömmliche Methoden nicht mehr ausreichend
    • Hilfsmittel: Data Mining
ausgangslage1
Ausgangslage

Wo ist Data Mining einzusortieren?

Ad-Hoc Abfragen

Auswertungssysteme

z.B. SQL

OLAP, Data Mining

Data Warehouse

Operative Systeme

Abb.: in Anlehnungan [AlNi]

ausgangslage2
Ausgangslage

Data Mining als wachsendes Forschungsgebiet

Web Mining

Data Warehouse

Data Mining

Abfragesprachen

DBMS

KI

1960

1970

1980

1990

2000

Abb.: in Anlehnungan [FrKö]

7

wegweiser2
Wegweiser

Ausgangslage

Data Mining Prozess

Überblick Techniken

Ausprägungen

Anwendung

Fazit

data mining prozess
Data Mining Prozess

Überblick

Daten

Auswahl / Datenexploration

Transformation

Zieldaten /

Vorverarbeitete

Daten

Data Mining

Transformierte Daten

Abb.: in Anlehnungan [AlNi]

9

data mining prozess1
Data Mining Prozess

Auswahl

?

Welche Informationsquellen sollen genutzt werden

  • Die Auswahl erfolgt auf einem vorhandenen Datenbestand
  • Relevante Datenfelder / Datensätze werden ausgewählt

10

data mining prozess2
Data Mining Prozess

Datenexploration

  • Ausreißer analysieren und eliminieren
    • z.B. Herr Prof. Dr. Reinhard Jung ist 30 cm groß.
  • Behandlung fehlender Werte
    • z.B. ist Birgitt weiblich?
  • Ziel: Ein möglichst fehlerfreier / konsistenter Datenbestand als Basis für das Data Mining zu schaffen.

11

data mining prozess3
Data Mining Prozess

Transformation

  • Daten werden bei Bedarf…
  • …verändert.
  • …normiert.
  • …kategorisiert.
  • Datenfelder werden neu angelegt
  • z.B. bei Aggregation von Daten
  • Bei den meisten Transformationen werden Daten reduziert

12

data mining prozess4
Data Mining Prozess

Zwischenstand

Die ersten drei Phasen sind laut Experten die

aufwendigsten innerhalb des Data Mining

Prozesses.

Sie nehmen ca. 75-85 % des Data Mining ein.

Quelle: in Anlehnung an [AlNi]

13

data mining prozess5
Data Mining Prozess

Data Mining

  • Selektion der inhaltlichen Data Mining Techniken
    • z.B.
    • Segmentierung
    • Klassifikation
  • Selektion des konkret anzuwendenden Data Mining Algorithmus
    • z.B.
    • Lineare Diskriminanzanalyse
  • Ablauf des Algorithmus über die transformierten Daten

14

data mining prozess6
Data Mining Prozess

Wissen

Interpretation

Ergebnisse

15

wegweiser3
Wegweiser

Ausgangslage

Data Mining Prozess

Überblick Techniken

Ausprägungen

Anwendung

Fazit

methoden
Methoden

Methoden - Überblick

Abhängigkeits-analyse

Abweichungs-analyse

Klassifikation

Segmentierung

Prognose

Operative Systeme

Abb.: in Anlehnungan [AlNi]

methoden1
Methoden

Klassifikation

Zuordnung von Elementen in bekannte Klassen, z.B. Entscheidungsbaumverfahren

> 10tsd

Flugmeilen

< 10tsd

> 2 Woche

1-2 Woche

> 2 Woche

1-2 Woche

Frequenz

Frequenz

Platinkunde

Goldkunde

Kunde

Kunde

methoden2
Methoden

Segmentierung

Zerlegung einer Gesamtheit in kleinere Teile, z.B. Clusterverfahren (1/2)

Beispiel: Lebensmittelvertrieb

  • Erkenntnis: Fleisch- und Fischesser
  • Nächster Schritt: Gruppenbildung
methoden3
Methoden

Segmentierung

Zerlegung einer Gesamtheit in kleinere Teile, z.B. Clusterverfahren (2/2)

Gruppiert:

  • Nutzung des neuen Wissen z.B. für Personalisierung der Werbung

Quelle: in Anlehnungan [HaNe2005]

methoden4
Methoden

Prognose

auf Basis bestehender Werte auf Zukünftige schließen, Künstliche Neuronale Netze (KNN)

  • Stammt aus der KI
  • Neuronen = Verarbeitungseinheiten
  • Muss erst angelernt werden
  • Einsatz z.B. Kreditrisikorechnung,Käuferklassen, Wertpapiere…

Quelle.: in Anlehnungan [ChGl]

methoden5
Methoden

Abhängigkeitsanalyse

Beziehungen zwischen zwei Merkmalen aufdecken Assoziationsregeln

Beispiel für das Aufdecken von Affinitäten :„Wenn ein Kunde eine Immobilie länger als zwei Jahre mietet und älter als 25 Jahre ist, wird er in 40% aller Fälle eine Immobilie kaufen. Diese Assoziation gilt für 35% aller Kunden, die eine Immobilie mieten.“

Quelle.: in Anlehnungan [ToBo]

methoden6
Methoden

Abhängigkeitsanalyse

Beziehungen zwischen zwei Merkmalen aufdecken Assoziationsregeln (1/2)

Quelle.: in Anlehnungan [ToBo]

methoden7
Methoden

Abhängigkeitsanalyse

Beziehungen zwischen zwei Merkmalen aufdecken Assoziationsregeln (2/2)

Quelle.: in Anlehnungan [ToBo]

methoden8
Methoden

Abweichungsanalyse

Ausreißer identifizieren z.B. mit Ausreißertests

Allgemein:

  • Gegenteil der Assoziationsanalysen
  • Versuch der Ursachenentdeckung
  • Ausreißer entweder fehlerhafte Daten oder interessante Ausprägungen!
  • z.B. für Schadensfällen bei Versicherungen, QM, Kreditkartenbetrug oder allg. bei Verfolgung von Defekten

Quelle.: in Anlehnungan [ToBo]

wegweiser4
Wegweiser

Ausgangslage

Data Mining Prozess

Überblick Techniken

Ausprägungen

Anwendung

Fazit

auspr gungen
Ausprägungen

Text Mining

Web Mining

27

auspr gungen1
Ausprägungen

TextMining - Aufgaben

  • Entdecken von Interessanten Beziehungen zwischen Dokumenten
  • Klassifikation von Dokumenten
  • Segmentierung von Dokumenten (Clustering)
  • Erstellen von Abstracts
  • Aufbau von begrifflichen Netzen

28

auspr gungen2
Ausprägungen

Data MiningText Mining

Der grundlegendste Unterschied zwischen Data Mining und

Text Mining besteht in den vorliegenden Daten, die zur Verfügung

stehen.

Stark strukturierte Daten im Data Mining

vs.

Kaum strukturierte Daten im Text Mining

29

auspr gungen3
Ausprägungen

Web Mining – Aufgaben / Unterscheidung

  • Dieselben Aufgaben die auch Data Mining ausführt, aber mit dem Bezug zum Internet / Intranet.
  • Verarbeitung / Analyse von sekundären Daten die ein Nutzer hinterlässt.

30

wegweiser5
Wegweiser

Ausgangslage

Data Mining Prozess

Überblick Techniken

Ausprägungen

Anwendung

Fazit

anwendung
Anwendung

Microsoft analysiert mit Hilfe des Verfahren der

Neuronalen Netze im Data Mining.

Wieso die einen Kunden auf ihr Postanschreiben

antworten und die Anderen nicht.

Beispiele

  • Antwortquote von 2 auf 8% erhöht, mit gleichzeitiger Senkung der Portokosten.

Quelle.: in Anlehnungan [WiBu]

32

anwendung1
Anwendung

Eine Firma in den USA, mit 5 Millionen Aufrufe im

Monat, analysierte mit Hilfe von Web Mining

Methoden, das Verhalten der Nutzer im Bezug auf Bannerwerbung.

Beispiele

  • Durch nun Zielgerichtete Bannerwerbung konnte die Klickrate von 1% auf 2% erhöht werden. Damit erhöhte sich der Erlös pro Banner, was zu einer Umsatzsteigerung der Firma um 1,2 Millionen Dollar führte.

Quelle.: in Anlehnungan [WiBu]

33

wegweiser6
Wegweiser

Ausgangslage

Data Mining Prozess

Überblick Techniken

Ausprägungen

Anwendung

Fazit

fazit
Fazit

Kritik

  • Kontext und Handlungsbezug nur durch Individuum möglich!
  • Lediglich gutes Hilfsmittel zur Mustererkennung
  • Hohe HW-Anforderungen
    • Wirtschaftliche Aspekte berücksichtigen

Ausblick

  • Data Mining im großen Unternehmen „Standard“
  • Markt ist zukunftsträchtig
  • Forschung, vor allem im Bereich
    • Realitätsnaher Interpretation
    • Neue Anwendungsgebiete
literatur
Literatur

[AlNi]

Alpar, P; Niedereichholz, J.: Data Mining im praktischen Einsatz

Braunschweig / Wiesbaden 2000

[ChGl]

Chamoni, P.; Gluchowski, P.: Analytische Informationssysteme

Berlin 2006

[DaKe]

Keim, D.: Datenvisualisierung und Data Mining

Universität Konstanz und AT&T Shannon Research Labs 2004

[FrKö]

Köster, F.: Data Warehousing andKnowledge Discovery in Databases

Universität Oldenburg 2003

[GrGe]

Grothe, M.; Gentsch, P.: Business Intelligence

München 2000

[GrBe]

Heinz L. Grob; Frank Bensberg: Das Data Mining Konzept

Universität Münster 1999

37

literatur1
Literatur

[HaNe2005]

Hansen, R.; Neumann, G.: Wirtschaftsinformatik Band 1 + 2,

Stuttgart 2005

[MeBo]

Mertens; Bodendorf; König; Picot; Schumann; Hess: Grundzüge der Wirtschaftsinformatik,

Berlin 2005

[MeWi]

Mertens, P.; H.-W. Wieczorrek: Data-X Strategien,

Berlin 2000

[RaWa]

Walther, R.: Web Mining,

Berlin 2001 (Informatik Spektrum 24)

[ToBo]

Bollinger, T.: Assoziationsregeln – Analyse eines Data Mining Verfahrens,

Berlin 1996 (Informatik Spektrum 19 - Hauptbeitrag)

[WiBu]

Wiedmann, K.; Buckler, F.: Neuronale Netze im Marketing Management

Braunschweig / Wiesbaden 2003

38