390 likes | 459 Views
Explore the definitions, history, and applications of data warehousing, comparing OLAP and OLTP systems. Learn about the components and structure of a data warehouse system.
E N D
Data Warehousing Abgrenzung, Einordnung und Anwendungen Sebastian Hentschel
Agenda • Begriffe • Historie • Anwendungsbereiche • Aufbau eines DW-Systems • OLAP vs. OLTP • Fazit
Agenda • Begriffe • Historie • Anwendungsbereiche • Aufbau eines DW-Systems • OLAP vs. OLTP • Fazit
Begriffe • Definition nach Inmon (1996): „A data warehouse is a subject oriented, integrated, non-volatile, and time variant collection of data in support of management‘s decisions.“ William H. Inmon
Begriffe • Definition nach Bauer/Günzel: „Ein Data-Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf (beliebige) Daten darstellt, um Analysen zu ermöglichen.“
Begriffe • Definition nach Zeh: „Ein Data-Warehouse ist ein physischer Datenbestand, der eine integrierte Sicht auf zugrundeliegende Datenquellen ermöglicht.“
Begriffe Data Warehouse • Physische Datenbank • Integrierte Sicht auf Daten • Häufig historisierte Daten • Periodische Updates, aber keine Veränderungen • Ausgangspunkt für OLAP und Data Mining
Begriffe • Unterschiede zu klassischen DBMS: • Zusätzlich Datenverdichtung, Partitionierung, Redundanz • Anwendungssicht, Datensicht, Entwicklungssicht siehe OLTP/OLAP
Begriffe Data Warehouse Systeme • Informationssystem • Komponenten zur Integration und Analyse • Statischer Charakter
Begriffe Data Warehousing • Prosess zur Planung, zum Aufbau und zum Betrieb eines DW-Systems • Dynamischer Vorgang von der Datenbeschaffung über das Speichern bis zur Analyse der Daten
Begriffe Data Mart • „kleines“ Data Warehouse • auf bestimmte Geschäftsprozesse oder Problemstellungen bezogen • dezentral • Einführung kostengünstiger und schneller als DW
Agenda • Begriffe • Historie • Anwendungsbereiche • Aufbau eines DW-Systems • OLAP vs. OLTP • Fazit
Historie • Triebfedern • Betriebswirtschaftliches Berichtswesen • Statistik • Integration
Historie • 1960er: Executive Information Systems (EIS) • 1980er: Management Information Systems (MIS) • 1988: EBIS-Architektur von IBM • 1992: Einführung DW-Konzept (Inmon) • 1993: OLAP (Codd) • Heute: Business-Warehouse-Systeme bzw. Business-Intelligence-Systeme
Historie • Fehlende Voraussetzungen der Anfangszeit • Schnelle und flächendeckende Kommunikationstechnologie • Grafische Benutzeroberflächen • Ausreichende, kostengünstige und schnelle Datenspeicher • Kostengünstige und leistungsfähige Prozessoren • Große Datenbasen durch integrierte operative Systeme Scheitern der MIS-Ansätze der 60er, 70er, 80er
Agenda • Begriffe • Historie • Anwendungsbereiche • Aufbau eines DW-Systems • OLAP vs. OLTP • Fazit
Anwendungsbereiche • Betriebswirtschaft • Informationsbereitstellung zur erfolgreichen Abwicklung von Geschäftsprozessen (Kennzahlen) • Analyse zur Untersuchung von Abweichungen und Auffälligkeiten • Planung • Kampagnenmanagement
Anwendungsbereiche • Wissenschaft (statistical and scientific databases) • Bsp. Project Earth Observing System • Technik • Umweltdaten, geografische Daten • Bsp. Wasseranalysen
Agenda • Begriffe • Historie • Anwendungsbereiche • Aufbau eines DW-Systems • OLAP vs. OLTP • Fazit
Aufbau eines DW-Systems Quelle: Uni Kaiserslautern
Aufbau • Datenquellen • Metadaten • OLAP-Server • Data Mining
Agenda • Begriffe • Historie • Anwendungsbereiche • Aufbau eines DW-Systems • OLAP vs. OLTP • Fazit
OLAP vs. OLTP • OLTP: Online Transactional Processing • Operative Systeme (viele kurze Transaktionen im Mittelpunkt) • Keine Redundanz, Normalisierung (reine Lehre) • Aktueller Datenbankzustand • Bsp.: Flugbuchung • Ziel: viele TA pro sek, TA-Sicherheit bei parallelen Anfragen, Minimierung der Antwortzeit
OLAP vs. OLTP • OLAP: Online Analytical Processing • Informative Systeme • Große Anfragen • Redundanz notwendig • Historisierung • Tages-/Wochenaktualität ausreichend • Voraggregation • Bsp.: Getränkemarkt (Quelle: Sattler/Saake) • Ziel: Antwortzeit von wenigen sek
Umsatz, Portfolio Werbung OLAP vs. OLTP • Beispiel Quelle: Sattler/Saake
OLAP vs. OLTP • Anfragen • Wie viele Flaschen Cola wurden letzten Monat verkauft? • Wie hat sich der Verkauf von Rotwein im letzten Jahr in den Regionen entwickelt? • Wer sind unsere Top-Kunden? • Von welchem Lieferanten beziehen wir die meisten Kisten?
OLAP vs. OLTP • Anforderungen • Ständig neue Anfragen (Gliederungsebenen, Fokus, …) • Schnelle Berichterstellung • Gleiche Antwortzeit für Standard- und Ad-hoc-Anfragen • Keine Einbindung von IT-Abteilungen bei neuer Anfragestruktur
OLAP vs. OLTP • Bsp. Anfragen
OLAP vs. OLTP • Codd`sche Regeln 1. Multidimensionale konzeptionelle Sicht 2. Transparenz 3. Zugriffsmöglichkeiten 4. Konstante Antwortzeiten 5. Client/Server-Architektur 6. Generische Dimensionalität 7. Dynamische Behandlung dünn besetzter Matrizen Ted Codd
OLAP vs. OLTP • Codd`sche Regeln 8. Mehrbenutzerunterstützung 9. Kreuzdimensionale Operationen 10. Intuitive Datenbearbeitung 11. Flexible Berichterstellung 12. Unbegrenzte Anzahl von Dimensionen und Klassifikationshierarchien 1995 Erweiterung um 6 weitere Regeln
OLAP vs. OLTP • FASMI (fast analysis of shared multidimensional information) • Geschwindigkeit • Analysemöglichkeit • Sicherheit • Multidimensionalität • Kapazität
Agenda • Begriffe • Historie • Anwendungsbereiche • Aufbau eines DW-Systems • OLAP vs. OLTP • Fazit
Fazit „Wir ertrinken in Informationen und dürsten nach Einsicht.“ John Naisbitt
Fazit • DW kann helfen • Aber Einführung allein genügt nicht • Sorgfältige Planung, Kostenanalyse und Nutzenabschätzung unumgänglich • Sonst Gefahr des Scheiterns • Dennoch immenses Marktwachstum
Fazit Quelle: http://www. Olapreport.com