adatt rh zak bevezet s
Download
Skip this Video
Download Presentation
Adattárházak: Bevezetés

Loading in 2 Seconds...

play fullscreen
1 / 17

Adattárházak: Bevezetés - PowerPoint PPT Presentation


  • 126 Views
  • Uploaded on

Adattárházak: Bevezetés. Adattárházak: Bevezetés. Tematika:. Adattárházak: Bevezetés. Tematika:. Adattárházak: Bevezetés. Tematika:. Adattárházak: Bevezetés. Az adattárházak létjogosultsága Egy szervezet informatikai rendszerei: Operatív rendszerek:

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Adattárházak: Bevezetés' - cara


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
adatt rh zak bevezet s4
Adattárházak: Bevezetés

Az adattárházak létjogosultsága

Egy szervezet informatikai rendszerei:

  • Operatív rendszerek:

a mindennapi ügyvitelt, üzemvitelt biztosító rendszerek

(pl.: számlavezető rendszer, ügyféltörzs)

  • Információs rendszerek:

egy lezárt időszak alatt felgyülemlett adatokat feldolgozó rendszerek

(pl.: jelentéskészítő vagy adatbányász eszközök, adattárházra ültetett alkalmazások)

  • Egyéb nyilvántartások:

(pl.: munkaidő nyilvántartás, jogosultságkezelő rendszer)

adatt rh zak bevezet s5
Adattárházak: Bevezetés

A problémák:

Az operatív rendszerek általában nem alkalmasak elemzések, jelentések elkészítésére, stratégiai döntések meghozatalára mert

  • nem tartalmaznak történeti adatokat:

Általában csak aktuális, az adott időpillanatra / adott napra vonatkozó adatokat tartalmazzák. Létezhetnek ugyan adatok a múltra vonatkozóan, de ez nem általános. Például egy számlavezető rendszerben jelen lehet egy, a számlatörténeteket tartalmazó tábla, de mondjuk a számlatípusokkal kapcsolatos változások hiányoznak. És az is biztos, hogy a számlatörténet is csak egy időre visszamenőlegesen szerepel a rendszerben.

  • nem integráltak:

Az üzleti folyamatok egyes lépései, részfolyamatai külön rendszerekben vannak nyilvántartva. Például egy hitelezési ügylet (többek között) a következő részfolyamatokból áll: adatok rögzítése  ügyfélminősítés/hitelbírálat  szerződéskötés  folyósítás.

Ezeket a részfolyamatokat más-más rendszerek szolgálják ki. Az ezen részfolyamatok során keletkező adatok is ezekbe a rendszerekbe kerülnek be és nagy részük ott is marad.

Azzal is gyakran találkozhatunk, hogy egy rendszer funkcionalitásait úgy bővítik, hogy egy másik, ezzel a rendszerrel (akár online) kapcsolatban álló másik (al)rendszert hoznak létre – például költségkímélés miatt.

adatt rh zak bevezet s6
Adattárházak: Bevezetés

A problémák (folytatás):

  • tranzakció-központúak, nem pedig elemzés-orientáltak:

Egyrészt az adatok olyan struktúrában vannak tárolva, amely biztosítja az integritást, azaz kellő mértékben normalizáltak (legalább 3NF) a relációsémák. Így azonban egy átfogóbb elemzéshez több objektumot kellene összekapcsolni, ami értelemszerűen jelentősen meghosszabbítaná a lekérdezés futási idejét.

Másrészt a nagy számú tranzakciós (adatmódosító) utasítás miatt a nagy mennyiségű adatokon végzett lekérdezések elvégzése nem biztosított. Például nagyon nem valószínű, hogy egy ügyfélkiszolgálást támogató rendszer működését (az aktualizálás lehetőségét) perceken keresztül felfüggesszék.

A megoldás  adattárház

Az adattárház olyan adatbázis rendszer, amely historikus, integrált adatokat tartalmaz elemzésre optimalizált szerkezetben.

adatt rh zak bevezet s7
Adattárházak: Bevezetés

Az adattárház alapvető jellemzői:

  • Történeti adatokat tartalmaz:

Jellemzően több évre vonatkozóan tartalmazza a legkülönfélébb adatokat. Ezt úgy érik el, hogy rendszeres (napi, heti, havi) illetve eseti adatáttöltéseket végeznek. Abban az esetben pedig, amikor új fejlesztést végeznek (például új adatpiacot alakítanak ki), ősfeltöltéssel biztosítják a megfelelő időintervallumra vonatkozó adatok bekerülését.

  • Integrált:

A forrásrendszerek adatai egy platformra és egy adatbázisba kerülnek. Ehhez természetesen biztosítani szükséges a megfelelő adatkapcsolatokat (interfészeket) és sokszor típuskonverziót kell végezni. Egy excel munkafüzetben például nyilvánvalóan eltérő típusú adatok szerepelnek, mint egy Oracle adatbázisban (ahová importálni szándékozunk).

  • Téma-orientált, elemzésre optimalizált:

Az adattárházban denormalizáltan, OLAP struktúrában helyezkednek el az adatok. Pontosabban, mivel a struktúraváltás az adattárházban megy végbe, az OLAP struktúra a legfelső, a kiaknázási szintre biztosan igaz, a legalsó, a forrásrendszerek felé nyitott szinten pedig OLTP szerkezetben tárolódnak az adatok. A két szint között valahol történik meg a struktúraváltás.

adatt rh zak bevezet s8
Adattárházak: Bevezetés

Az „elemzésre optimalizált” az alábbiakat is magába foglalja:

  • Az egyes adattáblák egyrészt particionáltak és kellő mértékben indexáltak.
  • Az adatáttöltéseken és a szükséges korrekciókon (pl. adattisztítás) kívül nem történik adatmanipuláció. Tehát az egyes felhasználók csak lekérdezéseket hajtanak végre, ezért az adatok „nem mozognak”, az áttöltési időszaktól eltekintve nyugodtan lehet erőforrás-igényesebb lekérdezéseket futtatni.
adatt rh zak bevezet s9
Adattárházak: Bevezetés

Az adattárház helye a többi informatikai rendszer között

ED

(TS)

IS

(TS)

IS

(TS)

IS

(TS,SS)

ED

OS: Operatív rendszer

( Operational System)

SS: Forrásrendszer

(Source System)

TS: Célrendszer

(Target System)

IS: Információs rendszer

(Information System)

ED: Elektronikus dokumentum

(Electronic Document)

IS

OS

DWH

OS

ED

(SS)

OS

(SS)

OS

(SS)

OS

(SS)

OS

(SS)

OS

ED

adatt rh zak bevezet s10
Adattárházak: Bevezetés

Az adattárház helye a többi informatikai rendszer között

Mint ahogy a fenti ábrából is jól látható, az adattárház (Data WareHouse) forrásrendszerei túlnyomó részt a szervezet operatív rendszerei és egyéb nyilvántartásai. Természetesen nem minden operatív rendszer forrásrendszere az adattárháznak és az is előfordulhat, hogy információs rendszer az input.

Az adattárház másfelől forrásrendszere az információs rendszereknek, de nem feltétlenül csak az adattárház lehet az input.

Arra is akad példa, hogy egy, az adattárházra „ültetett” rendszer szolgál forrásrendszerként, de ez ritka gyakorlat.

Egy szervezet központi rendszere/rendszerei (szinte) biztosan forrásrendszerei az adattárháznak.

Ez érthető is, hiszen a legtöbb információ ebből/ezekből a rendszerekből nyerhető ki. Ilyen egy bank számlavezető rendszere vagy egy kereskedelmi tevékenységet folytató cég készlet és/vagy értékesítéseket nyilvántartó rendszere (pl.: SAP).

slide12

Adattárházak: Bevezetés

Információs rendszerek

Az adattárház egy lehetséges felépítése (vázlatosan)

IS1

IS2

IS3

IS4

ISn

Információ kinyerése

Adatpiacok (ROLAP vagy MOLAP struktúrában)

Kocka- generálás, Adatpiacosítás

Historikus adatok (ROLAP struktúrában)

Delta-képzés (historizálás)

Adattárház

Metaadat-kezelő rendszer

Integrált előző napi adatok (ROLAP struktúrában)

Struktúraváltás, tisztítás, transzformálás

Forrásrendszerek előző napi lenyomata (OLTP struktúrában)

Szűrés, közös platformra hozás

Forrásrend-szerek

SS1

SS2

SS3

SS4

SSn

adatt rh zak bevezet s11
Adattárházak: Bevezetés

Metaadat-kezelés

A felhasználók, a fejlesztők és az üzemeltetők munkáját támogatandó nyilvántartásba veszik a forrásadatok és a kinyert információk közötti összefüggéseket:

  • Üzleti metaadatok (az adatok szemantikája)
  • Technikai metaadatok (az adatok szintaktikája)

szűrés

transzf.

transzf.

DS

IS

DWH

adatt rh zak bevezet s12
Adattárházak: Bevezetés

Az adattárházak kiaknázási módjai

  • Adatpiacokon keresztül:

Az adatpiacokat a kiszolgált terület profilja és/vagy a tevékenységi kör szerint célszerű kialakítani. Általában valamilyen felhasználóbarát felületet biztosító rendszert/alkalmazást fejlesztenek rá vagy szereznek be és adaptálják az adatpiachoz.

Többek között ilyen terület lehet:

    • ügyfélkapcsolat kezelés
    • eszköz-forrás menedzsment
    • kockázatkezelés
    • kötelező jelentésszolgálat
  • Közvetlenül az adattárház valamelyik szintjéről:

Valamelyik sémájából, a felhasználó nyilvántartásba vétele és a szükséges olvasási jogosultságok megadása után. Ezt a lehetőséget akkor érdemes választani, amikor a kiaknázandó információ mennyisége nem teszi indokolttá külön adatpiac létrehozását, viszont kibővíteni sem célszerű egy már meglévő adatpiacot.

adatt rh zak bevezet s13
Adattárházak: Bevezetés

Az adattárházak jellemző felhasználási területei

adatt rh zak bevezet s14
Adattárházak: Bevezetés

Célrendszerek

  • Döntéstámogató Rendszerek
  • Vezetői Információs Rendszerek
  • Adatbányászó alkalmazások
  • Jelentéskészítő rendszerek
ad