Tema 3 skladi tenje podataka i inteligentni agenti
Download
1 / 33

Tema 3: Skladi štenje podataka i inteligentni agenti - PowerPoint PPT Presentation


  • 155 Views
  • Uploaded on
  • Presentation posted in: General

Tema 3: Skladi štenje podataka i inteligentni agenti. SISTEMI ZA PODRŠKU ODLUČIVANJU doc dr Vladislav Mi š kovic Fakultet za informatiku i menadžment 2009/2010. Tema 3 : Skladištenje podataka i inteligentni agenti. Uvod Skladišta podataka Razvoj skladišta podataka

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha

Download Presentation

Tema 3: Skladi štenje podataka i inteligentni agenti

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Tema 3: Skladištenje podataka i inteligentni agenti

SISTEMI ZA PODRŠKU ODLUČIVANJU

doc dr Vladislav Miškovic

Fakultet za informatiku i menadžment

2009/2010


Tema 3:Skladištenje podatakai inteligentni agenti

  • Uvod

  • Skladišta podataka

  • Razvoj skladišta podataka

  • Zaštita i administracija

  • Inteligentni agenti

  • Primeri


1. UVOD

  • Poslovna inteligencija

  • Skladište podataka

    • Osnovna svojstva

    • Struktura i komponente


Poslovna inteligencija (business intelligence)

  • Sastoji se od

    • skladišta podataka (data warehouse, DW) i

    • skupa korisničkih alata za kreiranje upita i izveštaja i njihovu analizu i vizualizaciju (business analytics, BA)

    • metoda za otkrivanje netrivijalnih relacija u podacima (data mining i Web mining)

    • metoda i alata za upravljanje performansama poslovanja (business performance management, BPA)


Skladište podataka

  • skup podataka proizvedenih radi podrške odlučivanju

  • mesto prikupljanja tekućih i istorijskih podataka, potencijalno od interesa za različite menadžere u organizaciji

    • podaci su strukturisani na način pogodan za različite analitičke obrade


Osnovna svojstvaskladišta podataka

  • neophodni za analitičko procesiranje (OLAP), koje omogućava korisniku udobnije, manje formalne načine postavljanja složenih upita

    • različito od klasičnog procesiranja transakcija (OLTP)

    • suprotstavljeni ciljevi izgradnje operativnih baza i analitičkih baza podataka (neefikasnost)

  • skladište proizvedenih informacija

    • informacije iz više izvora (baza podataka)

  • neophodne za održavanje tržišne prednosti

    • primena u izgradnji brendova, lojalnosti mušterija, ...


Struktura i komponente skladišta podataka


2. SKLADIŠTA PODATAKA

  • Osnovne definicije

  • Proces skladištenja

  • Arhitekture skladištenja

  • Integracija podataka


Osnovne definicije

  • Skladište podataka (Data Warehouse)

    • integrisana, pojmovno orijentisana, vremenski promenljiva i neizbrisiva kolekcija podataka, koja pruža podršku odlučivanju

    • Data Mart

      • mali podskup skladišta posvećen nekoj tematici i namenjen određenoj grupi ljudi

    • Operational Data Store (ODS)

      • dinamička, privremena skladišta, za brzo donošenje odluka

    • Enterprise Data Warehouses (EDW)

      • velika skladišta podataka, za celu organizaciju


Proces skladištenja

  • Osnovne komponente

    • izvori podataka (data sources) - transakcione baze, datoteke, eksterni izvori

    • ekstakcija

    • punjenje

    • baza podataka

    • metapodaci

    • middleware


Arhitekture skladištenja

  • dvoslojna ili troslojna, prema tome kako su raspoređeni

    • podaci i softver skladišta

    • softver za prikupljanje podataka (ekstrakciju, konsolidaciju, sumiranje i punjenje skladišta)

    • klijent

  • Web sistemi

  • postoje različite varijante arhitekture skladišta, od centralizovanih do decentralizovanih rešenja, gde se samo dele različiti pogledi (DataMarts)


Različite arhitekture skladištenja

a) centralizovano

b) Web

c) decentralizovano


Integracija podataka

  • priprema podataka za upotrebu od strane drugih alata za skladištenje (DW)

    • pristup (access) različitim izvorima podataka

    • objedinjavanje (federation) podataka iz različitih izvora/sistema - internih i eksternih

    • izdvajanjepromena (change capture)

  • Tehnologije koje se koriste u integraciji

    • Enterprise application integration (EAI)

      • Service-oriented architecture (SOA)

    • Enterprise information integration (EII)

    • Extract, transformation and load (ETL)


ETL proces

  • Ekstrakcija - čitanje više baza (transakcione baze podataka, fajlovi, elektronske tabele, lične baze podataka)

  • Transformacija - promena oblika podataka

  • Punjenje (load) - smeštanje u skladište

    • Koristi se pomoćna, privremena baza podataka

    • Poslovna pravila su smeštena centralizovano, kao metapodaci

    • Koriste se namenski alati (Microsoft, Oracle, IBM, Informatica, Tibco) ili se pišu se posebni programi


ETL proces


3. RAZVOJ SKLADIŠTA

  • Primer

  • Poznati proizvođači softvera

  • Različiti pristupi razvoju

  • Struktura skladišta (zvezda)

  • Implementacija

  • Masivna skladišta

  • Skladištenje u realnom vremenu


Primer

  • avioprevoznik u finansijskim problemima (7. u svetu)

    • 2300 letova dnevno

    • 227 destinacija

    • problem organizacije i zadovoljenja potreba putnika

    • više različitih baza podataka i nasleđenih zastarelih sistema, spori upiti

  • izgrađeno integrisano skladište podataka kompanije (EDW)

    • informacije u realnom vremenu (putnici, osoblje, bezbednost, proces letenja)

  • osim redukcije troškova, eliminisane i zloupotrebe

  • investicija od 30 miliona (u toku 6 godina), povećanje prihoda 500 miliona


Poznati proizvođači softvera

  • Computer Associates (www.ca.com)

  • Hyperion Solutions (www.hyperion.com)

  • IBM (www.ibm.com)

  • Informatica (www.informatica.com)

  • Microsoft (www.microsoft.com)

  • Oracle (PeopleSoft, Siebel) www.oracle.com

  • SAS Institute (www.sas.com)

  • Sybase (www.sybase.com)

  • Teradata (www.teradata.com)


Različiti pristupi razvoju

  • Centralizovani pristup (EDW)

    • jedinstven pogled na celu organizaciju

    • koristi metode i alate za razvoj baza podataka (ERD, spiralni razvoj)

  • Decentralizovani pristup (Data Mart)

    • "planirati celinu, graditi postupno"

    • podaci se prvo organizuju prema problematici pojedinih organizacionih celina

    • često prvi korak ka razvoju centralizovanog skladišta (EDW)


Struktura skladišta (zvezda)

  • modeliranje dimenzija - sistem pristupa podacima velikog obima

  • struktura zvezde je način implementacije modela dimenzija

    • centralna tabela - posmatrani poslovni podaci i njihovi atributi, analitički (mere performansi), deskriptivni, ključevi

    • tabele dimenzija (klasifikacija i agregacija informacija o podacima)

  • granulacija - nivo detaljnosti (optimizuje se)


Primer


Implementacija

  • poseban projekt, veliki broj različitih pristupa

  • niz faktora i kriterijuma (na vežbama)

  • osnovni alati za integraciju podatakasu deo softvera poznatih proizvođača DBMS/BI alata, npr.

    • SSIS - SQL Server Integration Services


SSISSQL Server Integration Services


Masivna skladišta

  • performanse opadaju porastom veličine skladišta

  • veličina skladišta podataka raste eksponencijalno (danas petabajti)

  • skalabilnost skladišta je svojstvo da vreme pristupa linearno zavisi od veličine skladišta


Skladištenje u realnom vremenu

  • tradicionalna skladišta podataka se ažuriraju periodično (npr. nedeljno)

  • važni aspekti poslovanja zahtevaju donošenje odluka u realnom vremenu

  • za potrebe korisnika koji direktno komuniciraju s kupcima i dobavljačima, EDW su evoluirali u real time data warehousing (RTDW) ili active warehousing (ADW)

  • omogućena je upotreba skladišta podataka i na taktičkom nivou


4. ZAŠTITA I ADMINISTRACIJA

  • Metodi zaštite i administracije informacionih sistema i baza podataka

  • Administrator skladišta podataka

    • komunikacija sa donosiocima odluka

    • potrebno znanje iz informacionih sistema, baza podataka, mreža i sistema za podršku odlučivanju


5. INTELIGENTNI AGENTI

  • Inteligentniagent - računarski program koji pomaže korisniku u obavljaju rutinskih poslova na osnovu utvrđenih pravila i baze znanja [1]

    • agent - osoba koja sarađuje s drugim licima radi obavljajnja određenih poslova

    • softverski agent (software daemon, software agent), čarobnjak (wizzard)

      = softverski robot (softbot, chatterbot, shopbot, knowbot, mailbot, spambot)


Podela prema primeni

  • autonomni agenti

    • biološki agenti

    • robotski agenti

    • računarski agenti

      • softverski agenti

        • određene namene

        • za zabavu

        • virusi

      • veštački živi agenti


Podela prema svojstvima (dimenzijama)

  • agencija - stepen autonomije (asinhronost)

  • inteligencija - stepen zaključivanja i sposobnost učenja

  • mobilnost - sposobnost premeštanja u mrežnom okruženju

    • učestvuju u procesima i u vreme kad korisnik nije na mreži (npr. višednevne aukcije)


Internet agenti

  • e-mail agenti (mailbot)

  • web browsing asistenti

  • inteligentni pretraživači

    • indeksiranje informacija, robots, spiders, wanderers

  • softboti (pronalaženje informacija)

    • google.com, hotjobs.yahoo.com

  • agenti za upravljanje i nadzor

  • e-commerce agenti

    • bestwebbuys.com, ebay.com

  • ostali agenti (inteligentni interfejsi, učenje, preporučivanje, profilisanje, Web mining, ...)


6. PRIMERI

Primeri projekata na sajtovima

  • Oracle www.oracle.com

  • Microsoft www.microsoft.com

  • IBM www.ibm.com

  • Hyperion www.hyperion.com

  • Harvard Bussines School Case Collection www.harvardbussinesonline.hbsp.harvard.edu

    Inteligentni agenti i interfejsi

  • www.botspot.com


Literatura

  • Nastavni materijali (prezentacije i uputstva)

  • Turban E., Aronson J.E., Liang T., Sharda R., Decision Support and Business Intelligence Systems, 8th Ed, Pearson Education,Inc, 2007

  • Seref M., Ahuja R.,Winston W., Developing Spreadsheet-based Decision Support Systems, Dynamic Ideas, 2007

  • Adam F., Humphreys P., Encyclopedia of Decision Making and Decision Support Technologies, IGI Global, 2008


SISTEMI ZA PODRŠKU ODLUČIVANJUTema 3: Skladištenje podataka i inteligentni agenti

KRAJ


ad
  • Login