1 / 27

Datové sklady

Datové sklady. Cvičení 1 RNDr. David Žák, Ph.D. david.zak@upce.cz. Požadavky na studenta. Podmínkou udělení zápočtu je odevzdání všech prací řešených na cvičeních účast na min im álně 70 % cvičení a úspěšné absolvování zápočtového testu nebo odevzdání zápočtové práce.

Download Presentation

Datové sklady

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Datové sklady Cvičení 1 RNDr. David Žák, Ph.D. david.zak@upce.cz

  2. Požadavky na studenta • Podmínkou udělení zápočtu je • odevzdání všech prací řešených na cvičeních • účast na minimálně 70% cvičení • a úspěšné absolvování zápočtového testu nebo odevzdání zápočtové práce. Datové sklady - cv. 1

  3. Charakteristiky dat v systémech Datové sklady - cv. 1

  4. Charakteristiky dat v systémech Datové sklady - cv. 1

  5. Charakteristiky dat v systémech Datové sklady - cv. 1

  6. Schéma technologie EDW Datové sklady - cv. 1

  7. Charakteristiky dat v systémech Struktura datového modelu (schéma) EDW obsahuje dva druhy tabulek, alespoň jednu tabulku faktů a dále tabulky dimenzionální. • Tabulka faktů obsahuje měřitelné (vyčíslitelné) údaje o sledovaném subjektu (například výdaj, příjem, cena, plat, apod.). • Dimenzionální tabulky jsou číselníky, umožňující výběr, třídění a filtraci dat uložených v tabulce faktů. Datové sklady - cv. 1

  8. Schéma typu hvězda Datové sklady - cv. 1

  9. Schéma typu sněhová vločka Datové sklady - cv. 1

  10. Multidimenzionální datová kostka Datové sklady - cv. 1

  11. OLAP analýza Pojem OLAP (On Line Analytical Processing) zaveden Dr. E.F.Coddem „Volně definovaná řada principů, které poskytují dimenzionální rámec pro podporu rozhodování.“ Datové sklady - cv. 1

  12. Vzorové schéma SH The sample company does a high volume of business, so it runs business statisticsreports to aid in decision making. Many of these reports are time-based andnonvolatile. That is, they analyze past data trends. The company loads data into itsdata warehouse regularly to gather statistics for these reports. These reports includeannual, quarterly, monthly, and weekly sales figures by product. These reports arestored with the help of Sales History (SH) schema. The company also runs reports on distribution channels through which its sales aredelivered. When the company runs special promotions on its products, it analyzes theimpact of the promotions on sales. It also analyzes sales by geographical area. Datové sklady - cv. 1

  13. Vzorové schéma SH(sales history) Datové sklady - cv. 1

  14. Postup řešení • Seznámení s • schématem SH (Sales History) • nástrojem Enterprise Manager (zobrazení existujících objektů – dimenzí, kostek) • Návrh datového skladu • Vytváření dimenzí a kostek • SQL dotazy pro agregaci a analýzu dat Datové sklady - cv. 1

  15. Postup řešení • Jméno serveru: fei-sql1.upceucebny.cz • SID: ee11 • Username: vaše_doménové_jméno (např. ST12345) • Password: (Hesla jsou tvořena spojením posledních dvou číslic z netId a číslem stagId– zadávat s malým písmenem i) • Port: 1521 • Změna hesla: ALTER USER ST12345IDENTIFIED BY nove_heslo Datové sklady - cv. 1

  16. Postup řešení • jméno serveru: SQL101.upceucebny.cz • service name / connect string: atdstest • username: sh • password: ústně • port: 1521 Upozornění – všichni pracují nad stejným schématem, neměňte data ve schématu. Datové sklady - cv. 1

  17. Oracle – pojmy • Fact Tables • A fact table typically has two types of columns: those that contain numeric facts (often called measurements), and those that are foreign keys to dimension tables. A fact table contains either detail-level facts or facts that have been aggregated. Fact tables that contain aggregated facts are often called summary tables. A fact table usually contains facts with the same level of aggregation. • Though most facts are additive, they can also be semi-additive or non-additive. Additive facts can be aggregated by simple arithmetical addition. A common example of this is sales. Non-additive facts cannot be added at all. An example of this is averages. Semi-additive facts can be aggregated along some of the dimensions and not along others. An example of this is inventory levels, where you cannot tell what a level means simply by looking at it. Datové sklady - cv. 1

  18. Oracle – pojmy • Dimension Tables • A dimension is a structure, often composed of one or more hierarchies, that categorizes data. Dimensional attributes help to describe the dimensional value. They are normally descriptive, textual values. Several distinct dimensions, combined with facts, enable you to answer business questions. Commonly used dimensions are customers, products, and time. • Dimension data is typically collected at the lowest level of detail and then aggregated into higher level totals that are more useful for analysis. These natural rollups or aggregations within a dimension table are called hierarchies. Datové sklady - cv. 1

  19. Oracle – pojmy • Hierarchies • Hierarchies are logical structures that use ordered levels as a means of organizing data. A hierarchy can be used to define data aggregation. For example, in a time dimension, a hierarchy might aggregate data from the month level to the quarter level to the year level. A hierarchy can also be used to define a navigational drill path and to establish a family structure. • Within a hierarchy, each level is logically connected to the levels above and below it. Data values at lower levels aggregate into the data values at higher levels. A dimension can be composed of more than one hierarchy. For example, in the product dimension, there might be two hierarchies—one for product categories and one for product suppliers. Datové sklady - cv. 1

  20. Oracle – pojmy • Levels • A level represents a position in a hierarchy. For example, a time dimension might have a hierarchy that represents data at the month, quarter, and year levels. Levels range from general to specific, with the root level as the highest or most general level. The levels in a dimension are organized into one or more hierarchies. • Level Relationships • Level relationships specify top-to-bottom ordering of levels from most general (the root) to most specific information. They define the parent-child relationship between the levels in a hierarchy. • Hierarchies are also essential components in enabling more complex rewrites. For example, the database can aggregate an existing sales revenue on a quarterly base to a yearly aggregation when the dimensional dependencies between quarter and year are known. Datové sklady - cv. 1

  21. Oracle – pojmy • Příklad hierarchie Datové sklady - cv. 1

  22. Oracle – pojmy • Příklad objektů datového skladu Datové sklady - cv. 1

  23. Oracle – pojmy • Příklad objektů datového skladu Datové sklady - cv. 1

  24. Úkoly • Připojte se k dtb. serveru FEI_SQL1 Prostřednictvím SQL developeru • Seznamte se s průvodcem vytvoření datového skladu na http://docs.oracle.com/cd/E11882_01/server.112/e25554/toc.htm# • Seznamte se s pojmy – tabulka faktů, dimensí, hierarchie, kostka a jak je to implementováno ve vzorovém schématu SH Datové sklady - cv. 1

  25. Úkoly – odevzdat • Fyzický návrh datového skladu - viz kapitola 3, Partitioned Tables – viz kapitola 5 (a následně http://docs.oracle.com/cd/E11882_01/server.112/e25523/toc.htm Materialized Views – viz kapitola 9,10 (základy) Dimensions – viz kapitola 11 (důležité) U všech těchto pojmů vysvětlete v dokumentu s názvem Prijmeni_Jmeno_DS_CV1 jejich smysl (máte přeci za sebou studium architektur DS), základní syntaxi, každému pojmu věnujte zhruba 2-3 strany dokumentu). Datové sklady - cv. 1

  26. Úkoly – odevzdat • Na základě schématu SH popište jednu • Partitioned table • Materialized View • Dimenzi Popis bude obsahovat SQL příkaz pro vytvoření, seznámení s obsahem těchto objektů, jeho organizací, atd. Každému z uvedených objektů věnujte minimálně 1 stranu dokumentu o velikosti A4. Dokument odevzdejte nejpozději 1 den před dalším cvičením na STAG (odevzdávání prací), tj. do 18.3.2012. Datové sklady - cv. 1

  27. Děkuji za pozornost. Datové sklady - cv. 1

More Related