ukl d n dat aneb kam s nimi souborov datab zov koncepce n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Ukládání dat aneb kam s nimi? souborová—databázová koncepce PowerPoint Presentation
Download Presentation
Ukládání dat aneb kam s nimi? souborová—databázová koncepce

Loading in 2 Seconds...

play fullscreen
1 / 67

Ukládání dat aneb kam s nimi? souborová—databázová koncepce - PowerPoint PPT Presentation


  • 107 Views
  • Uploaded on

Ukládání dat aneb kam s nimi? souborová—databázová koncepce. Souborová koncepce. Data jsou uložena v izolovaných souborech . S každým souborem pracuje určitá aplikace Možné operace: Vytvořit, otevřít, zavřít, zrušit Čtení souboru Zápis do souboru, úpravy Vytvoření kopií a verzí souboru.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Ukládání dat aneb kam s nimi? souborová—databázová koncepce' - macey-saunders


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
souborov koncepce
Souborová koncepce
  • Data jsou uložena v izolovaných souborech.
  • S každým souborem pracuje určitá aplikace
  • Možné operace:
    • Vytvořit, otevřít, zavřít, zrušit
    • Čtení souboru
    • Zápis do souboru, úpravy
    • Vytvoření kopií a verzí souboru
souborov koncepce v hody
Souborová koncepce – výhody
  • Jednoduché pořízení (nahrajeme do adresáře)
  • Snadné naplnění (kopírování mezi složkami)
  • Pocit přehlednosti (při menší velikosti data přehlédneme, při větším počtu – viz nevýhody)
souborov koncepce nev hody
Souborová koncepce – nevýhody
  • Redundance(1 údaj obsažen 2× i víckrát)
  • Nekonzistence dat (2 kopie téhož nejsou stejné)
  • Obtížnost přístupu k datům (každý požadavek uživatele vyžaduje nový program)
  • Obtížné vyhledávání (pokud si myslíme, že si pamatujeme, kde co máme, není to pravda)
souborov koncepce nev hody1
Souborová koncepce – nevýhody
  • Izolace dat (data jsou v různých izolovaných souborech různých formátů).
  • Problémy s více uživateli (aktualizace dat více uživateli vede k nekonzistenci).
  • Problémy s ochranou dat (je obtížné zajistit utajení dat před neoprávněným přístupem).
souborov koncepce nev hody2
Souborová koncepce – nevýhody
  • Problémy s integritou dat (data nemají žádná pravidla – integritní omezení).
  • Nízké prostředky pro vytváření vazeb mezi záznamy souborů.
datab ze
Databáze
  • Soubor informací, tvořený znaky, čísly, řetězci apod.
  • Struktura databáze umožňuje vyhledávání dat pomocí počítačových systémů
  • Data jsou centrálně strukturovaná
  • Data definována podle schématu
  • Existuje nezávisle na aplikačních programech
datab ze obsahuje
Databáze obsahuje
  • Datové prvky (záznam elementárních hodnot)
  • Vztahy mezi prvky (datové struktury)
  • Integritní omezení (podmínky)
  • Schéma (popis dat pro uživatele)
datab ze v hody
Databáze – výhody
  • Nezávislost na programech
  • Efektivní přístup k datům
  • Zkrácený vývoj aplikací
  • Zajištěna integrita dat
datab ze v hody1
Databáze – výhody
  • Zajištěna ochrana dat
  • Řízená správa dat a transakcí s nimi
  • Možnost přístupu více uživatelů
  • Opravy chyb a zotavení
datab ze v hody jinak
Databáze – výhody jinak
  • Perzistence – data nezávislá na programech
  • Sdílení– k datům může více uživatelů
  • Integrita – konzistence dat, integrita (podmínky)
  • Autorizace – řízení přístupových práv
  • Neredundance – údaje se v databázi zbytečně neopakují
  • Nezávislost – programy nejsou závislé na uložení dat
slide12
SŘBD
  • Systém řízení báze dat
  • Centrální správa databáze
  • Obecný sw systém pro řízení sdíleného přístupu k databázi
  • Zajišťuje bezpečnost
  • Zajišťuje integritu uložených dat
datab zov syst m dbs
DataBázový Systém – DBS

DataBáze + Systém Řízení Báze Dat

DB + SŘDB = DBS

SŘBD

metadata
Metadata
  • Údaje doplňující uložená data
  • „Data o datech“
  • Příklad:
    • EXIF údaje o fotografii nebo grafice
metadata znak v tabulce
Metadata – znak v tabulce
  • Příklad definice znaku áv tabulce

Vyhledávání podle metadat (popis znaku)

Vyhledávání podle pozice v tabulce (pořadové číslo)

metadata znak v tabulce1
Metadata – znak v tabulce

Vyhledávání podle metadat (popis znaku)

Vyhledávání podle pozice v tabulce (pořadové číslo)

typy dat
Typy dat
  • Text, kombinace text + číslo bota č. 7
  • Numerický 12345
  • Datový 12. ledna
  • Logický ano–ne
  • Automatické číslo (počítadlo) 1,2,3…
  • Poznámka kouše
  • Objekt (např. tabulka z Excelu) *.xls
  • Hypertextovýodkaz www.bivs.cz
slide18
Data

Položka

z znam v ta
Záznam, věta

JiriHasek

25 pozic

25 pozic

druhy datab zov ch syst m
Druhy databázových systémů
  • Hierarchický model
  • Síťový model
  • Relační databázový systém
  • Objektově orientovaný
  • Multidimenzionální databáze OLAP
  • Datové sklady
z znam
Záznam
  • Student s osobním číslem složil v kurzu zkoušku dne a s výsledkem…
hierarchick model
Hierarchický model
  • Seřazení podle názvu kurzu
hierarchick model1
Hierarchický model
  • Historicky nejstarší
  • Vychází z přirozeného uspořádání
  • Stromová struktura (rodokmen)
  • Vztah označen 1 : N
    • Rodiče mohou mít 0 až n dětí
    • Dítě může mít jen jedny rodiče
  • Nevýhoda – redundance dat
s ov model1
Síťový model
  • Zobecnění hierarchického modelu
  • Vztah 1 : N, navíc i M : N
  • Př.: Autor – Nakladatelství
  • Jeden autor vydává knihy ve více nakladatelstvích
  • Jedno nakladatelství vydává knihy více autorů
  • Nevýhoda: náročná realizace a aktualizace
rela n model
Relační model

Student

Zkouška v kurzu

Vztahy

rela n datab ze
Relační databáze
  • Nejpropracovanější
  • Základem jsou relace – dvourozměrné tabulky s pojmenovanými sloupci
  • Pořadí sloupců je libovolné
  • Nevýhoda
    • Větší počet přístupů do paměti – pomalejší
  • Výhoda
    • Snížení objemu dat, možnost deduplikace
rela n datab ze1
Relační databáze
  • Ukládají data do oddělených tabulek
  • Zajišťuje to rychlost a flexibilitu.
  • Tabulky popisují nějakou část reálného světa
rela n datab ze2
Relační databáze
  • Předměty zachycované tabulkami mohou být spolu v nějakém vztahu.
  • I jednotlivé vztahy mezi tabulkami jsou reprezentovány tabulkami
  • Na tabulky i na vztahy mezi nimi se dá pohlížet jako na relace.
rela n datab ze3
Relační databáze
  • Výhoda v jednoduchostí – vše je uloženo v tabulkách, tabulky mají sloupce, v každém sloupci jsou data určitého typu
  • Jednoduchost relací je ve složitých aplikacích problém
  • Komplikované úlohy se pod relačními databázemi implementují velice těžko
objektov model
Objektový model
  • Neodděluje data a funkce
  • Od konce 90. let
  • Vhodný pro data se složitou strukturou (text, text s odkazy, obrázky, video, zvukové záznamy)
  • Vyžaduje nový způsob ukládání dat a obsluhu transakcí*

* Transakce je posloupnost akcí (čtení, zápis, výpočet) ,se kterou se zachází jako s jedním celkem. Např. dotaz v SQL

objektov model vlastnosti
Objektový model – vlastnosti
  • Plná podpora objektů
  • Zapouzdření
  • Dědičnost
  • Polymorfizmus
  • Jednoznačná identifikace objektu
  • Reference mezi objekty
zapouzd en
Zapouzdření
  • Zajišťuje, aby jeden objekt se nemohl dostat k vnitřnímu obsahu jiného objektu (pouzdro)
  • Zabraňuje tak nekonzistenci
  • Každý objekt zpřístupňuje rozhraní s nímž pracuje – jiná možnost není
d di nost
Dědičnost
  • Objekty organizovány ve stromové struktuře
  • Možnost, aby jeden objekt byl potomkem jiného objektu
  • Dědí jeho schopnosti, k nimž přidává vlastní rozšíření
  • Implementace rozdělením objektů do tříd, každý objekt je instancí nějaké třídy
  • Každá třída může dědit od jiné třídy
instance t dy
Instance třídy
  • Instance třídy je konkrétní datový objekt v paměti odvozený z nějakého vzoru (třídy)
  • Objekt představuje základní stavební prvek objektově orientovaného programování.
  • Každý takový objekt má své vlastní atributy a metody podle vzoru (třídy).
  • Instance bývá obvykle vytvořena pomocí konstruktoru a klíčového slova new.
polymorfizmus
Polymorfizmus
  • Objekt se chová podle toho, jaké třídy je instancí
  • Chování se liší podle implementace
  • Různá struktura dat i metod
integrita
Integrita
  • Podmínka, kterou omezujeme možné hodnoty atributů, nebo možné manipulace se záznamy, které existují ve vazbě k záznamům jiné tabulky
  • Příklad:
    • V tabulce je uvedeno pohlaví.
    • Omezení určuje, že v položce je uvedenobuď muž nebo žena
structured query language sql
StructuredQueryLanguage – SQL
  • Sada příkazů pro ovládání databází
  • První byl SEQUEL (StructuredEnglishQueryLanguage) – syntaktická tvorba příkazů co nejblíže angličtině
  • SQL součástí všech relačních databázových systémů (Progres, INFORMIX, SyBase, Oracle)
structured query language sql1
StructuredQueryLanguage – SQL

V rámci tohoto standardu byly definovány následující podskupiny

  • DML – Data ManipulationLanguage(Příkazy pro manipulaci s daty)
  • DDL – Data DefinitionLanguage(Příkazy pro definici struktury databáze)
  • DCL – Data ControlLanguage(Příkazy pro řízení dat)
sql p kazy
SQL příkazy
  • Příkazy pro manipulaci s daty (SELECT, INSERT, UPDATE, DELETE, …)
  • Příkazy pro definici dat (CREATE, ALTER, DROP …)
  • Příkazy pro řízení přístupových práv (GRANT, REVOKE)
  • Příkazy pro řízení transakcí (START TRANSACTION, COMMIT, ROLLBACK)
  • Ostatní nebo speciální příkazy
manipulace s daty
Manipulace s daty
  • SELECT – výběr, seskupení, řazení dat
  • INSERT – vložení dat do tabulek databáze
  • UPDATE – změna dat tabulek databáze
  • DELETE – smázení dat tabulek databáze
definice struktury datab ze
Definice struktury databáze
  • CREATE – vytváří v databázi nový objekt, vazbu mezi tabulkami
  • ALTER – mění objekty databáze (strukturu databáze, schéma)
  • DROP – ruší objekty v databázi
zen p stupov ch pr v
Řízení přístupových práv
  • GRANT – přiřazuje konkrétnímu uživateli přístupová práva k datům
  • REVOKE – odebírá konkrétnímu uživateli přístupová práva
zen dat
Řízení dat
  • START TRANSACTION– začátek transakce
  • COMMIT – potvrzení transakce
  • ROLLBACK – pokud během transakce vznikla chyba, příkaz vrátí databázi do stavu před spuštěním transakce
slide45
OLAP
  • Online AnalyticalProcessing
  • Vznik roku 1993, autorem E. F. Codd, otec relačních databází.
  • OLAP databáze – odpovědi na komplexní dotazy pracující s více dimenzemi
  • Umožňuje uspořádat velké objemy dat
slide46
OLAP
  • Základem je tvorba dotazů a sestav
  • Zpracovávají data z klasických databází
  • Vytváří vícerozměrné struktury („kostky“)
  • Nabízejí pohled na data z mnoha perspektiv:
    • Příklad: kolik jsme prodali praček v regionu západních Čech za poslední čtvrtletí?
slide47
OLAP
  • Vhodné pro analýzu komplexních vazeb mezi daty.
  • OLAPdatabáze jsou pro analýzu dat výhodnější než klasické relační databáze OTLP
  • Ukládají data tak, že předpočítávajíagregace (shlukují data)
slide48
OLAP
  • Obsahují dva základní typy dat:
  • Míra – čísla, hodnoty (náklady, výnosy, zisky, ztráty, prodeje, počty reklamací…)
  • Průměr a množství – používají se ke zpracování údajů (měr)
  • Zpracování obvykle pomocí Business Intelligence
rolap
ROLAP
  • Struktura s agregačními tabulkami přímo v relační databázi,
  • Mluvíme o tzv. ROLAPu (relationalOLAP)
molap holap
MOLAP, HOLAP
  • MOLAP (multidimensionalOLAP).
  • Vytváří vlastní proprietární soubory, pak se jedná o MOLAP
  • HOLAP(hybrid OLAP)
  • „Střední cesta“, data zůstávají v relační databázi a zvlášť jsou uloženy agregace a metadata.
rozd l mezi olap a oltp
Rozdíl mezi OLAP a OLTP

OLAP

OLTP

  • Data jednorázově nahrána
  • Nejsou průběžně akrtualizována
  • Neukládají se v 3NF formě
  • Používá více indexů než OLTP
  • Snadné a bezpečné ukládání dat
  • Bezpečné provádění změn a aktualizací
  • Doporučené ukládání v 3NF formě
  • Používá méně indexů než OLAP
rozd l mezi olap a oltp1
Rozdíl mezi OLAP a OLTP

OLAP

OLTP

  • Pohled globální
  • Komplexní dotazy na více parametrů
  • Pohled detailní
  • Jednoduché dotazy, jednoduché transakce
vysv tlivky
Vysvětlivky
  • Třetí normální forma (3NF)
    • Soubor doporučení (metodika) pro návrh datové struktury databáze
    • Optimální využití vlastností systému OLTP
  • INDEX
    • Databázová konstrukce pro zrychlení vyhledávání v databázi
    • Výrazně urychluje odpovědi na dotazy
    • Optimalizace pro fulltextové vyhledávání.
srovn vac tabulka
Srovnávací tabulka
  • Z referátu Zdeňka Koubka
datov sklady
Datové sklady
  • Data Warehouse (DWH)
  • Speciální typ relační databáze
  • Analytické dotazování nad rozsáhlými soubory dat
definice datov ho skladu
Definice datového skladu
  • Charakteristiky popsal William Inmon
  • Orientace na subjekt
  • Integrovanost
  • Nízká proměnlivost
  • Historizace
orientace na subjekt
Orientace na subjekt

Relační databáze

Datový sklad

  • Co nejmenší redundance
  • Normalizace dat (3NF)
  • Vnitřní provázání celků
  • Malé nároky na paměť
  • Separace funkčních celků
  • Struktura přehledná pro uživatele
  • Velké nároky na paměť
integrovanost
Integrovanost

Relační databáze

Datový sklad

  • Provozní aplikace pracuje se „svými“ specifickými daty
  • Úlohu řeší jen s těmito daty
  • Shromáždění informací z různých zdrojů
  • Seskupení podle logického významu
  • Všechna data pohromadě
  • Viz Orientace na subjekt
n zk prom nlivost
Nízká proměnlivost

Relační databáze

Datový sklad

  • Data jsou průběžně upravována a doplňována
  • Data nahrávána v dávkách
  • Např. denní nebo týdenní dávky
  • Po nahrání se data neupravují, nemodifikují
historizace
Historizace

Relační databáze

Datový sklad

  • Data udržována v aktuální podobě
  • Jiný stav uživatele obvykle nezajímá
  • Data udržována v historické podobě
  • Možnost analýzy časového vývoje
technick charakteristiky
Technické charakteristiky
  • Nástroj pro nahrávání dat z různých zdrojů
    • Různé datové formáty
    • Různé fyzické umístění
    • Kombinace relačních i jiných databází
  • Data ukládána s ohledem na snadnou editaci
  • Snadné a rychlé provádění složitých dotazů
    • Použití OLAP
dotazy v datov m skladu
Dotazy v datovém skladu
  • Není předem známo jaké úlohy se budou řešit
  • Potřeba flexibilních analytických nástrojů
  • Obvykle je znám pouze typ úlohy
  • Nikdy všechny dotazy a úlohy
datov sklad faktov tabulka
Datový sklad – faktová tabulka
  • Datový sklad členěn do schémat
  • Každé schéma – analyzovaná funkční oblast
  • Jádrem schématu faktová tabulka (jedna nebo více)
  • V nich analyzovaná data
  • Faktové tabulky – detailní údaje ze všech zdrojů
  • Více údajů než ostatní tabulky
datov sklad dimenze
Datový sklad – dimenze
  • Dimenze je tabulka
  • Obsahují seznamy hodnot ke kategorizaci a třídění dat
  • S faktovými tabulkami spojeny pomocí cizích klíčů
p klad
Příklad
  • Informace o prodejích
  • Zdroj: pokladny hypermarketu
  • Analýza:
    • Doba prodeje
    • Prodejna
    • Typ zboží
    • Dodavatel
    • Vliv akcí
    • Platby (karta, hotově)
p klad1
Příklad
  • Schéma Prodej
  • Faktová tabulka Položky prodeje
    • Typ zboží
    • Cena
    • Počet kusů
p klad2
Příklad
  • Dimenze pro třídění
    • Datum a hodina (týden, měsíc)
    • Prodejna Foto Škoda
    • Typ zboží Digitální zrcadlovka Pentax K-5II
    • Kategorie zboží Digitální zrcadlovka
    • Oddělení Zrcadlovky
    • Dodavatel Pentec