150 likes | 255 Views
Learn about different data storage methods in computers, including binary values and character encoding. Explore text and numeric data storage formats such as ASCII and Unicode. Understand the differences between text and binary formats, and their properties. Discover file formats and their applications.
E N D
Uložení dat v počítači Informatika pro ekonomy II přednáška 4
Data v počítači • Data — formálně vyjádřená skutečnost (symbolicky vyjádřené údaje a hodnoty). • v počítači — vše vyjádřeno dvojkovými hodnotami (důvod: technologie výroby počítačů) • stanovení kódu — nekonečně mnoho možností • údaje mají množinu povolených hodnota operací — datový typ
Výběr možností uložení • ze všech teoretických možností lze vybrat způsoby s vhodnými vlastnostmi • uložení čísel — dvojková soustava se zarovnáním na rozměr paměťových míst, přirozená, celá, racionální čísla (viz předmět VTA) • uložení textu — posloupnost znaků kódovaných podle znakového kódu, ASCII, národní znaky • ostatní datové typy — většinou lze reprezentovat čísly nebo znaky nebo kombinací
Znakový kód • Znaky — řídicí a zobrazitelné. • Řídicí znaky — jsou určeny pro ovládání přídavných zařízení (nebo programu). • Zobrazitelné znaky — jsou určeny pro zobrazení textu. • Národní znaky — jsou určeny pro zobrazení textů v jiných jazycích než v angličtině.
Kódování národních znaků • Žádný znakový kód nebyl původně navržen pro zobrazování národních znaků. • Znakový kód ASCII (ISO 646) — jen 128 hodnot, sedmý bit určen pro zabezpečení při přenosech. • Nejsnadnější varianta — využití zbylých 128 pozic; 1 znak = 1 byte • Způsob využití — zcela nejednotný. • Příklady: Kamenických, PC Latin 1 a 2 (CP 852), ISO 8859 (16 částí, CS=2), KOI, Windows CP 1250
Kódování národních znaků • 256 pozic je málo — hledají se další možnosti • ISO 10 646 — univerzální prostor 4 B, tj. přes 4 miliardy znaků; UCS — Universal character set • Univerzální způsob je zbytečně neúsporný, UTF — UCS Transformation Format • UTF-8, UTF-16 — jedna z možností zmenšení potřebného prostoru (1—2 B) • Unicode — vždy 2 B
110010 110111 00110010 00110111 32 37 Vyjádření hodnot datového typu Definice způsobu uložení jednotlivých hodnot =datový formát Příklad 1: věk osoby — 27 let a) převod čísla do dvojkové soustavy 11011 00011011 1b b) zápis čísla pomocí znaků (znakový kód — ASCII?)
7 'C' 'i' 'm' 'r' 'm' 'a' 'n' 43 69 6d 72 6d 61 6e 00 07 43 69 6d 72 6d 61 6e 43 69 6d 72 6d 61 6e 20 20 20 43 69 6d 72 6d 61 6e 0d 0a 'C' 'i' 'm' 'r' 'm' 'a' 'n' ' ' ' ' ' ' Vyjádření hodnot datového typu Příklad 2: příjmení osoby — Cimrman a) s určením délky b) s oddělovači
43 69 6d 72 6d 61 6e 00 1b 43 'C' 'i' 69 'm' 6d 'r' 72 'm' 6d 61 'a' 6e 'n' 20 ' ' ' ' 20 ' ' 20 '2' 32 37 '7' Porovnání způsobů uložení a) tvar použitý v operační paměti b) tvar použitelný pro vstup nebo výstup
Formát dat • V operační paměti jsou obvykle data ve tvaru vhodném pro zpracování (výpočty, řazení...) • Viditelný tvar (tiskárna, displej, klávesnice...) musí být složen výhradně z čitelných (zobrazitelných) znaků • Formát dat = způsob (tvar) uložení dat v jakékoliv paměti počítače.
07 43 69 6d 72 6d 61 6e 1b 03 4b 6f e8 ed 21 10 4b 72 Popis formátu • Popis formátu, tj. přesný význam jednotlivých bitů (bytů) dat = formátová specifikace • Příklad formátové specifikace: • Jeden byte — délka L • 2. Řetězec ISO 8859-2 (příjmení), L bytů • 3. Jeden byte věk, bin. ... atd.
Druh formátu • Jsou-li všechny prvky formátu složeny výhradně ze zobrazitelných znaků, mezi nimiž jsou použity jako oddělovače nejvýše konce řádků (na konci dat nejvýše 1 znak konce souboru), pak se jedná o textový formát. • Jsou-li alespoň některé prvky formátu řešeny jiným způsobem (řídicími znaky), jedná seo formát netextový, tj. binární.
Vlastnosti formátů Textový formát: • data jsou přímo čitelná člověkem • pro zpracování obvykle nutná změna vyjádření • zpracovatelný velkým množstvím programů • odolnost vůči porušení (ztrátě) informací • nenapadnutelné virem • většinou nižší úspornost zobrazení
Vlastnosti formátů Binární formát: • data nejsou přímo čitelná člověkem • vhodný pro přímé zpracování • nízká přenositelnost, závisí na určitém programu • snadná ztráta všech informací při porušení • napadnutelné virem, lze ukrýt mnoho informací • někdy maximálně úsporný (ale i naopak!)
Souborový formát • Specifikace tvaru dat uložených v souboru • Podle druhu dat lze soubory rozdělit na textové a binární. • Datové soubory programů určitého zaměření mohou být v obojím formátu — mají rozdílné vlastnosti a možnosti použití. To má z hlediska využití daného vybavení zásadní význam.