240 likes | 328 Views
„ EU peníze školám“ Projekt DIGIT – digitalizace výuky na ISŠTE Sokolov reg.č. CZ.1.07/1.5.00/34.0496. Tento výukový materiál je plně v souladu s Autorským zákonem (jsou zde dodržována všechna autorská práva). Pokud není uvedeno jinak, autorem textů a obrázků je Ing. Josef Bulka.
E N D
„EU peníze školám“ Projekt DIGIT – digitalizace výuky na ISŠTE Sokolov reg.č. CZ.1.07/1.5.00/34.0496
Tento výukový materiál je plně v souladu s Autorským zákonem (jsou zde dodržována všechna autorská práva). Pokud není uvedeno jinak, autorem textů a obrázků je Ing. Josef Bulka.
Bezeztrátová a ztrátová komprese dat Ing. Bulka Josef
Základní pojmy • Kód, kódování - je způsob reprezentace dat, informací a hodnot při jejich uložení v paměti, v souboru, při přenosu po síti atd. • Znak - je základní jednotka dat. V teorii komprese se pojmem znak označuje nejen znak textu, ale obecně libovolná hodnota uložená na jednom bytu. • Text - tento pojem se v teorii komprese používá pro označení jakýchkoliv výchozích dat, která jsou komprimována. Nemusí se jednat o textovou informaci.
Kompresní poměr - je poměr délky zkomprimovaných dat vzhledem k délce původních dat. Kompresní poměr se často vyjadřuje v procentech. • Bezeztrátová komprese - je způsob komprese, při které nedochází ke ztrátě informace. Přidekompresi dostáváme stejná data, jaká jsme komprimovali. • Ztrátová komprese - je způsob komprese, při které jsou výchozí hodnoty pozměněny neboněkteré méně významné hodnoty jsou zanedbány, aby se dosáhlo vyššího kompresního poměru. Dekompresí dostáváme v tomto případě poněkud jiné hodnoty, než byly původně komprimovány.
Typy kompresních metod Statistické metody komprese - jsou založeny na pravděpodobnosti, s jakou se vyskytují jednotlivé znaky v textu. Jednoduchý příklad statistické komprese byl uveden v předchozí části. Slovníkové metody komprese - principem těchto metod je vyhledání opakujících se částí textu. Do zkomprimovaného textu se uloží jen první výskyt takové části. Všechny další výskyty jsou nahrazeny odkazem na předchozí výskyt. Komprese nepohyblivého obrazu Komprese pohyblivého obrazu Komprese zvuku – obsahuje popis principů používaných při ztrátové kompresi zvuku.
Příklad statistické komprese • Huffmanovo kódování • Patří k nejstarším kompresním metodám (pochází z roku 1952). • Jde o prefixový kód vytvořený podle jednoduché strategie. • Znakům, které se v textu vyskytují často (s vysokou četností), se přiděluje kód s malým počtem bitů a naopak znaky, které se v textu vyskytují zřídka(s malou četností), se kódují delším kódem. • Nejjednodušší postup sestavení Huffmanova kódu je pomocí binárního stromu.
Příklad slovníkové komprese • Metoda LZW. • Tato vychází z myšlenky, že není efektivní kódování znaku za frází a kóduje jen fráze. • Protože metoda LZW nemůže kódovat samostatné znaky, ale jen nalezené fráze, nemůže být slovník na začátku komprese prázdný. • Je nutné ho inicializovat všemi frázemi délky 1, tj. je nutné do něho zařadit všechny znaky, které se mohou vyskytnout v textu.
Příklad bezeztrátové komprese obrazu • RLE (Run LengthEncoding). • Úplně nejjednodušší kompresní technika. Tato technika za sebou více následujících stejných hodnot, kóduje do dvojice počet a hodnota.Je použitá v obrazovém formátu PCX. • LZW • Poměrně často používaná kompresní technika v kompresi obrazu, je obsažena ve formátech GIF a TIFF. Příklad RLE Komprese Vstup: AAAABBCDDDDABDVýstup: 4A2B1C4D1A1B1D
Příklad ztrátové komprese obrazu • JPEG (Joint PhotographicExpertsGroup) • V současné době patří mezi nejvíce používané komprese u obrázků, je vhodná pro komprimaci fotek, nevhodná pro např. technické výkresy (čárové výkresy) – dochází k viditelnému rozmazání. • Části obrazu se transformují do frekvenční oblasti (výsledkem je matice „frekvenčních“ koeficientů) z matice koeficientů se odstraní koeficienty odpovídající vyšším frekvencím (rychlejší změny jasu – např. hrany v obraze), zbývající koeficienty se vhodným způsobem zkomprimují.
Schéma komprese obrazu a zvuku pomocí JPEG metody Komprese obrazu a zvuku Dekomprese obrazu a zvuku
Ukázka komprese JPEG na fotografii Lenny Obrázek Lenny uložený do JPEGu s faktorem kvality rovným 100 %, velikost souboru je 43 833 bytů. Obrázek Lenny uložený do JPEGu s faktorem kvality rovným 40 %, velikost souboru je 7 068 bytů.
Komprese pohyblivého obrazu – MPEG • Výhody použití digitálního obrazu ve srovnání s jeho analogovou formou jsou značné. Obraz není zkreslen při přenosu, jeho kvalita se nezhoršuje při běžném opotřebení nosiče, na kterém je uložen. Hlavní je skutečnost, že digitální obraz reprezentuje velký objem dat.
Příklady standardů MPEG • Standard MPEG-2 • Má rozlišení obrazu 720 × 576, 30 snímků/sec, což odpovídá úrovni standardní televize. Tento standard počítá i s přenosem televizního signálu s vysokým rozlišením 1440 × 1152, 60 snímků/s pro současný televizní formát 4:3 a 1920 × 1152, 60 snímků/sec pro široký formát 16:9. • Standard MPEG4 (H.264 ) • Standard určený pro kompresi audiovizuálního signálu představený v roce 1998 jako nástupce starších standardů. MPEG-4 se využívá zejména v oblasti digitální televize. Specifickou součástí standardu MPEG-4 je digitální videokodek H.264 (MPEG-4 AVC).
Ztrátová komprese zvuku • Ztrátová komprese zvuku je vedle komprese obrazu součástí standardů a MPEG-2, MPEG4, které byly výše krátce popsány. • V nich jsou specifikovány tři postupy kódování zvuku, které se vzájemně liší složitostí a dosahovaným kompresním poměrem. • Jsou označovány jako úroveň 1 až 3, přičemž úroveň 1 je nejjednodušší a má nejnižší kompresní poměr, zatímco úroveň 3 je nejsložitější a dosahuje nejlepší kompresní poměr, jak ukazuje následující tabulka:
Nejrozšířenější je úroveň 3, která je známá pod názvem MP3. • Zvuk získáváme z běžných zdrojů v analogové podobě. Nejprve je nutné ho převést do digitální podoby. To se provádí vzorkováním. • Aby digitalizací nedošlo ke zkreslení zvuku, musí měření amplitudy probíhat s frekvencí aspoň dvakrát vyšší, než je frekvenční rozsah měřeného signálu (Nyquistovo kritérium). • Jestliže uvažujeme slyšitelnou oblast zvuku jako 20 Hz až 20 kHz, musí vzorkovací kmitočet být nejméně 40 kHz.
Pomocí techniky RLE (Run LengthEncoding) zkuste provést ztrátovou kompresi data souboru, který obsahuje následující data v hexadecimální soustavě: AAABBB2457EEH444BB22FFFF333CCDDFFF666289 Na Internetu najděte freewarový program, který povede kompresi hudební skladby ze zvukového CD, kde jsou data uložena ve formátu CDA (nekomprimovaná zvuková data vzorkovaná frekvencí 44,1 KHz), do formátu WAW a MP3. Porovnejte velikost jednotlivých souborů a popište, v čem a proč.
Kód – kódování: • Způsob reprezentace dat, informací a hodnot. • Označení základní jednotky dat. • Označení kompresní jednotky informace. • Statistická metoda komprese dat je založena: • Na vyhledání opakujících se částí textu. • Na pravděpodobnosti, s jakou se vyskytují jednotlivé znaky. • Výpočtu, kdy se budou jednotlivé znaky opět vyskytovat.
O bezeztrátové kompresi hovoříme, pokud: • Významné hodnoty jsou zanedbány a dekompresí dostáváme poněkud jiné hodnoty. • Při dekompresi dat dostáváme stejná data, jaká jsme komprimovali. • Jedná se o označení kompresní jednotky informace. • Pro kompresi televizního signálu použijeme standard? • JPEG • TIFF • MPEG2
Vzorkovací kmitočet při kompresi hudebního signálu musí být: • Nejméně 6 KHz • Nejméně 41 KHz • Nejméně 128 KHz • Kompresní poměr při použití MP3 je: • 1:2 až 1:6 • 1:10 až 1:12 • 1:20 až 1:30
Použité odkazy a literatura: http://www.wikipedia.cz Horst Jansen – Heinrich Rotter a kolektiv – Informační a komunikační technika, Europa – Sobotáles, Praha 2004 NAVRÁTIL, P. S počítačem nejen k maturitě – 1. díl. Kralice na Hané: Computer Media, 2004.5. vydání. 175 s. ISBN: 80-86686-19-1 Klimeš, Skalka, Lovászová, Švec -Informatika pro maturanty a zájemce o studium na vysokých školách. ISBN978-80-89132-71-3
http://phoenix.inf.upol.cz/esf/ucebni/komprese.pdf http://radekmika.cz/komprese/jednoduche-metody-komprese.html http://www.jpeg.org/apps/index.html http://technet.idnes.cz http://www.wav-mp3.com/convert-cda-to-mp3.htm