1 / 12

Třídění dat

Třídění dat. OA a VOŠ Příbram. Třídění rozdělení jednotek souboru do takových skupin, aby co nejlépe vynikly charakteristické vlastnosti zkoumaných jevů uspořádání údajů do přehledné formy včetně jejich zhuštění jednostupňové – podle obměn jednoho znaku

tab
Download Presentation

Třídění dat

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Tříděnídat OA a VOŠ Příbram

  2. Třídění • rozdělení jednotek souboru do takových skupin, aby co nejlépe vynikly charakteristické vlastnosti zkoumaných jevů • uspořádání údajů do přehledné formy včetně jejich zhuštění • jednostupňové – podle obměn jednoho znaku • vícestupňové – podle obměn více znaků najednou

  3. Prosté rozdělení četností • nespojité statistické znaky • údaje uspořádáme do rostoucí posloupnosti a každé hodnotě znaku přiřadíme počty (četnosti) příslušných statistických jednotek • Četnosti lze vyjádřit různým způsobem: • absolutní četnostni – skutečný počet jednotek; udává, kolikrát se která hodnota znaku v souboru vyskytuje; jejich součet je roven rozsahu souboru

  4. relativní četnostpi – pro porovnávání různých rozdělení, nejčastěji se vyjadřuje v % • kumulativní četnost – absolutní (kni), relativní (kpi) • podávají informaci o tom, kolik jednotek souboru, resp. jaká poměrná část souboru má variantu znaku menší nebo rovnou určité dané obměně • kn1 = n1 kn2 = n1 + n2 kn33 = n1 + n2 + n3

  5. Intervalové rozdělení četností znak spojitý nebo diskrétní s velkým počtem obměn • Je nutno řídit se několika pravidly: • Počet intervalů musí být takový, aby vynikly podstatné a charakteristické rysy souboru • stanovení počtu intervalů • nebo dle Sturgesovo pravidla

  6. délka intervalu – spíše stejná • R = variační rozpětí (R = xmax – xmin) • - extrémní hodnota – otevřené intervaly • Při zařazování jednotlivých hodnot znaku do intervalů musí být jednoznačně určeno, kam kterou jednotku zařadit.

  7. Příklad Máme k dispozici údaje o výdajích (Kč) vybraných domácností. Uvedená data je potřeba setřídit do přehlednější formy. Sice jde o znak diskrétní, ale nabývá velkého počtu obměn. Proto bude vhodné uspořádat daný soubor do intervalového rozdělení četností.

  8. Nejprve určíme počet intervalů. V případě použití Sturgesova pravidla je počet intervalů zhruba stejný. Zde je potřeba zvážit, jaký počet intervalů požadujeme. Vhodnější bude zvolení 6 intervalů. Dále určíme šířku intervalu.

  9. Vzhledem k hodnotě, která vychází, je optimální zaokrouhlovat na celá čísla, v tomto případě na hodnotu 2000. Následně je důležité správně určit počátek prvního intervalu (blízko nejmenší hodnoty).

  10. Určenístředuintervalu Je možné určit jako průměr dolní a horní meze v rámci jednoho intervalu nebo v případě stejně širokých intervalů jako průměr dvou po sobě jdoucích mezí. Univerzální způsob Použitelné pouze tehdy, jestliže všechny intervaly mají stejnou šířku.

  11. Základní pojmy Tabulka rozdělení četností – příklad

More Related