1 / 54

EXPLORATORNÍ STATISTIKA

EXPLORATORNÍ STATISTIKA. Co je to statistika?. Číselné údaje o hromadných jevech . Sběr, zpracování a vyhodnocování stat. údajů. Teoretická disciplína, která se zabývá metodami sloužícími k popisu odhalování zákonitosti při působení podstatných činitelů na hromadné jevy. Základní pojmy.

lowell
Download Presentation

EXPLORATORNÍ STATISTIKA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. EXPLORATORNÍ STATISTIKA

  2. Co je to statistika? • Číselné údaje o hromadných jevech. • Sběr, zpracování a vyhodnocování stat. údajů. • Teoretická disciplína, která se zabývá metodami sloužícími k popisu odhalování zákonitosti při působení podstatných činitelů na hromadné jevy.

  3. Základní pojmy Hromadný jev - jev vyskytující se v masovém měřítku u velkého počtu prvků (statistických jednotek). Vlastnosti statistických jednotek vyjadřují statistické znaky (proměnné).

  4. Typy proměnných

  5. Kategoriální proměnná nominální (nemá smysl uspořádání)

  6. Číselné charakteristiky + Modus

  7. Grafické znázornění • Histogram – sloupcový graf (bar chart)

  8. Co lze vyčíst z histogramu Doc. Ing. Milan Hutyra, CSc. : Managment jakosti (CZ.O4.01.3/3.2.15.2/0326 E-learningové prvky pro podporu výuky odborných a technických předmětů)

  9. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)

  10. Příklad Minulý týden jsme zpracovali anketu týkající se názoru na zavedení školného na vysokých školách. Výsledky prezentuje následující graf:

  11. Příklad Níže uvedená data představují částečný výsledek zaznamenaný při průzkumu zatížení jedné z ostravských křižovatek, a to barvu projíždějících automobilů. Data vyhodnoťte a graficky znázorněte.

  12. Řešení

  13. Kategoriální proměnná ordinální (má smysl uspořádání)

  14. Číselné charakteristiky + Modus

  15. Grafické znázornění • Histogram – sloupcový graf (bar chart)

  16. Grafické znázornění B)Výsečový graf – koláčový graf (pie chart)

  17. Grafické znázornění • Polygon kumulativních četností • (Galtonova ogiva, S-křivka)

  18. Grafické znázornění D) Paretův graf

  19. Paretův graf Doc. Ing. Milan Hutyra, CSc. : Managment jakosti (CZ.O4.01.3/3.2.15.2/0326 E-learningové prvky pro podporu výuky odborných a technických předmětů)

  20. Příklad Následující data představují velikosti triček prodaných při výprodeji firmy TRIKO. S, M, L, S, M, L, XL, XL, M, XL, XL, L, M, S, M, L, L, XL, XL, XL, L, M • Data vyhodnoťte a graficky znázorněte. • Určete kolik procent lidí si koupilo tričko velikosti nejvýše L.

  21. Řešení

  22. Kvantitativní (numerická) proměnná

  23. Číselné charakteristiky • Míry polohy • Míry variability

  24. Míry polohy

  25. Aritmetický průměr

  26. Vlastnosti aritmet. průměru neboli: Součet odchylek od průměru je 0. neboli: Přičteme-li ke každé hodnotě dat. souboru konstantu, průměr se o tuto konstantu změní. 3. neboli: Vynásobíme-li každou hodnotu dat. souboru konstantou, průměr se změní také s násobkem této konstanty.

  27. Průměr není rezistentní vůči odlehlým pozorováním !!!!

  28. Kvantily 100p %-ní kvantilxp odděluje 100p% menších hodnot od zbytku souboru (100p% hodnot datového souboru je menších než toto číslo.)

  29. Jak se kvantily určují • Výběrový soubor uspořádáme podle velikosti • Jednotlivým hodnotám proměnné přiřadíme pořadí, a to tak, že nejmenší hodnota bude mít pořadí 1 a nejvyšší hodnota pořadí n (rozsah souboru) • 100p%- ní kvantil je roven hodnotě proměnné s pořadím zp, kde: , přičemž zp zaokrouhlujeme na celá čísla !!!!!

  30. Význačné kvantily • Kvartily Dolní kvartil x0,25 Medián x0,5 Horní kvartil x0,75 • Decily– x0,1; x0,2; ... ; x0,9 • Percentily – x0,01; x0,02; …; x0,99 • Minimum xmin a Maximum xmax

  31. Příklad • Následující data představují věk hudebníků vystupujících na přehlídce dechových orchestrů. Proměnnou věk považujte za spojitou. Určete: • Medián • Dolní kvartil • Horní kvartil • První decil

  32. Interkvartilové rozpětí Užití: např. při identifikaci odlehlých pozorování

  33. MAD • Medián absolutních odchylek od mediánu • Pomocná proměnná sloužící k identifikaci odlehlých pozorování

  34. PříkladPro data z předcházejícího příkladu určete MAD. MAD = 8

  35. Identifikace odlehlých pozorování • 1,5 násobek IQR • Z-souřadnice • Mediánová souřadnice

  36. PříkladV datech z předcházejícího příkladu identifikujte odlehlá pozorování: Vnitřní hradby a) Pomocí IQR Odlehlé pozorování: 82

  37. PříkladV datech z předcházejícího příkladu identifikujte odlehlá pozorování: b) Pomocí z-souřadnice, resp. med.-souřadnice

  38. Shorth nejkratší interval, v němž leží alespoň 50% hodnot proměnné

  39. PříkladPro data z předcházejícího příkladu určete shorth. Shorth=

  40. Modus střed shorthu

  41. Příklad:Pro data z předcházejícího příkladu určete modus. Shorth = Modus: Modus = 38,5 let, tj. typický věk hudebníka vystupujícího na přehlídce dech. orchestrů je 38,5 let.

  42. Míry variability

  43. Výběrový rozptyl

  44. Vlastnosti výběrového rozptylu Výběrový rozptyl konstanty je roven 0, neboli: jsou-li všechny hodnoty proměnné stejné, soubor má nulovou rozptýlenost. neboli: přičteme-li ke všem hodnotám proměnné konstantu, výběrový rozptyl se nezmění. neboli: vynásobíme-li všechny hodnoty proměnné konstantou, výběrový rozptyl se zvětší kvadrátem této konstanty (b2 krát)

  45. Nevýhoda výběrového rozptylu Rozměr rozptylu charakteristiky je druhou mocninou rozměru proměnné.

  46. Výběrová směrodatná odchylka

  47. Nevýhody výb. směr. odchylky a výb. rozptylu Neumožňují srovnání rozptylu proměnných, které mají různé rozměry (jednotky).

  48. Variační koeficient (Směrodatná odchylka v procentech aritmetického průměru) • - Čím nižší var. koeficient, tím homogennější soubor. • - Vx>50% značí silně rozptýlený soubor.

  49. a=0 a>0 a<0 Výběrová šikmost

  50. Jaký je vztah mezi šikmostí, mediánem a průměrem? Úkoly: V appletu generujte histogram odpovídající dat. souboru symetrickému (b=0), pozitivně zešikmenému (b>0) a negativně zešikmenému (b<0) a sledujte: • Průměrnou odchylku od průměru a průměrnou odchylku od mediánu. • Vztah mezi průměrem a mediánem. David M. Lane – RiceVirtualLab in Statistics, MeanandMedian

More Related