1 / 60

Statistika

Statistika. Statistika. Se ukvarja s preu č evanjem podatkov. Vsebuje zbiranje, klasificiranje, povzemanje, organiziranje, analiziranje, in interpretiranje podatkov. Dve glavni veji statistike.

andralyn
Download Presentation

Statistika

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statistika

  2. Statistika Se ukvarja spreučevanjem podatkov. Vsebuje zbiranje, klasificiranje, povzemanje, organiziranje, analiziranje, in interpretiranje podatkov.

  3. Dve glavni veji statistike Opisna statistika predstavlja vejo, ki se ukvarja z organiziranjem, povzemanjem in opisovanjem zbirk podatkov. Analitična statistika je veja statistike, ki jemlje vzorce podatkov, da na osnovi njih naredi zaključke (inferenčnost) o populaciji.

  4. Populacija je podatkovna množica, ki je tarča naše pozornosti/interesa. Vzorec je podmnožica podatkov, ki so izbrani iz polulacije.

  5. Dva tipa podatkov Kvantitativni podatki so podatki, ki predstavljajo kvantiteto ali količino nečesa. Kvalitativni podatki so podatki, ki ne vsebujejo nobenih kvantitativnih interpretacij.

  6. Oddelek sistemskih inženirjev relativna kategorija frekvenca frekvenca vrsta število zaposlenih zaposlenih delež učitelji 16 0.8421 skupne službe 3 0.1579 skupaj 19 1.0000

  7. Grafična predstavitev kvalitativnih podatkov • stolpčni graf, poligonski diagram • strukturni krog pogača, kolač

  8. Stolpčni graf Oddelek sistemskih inženirjev število zaposlenih sk.službe učitelji

  9. Pareto diagram(po italijanskem ekonomistu) Oddelek sistemskih inženirjev število zaposlenih učitelji sk. službe

  10. Strukturni krog (pogača, kolač) Oddelek sistemskih inženirjev

  11. Grafična predstavitev kvantitativnih podatkov • zaporedje • steblo-listpredstavitev • histogram

  12. Urejeno zaporedje/ranžirana vrsta Urejeno zaporedje je zapis podatkov v vrsto glede na njihovo numerično velikost (ustreznemu mestu pravimo rang).

  13. Primer zaporedja podatkov (nal. 2.48, str.64) 88 103 113 122 132 92 108 114 124 133 95 109 116 124 133 97 109 116 124 135 97 111 117 128 136 97 111 118 128 138 98 112 119 128 138 98 112 120 131 142 100 112 120 131 146 100 113 122 131 150 • Konstruiraj urejeno zaporedje. • Nariši steblo-list diagram. • Naredi histogram.

  14. Koraki za konstrukcijosteblo-listpredstavitve • Razdeli vsako opazovanje-podatke na dva dela, steblo (stem)inlisti (leaf). 2. Naštej stebla po vrsti v stolpec, tako da začneš pri najmanjšem in končaš pri največjem.

  15. Koraki za konstrukcijosteblo-listpredstavitve • Pojdi skozi vse podatke in postavi liste • za vsak dogodek/meritev v ustrezno • vrstico/steblo. • 4. Naštej vse frekvenceza vsako steblo.

  16. Steblo-listdiagram steblalisti frekvenca relativna frekvenca 08 8 1 2% 09 2 5 7 7 7 8 8 7 14% 10 0 0 3 8 9 9 6 12% 11 1 1 2 2 2 3 3 4 6 6 7 8 9 13 26% 12 0 0 2 2 4 4 4 8 8 8 10 20% 13 1 1 1 2 3 3 5 6 8 8 10 20% 14 2 6 2 4% 15 0 1 2% 50 100%

  17. Koraki po katerih zgradimohistogram • 1. Izračunajrazponpodatkov. • 2. Razdeli razpon na 5 do 20razredovenake širine. • Za vsak razred preštej število vzorcev, • ki padejo v ta razred. • To številoimenujemofrekvenca razred. • Izračunajvserelativne frekvence • razredov.

  18. Dobro/uporabno praviloza določanje števila razredovvhistogramu Število vzorcev število V množici podatkovrazredov manj kot 25 5 ali 6 25 - 50 7 - 14 več kot 50 15 - 20

  19. Frekvenčna porazdelitev interval relativna razred razreda frekvenca frekvenca 1 80 - 90 1 2% 2 90 - 100 7 14% 3 100 - 110 6 12% 4 110 - 120 13 26% 5 120 - 130 10 20% 6 130 - 140 10 20% 7 140 - 150 2 4% 8 150 - 160 1 2% 50 100%

  20. Histogram frekvenca 80 90 100 110 120 130 140 150 160 število delovnih ur

  21. Histogram procent 80 90 100 110 120 130 140 150 160 število delovnih ur

  22. Povprečje populacije: vzorca:

  23. Vzeli smo vzorec osebje na FRI. Zabeležili smo naslednje število otrok: 1 2 2 1 2 5 1 2

  24. Mediana • Da bi prišli do mediane za neko • množici podatkov, naredimo naslednje: • 1. Podatke uredimo po velikosti v • naraščujočem vrstnem redu. • 2. Če je število podatkov liho, • potem je mediana podatek, ki se • nahaja na sredini. • če je število podatkov sodo,je mediana • enaka povprečjudveh podatkov na sredini.

  25. Mediana populacije: t vzorca: m

  26. Modus Modus množice podatkov je tista vrednost, ki se pojavi z največjo frekvenco.

  27. X 1 50 50 99 Y 49 50 50 51

  28. Razpon Razpon je razlika med največjo in najmanjšo meritvijo v množici podatkov.

  29. Varianca populacije: (končne populacije z n meritvami).

  30. Varianca vzorca: (z n meritvami).

  31. Standardni odklon Standardni odklon je pozitivno predznačen kvadratni koren variance.

  32. Empirična pravila Če ima podatkovna množica porazdelitev približno zvonaste oblike (unimodalna oblika – ima en sam vrh), potem veljajo naslednja pravila (angl. rule of thumb), ki jih lahko uporabimo za opispodatkovne množice: 1. Približno 68% vseh meritev leži na razdalji 1 x standardnega odklona od njihovega povprečja.

  33. Empirična pravila • Približno 95% meritev leži na razdalji do 2 x standardnega odklona od njihovega povprečja. 3. Skoraj vse meritve ležijo na razdalji 3 x standardnega odklona od njihovega povprečja.

  34. Centili 100p-ti centil (p je med 0 in 1) je definiran kot število od katerega ima 100p procentov meritev manjšo ali enako numerično vrednost.

  35. Določanje 100p-tega centila Izračunaj vrednosti = p(n+1) in jo zaokroži na najbližje celo število. To število je enakoi. Izmerjena vrednost z i-tim rangom je100p-ti centil.

  36. 25. centil se imenuje tudi 1. kvartil. • 50. centil se imenuje 2. kvartil inmediana. • 75. centil se imenuje tudi 3. kvartil.

  37. Vzorčenje

  38. Analitična statistika je veja statistike, ki se ukvarja z uporabo vzorčnih podatkov, da bi z njimi naredili zaključek (inferenco) o populaciji.

  39. Zakaj vzorčenje? • cena • čas • destruktivno testiranje

  40. Načini vzorčenja • ocena • priročnost • naključno • enostavno • Stratified • grozdno

  41. Enostavno naključno vzorčenje Enostavno naključno vzorčenje je Vzorčenje, pri katerem je vsak član populacije izbran/vključen enako z enako verjetnostjo. 1 2 3

  42. Del tabele 6 stran 1096

  43. Del tabele 6 stran 1096

  44. Razdeljen naključni vzorec Razdeljen naključni vzorec dobimo tako,da razdelimo populacijo na disjunktne množiceoziroma delein nato izberemo enostavne naključne vzorce za vsak del posebej.

  45. Grozdno vzorčenje Grozdno vzorčenje je enostavno naključno vzorčenje skupin ali klustrov/grozdov elementov. Boston Denver Los Angles Atlanta

  46. Populacija 1, 2, 3, 4n = 4

  47. Populacija 1, 2, 3, 4

  48. Populacija 1, 2, 3, 4 n = 4 (velikost populacije)

More Related