1 / 62

Wprowadzenie do statystyki matematycznej Miary tendencji centralnej i rozproszenia.

Wprowadzenie do statystyki matematycznej Miary tendencji centralnej i rozproszenia. dr hab . Dariusz Piwczyński, prof. nadzw. UTP. Statystyka.

varsha
Download Presentation

Wprowadzenie do statystyki matematycznej Miary tendencji centralnej i rozproszenia.

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Wprowadzeniedo statystyki matematycznejMiary tendencji centralnej i rozproszenia. dr hab. Dariusz Piwczyński, prof. nadzw. UTP

  2. Statystyka • Nauka poświęcona metodom badania zjawisk masowych. Polega na systematyzowaniu, obserwowaniu cech ilościowych i jakościowych oraz przedstawieniu wyników w postaci zestawień tabelarycznych, wykresów, posługuje się rachunkiem prawdopodobieństwa.

  3. Po co nam statystyka? • Z ilu pomiarów należy obliczyć średnią?Ilu pomiarów należy użyć, aby mieć do tej średniej zaufanie? Ile winniczków powinniśmy poddać kontroli masy ciała?

  4. Czy istnieje różnica między grubością rogówki przed założeniem szkieł kontaktowych a w 4. tygodniu ich noszenia? http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html

  5. Czy kobiety i mężczyźni w równym stopniu lubią słodycze?

  6. Szeregi czasowe

  7. Dzietność kobiet w latach 1960-2008

  8. Czy istnieje zależność między masą noworodków a oceną w skali APGAR?

  9. Statystyka matematyczna • Dział matematyki zajmujący się metodami wnioskowania o prawach prawdopodobieństwa rządzących danym zjawiskiem na podstawie obserwacji tego zjawiska. • Statystyka matematyczna zajmuje się badaniem własności zbiorów na podstawie znajomości własności ich części.

  10. Populacja generalna • Zbiorowość statystyczna, zbiór dowolnych elementów, nieidentycznych z punktu widzenia badanej cech. Z reguły jest ona dla nas niedostępna w całości do badań, jednak nas interesuje. • Przykład: zbiór wszystkich osobników gatunku Ślimak winniczek, Kret.

  11. Populacja próbna • Podzbiór populacji generalnej, który podlega bezpośrednio badaniu ze względu na rozpatrywaną cechę, co pozwala na wyciągnięcie wniosków o kształtowaniu się wartości cechy w całej populacji generalnej.

  12. Próba powinna być reprezentatywna! • Powinna w jak najlepszy sposób oddawać strukturę populacji. • Najprostszym przykładem takiej próby jest próba losowa prosta, otrzymywana jest, gdy każdy element populacji ma taką samą szansę dostania się do próby.

  13. Zmienna losowa • Cecha, a wartości tej cechy poszczególnych elementów populacji to realizacja zmiennej. • Zmienna losowa może przyjmować z określonym prawdopodobieństwem każdą z wartości należących do wyszczególnionego zbioru, np. rzut kostką do gry – zmienna losowa, czyli cecha może przyjmować dowolną wartość ze zbioru od 1 do 6. • Każdej wartości zmiennej losowej możemy przyporządkować jej prawdopodobieństwo wystąpienia.

  14. Cechy • ilościowe • jakościowe

  15. Cecha ilościowa • Wynik zjawiska lub procesu, który daje się wyrazić ilościowo (za pomocą liczb). • Cechy ilościowe oznaczane są za pomocą liter: X, Y, Z.

  16. Cechy ilościowe, skokowe • tzw. dyskretne. W badaniach biologicznych cechy skokowe wyrażane są za pomocą liczb naturalnych. Na ogół przyjmują one kilka lub kilkanaście wartości liczbowych. Ich modelami matematycznymi są zmienne losowe skokowe. Przykład – liczba urodzonych dzieci.

  17. Cechy ilościowe, ciągłe • Przyjmują wszystkie wartości z pewnego przedziału liczbowego liczb rzeczywistych. Ich modelami matematycznymi są zmienne losowe ciągłe, często ich rozkład prawdopodobieństwa jest zbliżony do rozkładu normalnego.

  18. Cecha jakościowa • Cechy, których nie możemy zapisać w postaci liczby, np. kolor oczu.

  19. Zmienne

  20. Zanim rozpoczniemy analizę statystyczną konieczne jest ustalenie skali, w jakiej wyrażana jest nasza cecha!!!

  21. Skale pomiaru, nominalna • nominalna– porządek właściwie dowolny, np.: rasa zwierzęcia, siedlisko, forma spędzania wolnego czasu  • nominalna dychotomiczna, np. płeć, stan zdrowia („CHORY, ZDROWY”)

  22. Skale pomiaru, porządkowa • Wartościom cechy można przypisać rangi. Musi zatem istnieć możliwość logicznego uporządkowania wartości zmiennej.Przykład:wykształcenie osoby (podstawowe, zawodowe, średnie, wyższe), stan finansów (zły, średni, dobry, bardzo dobry)

  23. Skale pomiaru, przedziałowa • pozwala uporządkować wartości zmiennej, • zakłada się, że dotyczy zbioru liczb rzeczywistych.

  24. Rozkład zmiennej losowej • Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

  25. Doświadczenie • Postępowanie, które służy weryfikacji istniejącego stanu wiedzy lub pozyskaniu nowych informacji. Polega ono na rozpoczęciu i obserwowaniu pewnego zjawiska w warunkach kontrolowanych.

  26. Jednostka doświadczalna, • Roślina lub zwierzę poddane działaniu danego poziomu czynnika doświadczalnegoiw odniesieniu, do której prowadzimy obserwację cechy ilościowej, będącej odpowiedzią na działanie czynnika.

  27. Czynnik doświadczalny • Rodzaj zmiennej, która jest kontrolowanaw doświadczeniu i która jest przyczyną kształtowania się cech zjawisk dotyczących głównie zwierząt, roślin czy środowiska,w którym bytują.

  28. Poziom czynnika doświadczalnego • Określone przez badacza warianty czynnika, w ramach których zamierza się prowadzić obserwacje nad kształtowaniem się interesujących nas cech. Gatunek: • Carabusauratus • Carabuscancellatus • Carabusgranulatus • Carabushortensis • Carabusviolaceus

  29. Doświadczenia • jednoczynnikowe W jednym czasie analizujemy wpływ jednego czynnika na cechy ilościowe roślin lub zwierząt, • wieloczynnikowe W jednym czasie badamy wpływ wielu czynników na cechy ilościowe roślin lub zwierząt.

  30. Statystyczny opis zmiennej losowej

  31. Statystyki • Pewne funkcje wartości pomiarowych służące do wyznaczenia przybliżonych wartości parametrów statystycznych. Należy do nich, m. in.: mediana, średnia arytmetyczna. • Statystyki dotyczą populacji próbnej. • Oznaczane są literami łacińskimi. • Statystyka elementarna zajmuje się obliczaniem statystyk.

  32. Parametry • Parametry charakteryzują rozkład badanej cechyw populacji generalnej. • Dotyczą populacji generalnej! • Oznaczane są literami greckimi , 

  33. Miary położenia i zmienności, podział

  34. Podział miar statystycznych, miary asymetrii i koncentracji • Asymetria rozkładu: • skośność • Koncentracja rozkładu: • kurtoza

  35. Miary położenia • KLASYCZNEpozwalają określić, gdzie w zbiorze wartości liczbowych znajdują się wartości badanej cechy, tym samym pozwalają na umiejscowienie rozkładu cechy.

  36. Średnia arytmetyczna gdzie: • N – liczba wszystkich jednostek, • xi – wartość cechy u i-tej jednostki.

  37. Średnia arytmetyczna ważona • Stosowana wtedy, gdy poszczególnym obserwacjom przypisujemy wagi związane z ich znaczeniem. wi– wagi przypisane poszczególnym obserwacjom. Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy egzaminowi wagę 3, a kolokwium wagę 1.

  38. Własności średniej arytmetycznej • Jest to taka wartość zmiennej, która podstawiona na miejsce wszystkich poszczególnych wartości nie zmieni ich sumy • Suma odchyleń poszczególnych wartości od średniej arytmetycznej jest równa zero. • Suma kwadratów odchyleń poszczególnych wartości zmiennej od średniej arytmetycznej jest najmniejsza w porównaniu z sumami kwadratów odchyleń od jakiejkolwiek innej liczby w szeregu.

  39. Średnia ważona liczebnościami (dane przedstawione w formie szeregu rozdzielczego) gdzie: N – liczba wszystkich jednostek, ni - liczba jednostek posiadających i-tą wartość cechy, k – liczba klas, xi – i-ta wartość cechy

  40. Średnia ważona

  41. Szereg rozdzielczy • zawiera pomiary pogrupowane na klasy.W ramach szeregu rozdzielczego tworzone są przedziały klasowe oraz zliczana jest liczba pomiarów w każdym przedziale klasowym.

  42. Szereg rozdzielczy

  43. Średnia harmoniczna gdzie: • xi – wartość cechy, • N – liczebność odnosząca się do wartości cechy xi. • Średnia harmoniczna jest odwrotnością średniej arytmetycznej z odwrotności elementów próby! • Stosowana m.in. w analizie wariancji układów nieortogonalnych (nieproporcjonalnych - przy nierównej ilości osobników w grupach). Nie można jej obliczyć, gdy jakaś wartość cechy równa się „0” lub jest ujemna. • W badaniach, w których obserwowana jest wydajność w czasie – rozkład cechy odbiega od symetrycznego, ma przebieg hiperboliczny.

  44. Średnia harmoniczna. Przykład (Dobek, Szwaczkowski) • W gospodarstwie produkującym jaja stwierdzono, że pierwsze 1000 jaj pozyskiwano z prędkością 120 jaj/tydzień, drugi 1000 z prędkością 150 jaj/tydzień, a ostatni 1000 z prędkością 100 jaj/tydzień. Jaka była średnia wydajność tygodniowa w okresie, w którym uzyskano 3000 jaj?

  45. Średnia geometryczna • Stosowana, gdy jedna z wartości skrajnych zmiennej bardzo różni się od pozostałych (duże rozproszenie wartości skrajnych), w takim przypadku średnia geometryczna bardziej prawidłowo scharakteryzuje położenie danej cechy w szeregu liczbowym niż średnia arytmetyczna. • Miara popularna w badaniach mikrobiologicznych, zmienne posiadają rozkłady prawostronne.

  46. Arytmetyczna, geometryczna i harmoniczna

  47. Obliczenie średniej geometrycznej • jest równoznaczne z obliczeniem średniej arytmetycznej: a następnie powrót do oryginalnej skali pomiaru poprzez transformację: co jest równoznaczne z obliczeniem średniej geometrycznej

  48. Miary położenia • POZYCYJNEwskazują wartość cechy, która odgrywa w szeregu szczególną rolę, np. dzieli szereg na dwie połowy. Punktem wyjścia do ich określenia jest uporządkowanie szeregu liczbowego, konieczna jest przy tym znajomość liczebności.

  49. Dominanta (Mo) • Zwana wartością szczytowa, modą, wartością modalną. • Jest to taka wartość zmiennej, która występuje w populacji największą ilość razy. Jest najbardziej typowa dla danego zjawiska. Jednak nie należy jej obliczać, gdy rozkład danej cechy nie posiada jednego, wyraźnie zaznaczonego maksimum liczebności. Wartość modalna wyznacza szczyt krzywej liczebności. Pozwala scharakteryzować populację pod względem jej typowości.

  50. Kwartyle (kwantyle) (Q1,Q2,Q3) • Są to takie wartości cechy, które pozwalają podzielić uporządkowany szereg liczbowy na 4 części. • Kwartyl drugi dzieli szereg na połowy, zwany jest też medianą. Jeśli liczebności ćwiartek są liczbami parzystymi, to wartość kwartyli obliczamy jako średnią arytmetyczną z wartości kończących i rozpoczynających kolejne ćwiartki. W szeregu nieparzystym medianę stanowi środkowy wyraz szeregu.

More Related