1 / 28

Wykład 6

Wykład 6. Standardowy błąd średniej a odchylenie standardowe z próby Odchylenie standardowe z próby s: Służy do oceny zmienności w zbiorze danych Gdy n wzrasta s zbliża się do odchylenia standardowego w populacji  Używane do przewidywań dotyczących poszczególnych obserwacji.

bryant
Download Presentation

Wykład 6

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Wykład 6 • Standardowy błąd średniej a odchylenie standardowe z próby • Odchylenie standardowe z próby s: • Służy do oceny zmienności w zbiorze danych • Gdy n wzrasta s zbliża się do odchylenia standardowego w populacji  • Używane do przewidywań dotyczących poszczególnych obserwacji

  2. Błąd standardowy średniej SE = : • Służy do oceny niepewności związanej z estymacją średniej w populacji • Maleje wraz ze wzrostem n • Używane do przewidywań dotyczących średniej

  3. Jak duża powinna być próba? • Poprzez wybór odpowiedniego n możemy uzyskać PU o odpowiedniej (dowolnie małej) szerokości • Możemy estymować z zadaną precyzją • Przykład: ustal rozmiar próby tak aby 95% PU dla średniej miał szerokość 5.

  4. Załóżmy, że  =10. Wtedy Na ogół nie znamy . Możemy wykonać badanie wstępne (mała próba) aby oszacować .

  5. Założenia (jeszcze raz) • Próba musi być losowa • Każdy element w populacji ma jednakową szansę na wybór • Poszczególne wybory są od siebie niezależne • Jeżeli te założenia nie są spełnione to wzrost n może nie gwarantować zmniejszenia SE.

  6. Przedział ufności dla frakcji w populacji • Estymujemypza pomocą • Chcemy skonstruować przedział ufności dla p • Moglibyśmy skorzystać z rozkładu Bernoulliego ale wymagałoby to uciążliwych rachunków. • Korzystamy z przybliżenia rozkładu Bernoulliego rozkładem normalnym • Gdy Y ma rozkład Bernoulliego (n, p) i n jest duże, wtedy Y ma w przybliżeniu rozkład nornmalny

  7. = Y/n ma średniąi = Zatem ma w przybliżeniu rozkład

  8. Przedział ufności dlap • Klasyczny przedział ufności uzyskuje się zastępując p przez (we wzorze na ). • Klasyczne przedziały ufności zachowują się źle gdy y jest bliskie 0 – wtedy PU często zawiera ujemne wartości. • My będziemy korzystali z przedziału ufności Agrestiego-Coula (patrz np. Brown, Cai i DasGupta, Ann.Stat., 2002) • Centrum przedziału będzie (zamiast ). • Przypomnijmy, że Z/2jest taką liczbą, że • Pr(Z < - Z/2) = Pr(Z > Z/2) = /2 • Dla 95% PU, = 0.05 i Z/2 = 1.96.

  9. Definiujemy SE dlawynosi Dla 95% PU Wstawiamy Z0.025 = 1.96 i dostajemy

  10. Przedział ufności dla p • Skonstruujemy przybliżonyprzedział ufności dla p, z centrum w • Użyjemy kwantyli z rozkładu normalnego Z/2 • Dla 95% PU użyjemy Z0.025 =1.96 • Dla 90% PU użyjemy Z0.05 =1.65; dla 99% PU użyjemy Z0.005=2.58. • przybliżony 95% PUdlapwynosi

  11. Przykład: • Złapano 125 myszyi 6 z nich ma nakrapiane na biało brzuszki • p = frakcja myszek w całej populacji, które mają nakrapiane na biało brzuszki • 95% PU dlap:

  12. 90% PU dlap

  13. Mamy 90% pewnościże frakcja myszek w całej populacji, które mają brzuszki nakrapiane na biało zawiera się w przedziale między a . • Zauważmy, że 90% PUjest niż 95% PU i że przedziały te mają różne środki.

  14. Jak duża powinna być próba ? • Chcemy aby 95% PU miał zadaną długość.Jak ustalić rozmiar próby ? • Uwaga – długość przedziału zależy od , którego nie znamy • Jeżeli mniej więcej wiemy jakie jest p, to możemy tą przybliżoną wartość użyć w równaniu na długość przedziału. • Jeżeli nie mamy żadnych wstępnych informacji to używamyp = 0.5. Ten wybór jest bezpieczny i gwarantuje, że przedział ufności skonstruowany w oparciu o próbę o wyliczonym rozmiarze będzie nie szerszy od założonego.

  15. Przykład • Chcemy aby SE było równe .005 (odpowiedni przedział ufności ma długość około 0.02). • Przypuszczamy, że prawdziwepjest bliskie .05. • Potrzebujemy myszy.

  16. Nie wiemy nic op. • Potrzebujemy myszy.

  17. Dwie niezależne próby • Czasami chcemy porównać wartości pewnej zmiennej w dwóch populacjach. • Przykłady • Grupa zabiegowa i kontrolna • Lekarstwo a placebo • Pacjenci biorący dwa podobne lekarstwa • Mężczyźni a kobiety • Dwie różne linie genetyczne

  18. Rozkład cechy Y w populacji 1 jest N(1, 1): bierzemy próbę o rozmiarze n1, y1, s1, SE1 = Rozkład cechy Y w populacji 2 jest N(2, 2) : bierzemy próbę o rozmiarze n2,,, y2,s2, SE2 =

  19. Jaka jest różnica między średnimi w obu populacjach, 1-2 ? Chcemy wyestymować1 - 2i otrzymać przedział ufności y1-y2jest estymatorem 1-2 Aby skonstruować przedział ufności musimy wyznaczyć SE

  20. Standardowy błąd dla różnicy dwóch średnich • Jak policzyć SE dlay1-y2? • Dwa sposoby: ``nieuśrednianie’’ i ``uśrednianie’’. • gdy n1 = n2obie metody dają te same wyniki • Na ogół będziemy używać ``nieuśrednionego’’ SE. • Metodę ``uśredniania’’ zastosujemy gdy będzie można założyć, że1=2(albo gdy o to poprosi wykładowca). • W obu przypadkach SE liczone jest jako pewna kombinacja s1 and s2

  21. Metoda zwykła (``nieuśrednianie’’) • Liczymy SE1 = i SE2 = osobno w obu próbach.

  22. Liczymy standardowy błąd różnicy średnich:

  23. Metoda ``uśredniania’’ • W obu próbach liczymy SS : SS1 and SS2, i obliczamy „uśrednioną wariancję": sc2 =

  24. ``Uśredniony’’ błąd standardowy wynosi

  25. Podsumowanie obu metod • Metoda ``nieuśredniania’’ • (N)SEy1-y2 = • =

  26. Metoda ``uśredniania’’ • SS1 = (n1–1)s12 = (y-y1)2w próbie 1 • SS2 = (n2–1)s22 = (y-y2)2w próbie 2 • ``uśredniona’’ wariancja sc2 = • (U)SEy1-y2 =

  27. Przykład: • próba1: n1 = 15, y1 = 75, SS1 = 600 • próba 2: n2 = 10, y2 = 55, SS2 = 300

  28. Wyniki z obu metod nie są takie same ale są dość podobne. • Zauważmy, że s1 = 6.55 i s2 = 5.77 (dość podobne).

More Related