1 / 45

Wykład 13 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn)

Wykład 13 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn). Uzupełniamy tabelkę wartościami oczekiwanymi przy Ho. Czy w badanej populacji muszek kolor oczu i kształt skrzydła są zmiennymi niezależnymi ? p 1 = Pr( czerwone oczy | normalne skrzydła ),

taini
Download Presentation

Wykład 13 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Wykład 13 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn)

  2. Uzupełniamy tabelkę wartościami oczekiwanymi przy Ho

  3. Czy w badanej populacji muszek kolor oczu i kształt skrzydła są zmiennymi niezależnymi ? p1= Pr(czerwone oczy|normalne skrzydła), p2= Pr(czerwone oczy|mniejsze skrzydła), H0: p1 = p2 ; kolor oczu i rozmiar skrzydła są niezależne HA: p1p2 ; kolor oczu i rozmiar skrzydła są zmiennymi zależnymi

  4. Zastosujemy test chi-kwadrat dla niezależności 2s =  (O-E)2/E ma przy H0 rozkład 21. Testujemy na poziomie = 0.05; odrzucamy gdy 2s > 3.84 = 2critical X2 = Wniosek

  5. Nie możemy jednak powiedzieć, że czerwone oczy powodują, że muszka ma normalne skrzydła. Prawidłowy wniosek to obserwacja, że kolor oczu i kształt skrzydła są zmiennymi zależnymi albo, że u muszek z normalnymi skrzydłami częściej występują czerwone oczy niż u muszek z mniejszymi skrzydłami. Nie możemy formułować wniosku przyczynowego ponieważ nie kontrolujemy analizowanych zmiennych a jedynie je obserwujemy. [W tym wypadku zależność wynika z faktu, że geny determinujące kształt oczu i rozmiar skrzydła leżą na jednym chromosomie.]

  6. Tablice wielodzielcze: rk • r rzędów, k kolumn: rk • Analiza analogiczna do tablic 22. • Przykład: 34 (r = 3 ; k = 4 )

  7. Czy kolor oczu i włosów są zmiennymi zależnymi? H0: Kolor włosów i kolor oczu to zmienne niezależne HA: Kolor oczu i kolor włosów to zmienne zależne Wykonujemy test niezależności chi-kwadrat 2 = (O-E)2/E ma przy H0 rozkład 26. {df = (r-1)(k-1) = (2)(3) = 6}

  8. Testujemy na poziomie = .0005. Wartość krytyczna 26 = . • 2s = • Wniosek • Tablica wartości krytycznych z książki ``Introduction to the Practice of Statistics’’, D.S. Moore, G. P. McCabe

  9. Estymator dla Pr(Oczy niebieskie) = • Estymatordla Pr(Oczy niebieskie| włosy brązowe) = • Estymator dla Pr(Oczy niebieskie|czarne włosy) = • Estymator dla Pr(Oczy niebieskie|jasne włosy) = • Estymator dla Pr(Oczy niebieskie| rude włosy) =

  10. Testowanie niezależności odpowiada testowaniu, że odpowiednie p-stwa warunkowe są te same w każdej klasie. Gdy testujemy niezależność w dużych tabelach to na ogół nie zapisujemy H0za pomocą p-stw warunkowych Przypomnienie założeń: Próby losowe Obserwacje niezależne "E" w każdej komórce musi być  5

  11. Dokładny test Fishera • Stosujemy dla małych rozmiarów prób • Przykład : ECMO • ECMO to ``nowa’’ procedura służąca ratowaniu noworodków cierpiących na poważne zaburzenia pracy układu oddechowego. • CMT – konwencjonalna terapia

  12. H0: wynik nie zależy od zabiegu • Znajdziemy warunkowe p-stwo zaobserwowanych wyników przy ustalonych ``sumach’’ w rzędach i kolumnach (przy H0). • Przypomnijmysymbol Newtona - • – na tyle sposobów można wybrać zbiór k elementowy ze zbioru n elementowego

  13. Na ile sposobów dokładnie 4 dzieci spośród 5 z tych które ``miały’’ umrzeć mogło przypadkowo zostać przyporządkowanych do grupy CMT – • Na ile sposobów dokładnie 6 dzieci spośród 34 z tych które ``miały’’ przeżyć mogło przypadkowo zostać przyporządkowanych do grupy CMT – • Na ile sposobów 10 dzieci spośród 39 mogło przypadkowo zostać przyporządkowanych do grupy CMT –

  14. HA: ECMO jest lepsza niż CMT • Przypadki bardziej ekstremalne w kierunku alternatywy • # liczba śmierci = CMT:4, ECMO:1  CMT:5, ECMO:0 • P-wartość = • Wniosek

  15. Przedziały ufności dla różnicy między p-stwami warunkowymi • W tabelach 2x2, wyrażamy H0jakop1 = p2 • Przykład z lekarstwem • p1 = Pr(poprawa | lekarstwo), p2 = Pr(poprawa | placebo).

  16. Przybliżony 95% PUdla p1-p2wynosi W przykładzie z lekarstwami

  17. PUdla p1-p2wynosi Mamy 95% pewności, że p-stwo poprawy po zażyciu lekarstwa jest większe od p-stwa poprawy po zażyciu placebo o co najmniej i nie więcej niż o W ogólności do konstrukcji przedziałów ufności na poziomie (1–) stosujemy Z/2(zamiast 1.96) .

  18. Regresja liniowa • Dane: pary obserwacji (X, Y), • (x1, y1), (x2, y2), …, (xn, yn) • Przykłady: X = stężenie, Y = szybkość reakcji • X = dawka, Y =odpowiedź • X = waga, Y = wzrost • X = wyniki z pierwszego kolokwium, • Y = wyniki z drugiego kolokwium

  19. Najczęściej mamy jedną losową próbę i obserwujemy dwie zmienne • Czasami jedną z tych zmiennych kontrolujemy – wówczas zwykle nazywamy ją X a ``odpowiedź’’ oznaczamy jako Y

  20. Przykład : n = 5

  21. Wartości brzegowe: Jak zwykle średniex = x/n, y = y/n Sumy kwadratów: SSX = (x-x)2 = 28 = (n-1) sX2 , SSY = (y-y)2 = 26 = (n-1) sY2 Sx= Sy=

  22. Nowa wielkość: "suma iloczynów“ SPXY = (x –x)(y –y) = Mierzy stopień korelacji między X i Y Próbkowy współczynnik korelacji Gdy r>0 wtedy ``najlepsza’’ prosta opisująca relację między X i Y odpowiada funkcji rosnącej a gdy r<0 funkcji malejącej. ,

  23. r jest estymatorem współczynnika korelacji w populacji • Gdy zmienne są niezależne wtedy ρ=0 (ale nie zawsze na odwrót). • Jeżeli ρ=1 to Y=aX+b, a>0. • Jeżeli ρ=-1 to Y=aX+b, a<0.

  24. r=1 wtedy i tylko wtedy gdy wszystkie punkty obserwacyjne leżą na prostej o dodatnim współczynniku nachylenia • r=-1 wtedy i tylko wtedy gdy wszystkie punkty obserwacyjne leżą na prostej o ujemnym współczynniku nachylenia. • Wygodny wzór do obliczeń • SPXY = (xy) – (x)(y)/n = xy – nxy =

  25. Model statystyczny • Y = 0 + 1 X + błąd losowy • Dla ustalonej wartości X, Y jest zmienną losową o wartości oczekiwanej • Y|X = 0 + 1 X i odchyleniu standardowymY|X . Będziemy zakładali, że Y|Xnie zależy od X. • Nasz cel – estymacja 0 i1.

  26. 1estymujemy za pomocą • b1 = 0estymujemy za pomocą • b0 = y - b1x = • Wyestymowana prosta regresji ma wzór

  27. W jakim sensie ta prosta jest najlepsza ? • Dla każdej wartości możemy obliczyć wartość y przewidywaną przez daną prostą • = b0 + b1 x . • Dla każdej pary obserwacji (x,y) obliczamy różnicę między wartością zaobserwowaną y a przewidywaną • różnica = y -

  28. Suma kwadratów różnic • Definicja: • SS(res) = (y- )2 • Możemy korzystać ze wzoru • SS(res) = SSY - SP2XY /SSX • SS(res) =

  29. ``Najlepsza’’ prosta to taka, która daje najmniejszą możliwą wartość SS(res) • SS(res) mierzy jakość dopasowania

  30. Resztowy błąd standardowy • sY|X = • sYmierzy rozrzut y od y • sY|Xmierzy rozrzut y od ``najlepszej’’ prostej • Około 68% obserwacji jest w odległości nie większej niż  1 sY|X od prostej; 95% w odległości  2 sY|Xod prostej. • Uwaga – odległość liczymy na osi y.

  31. Y ~ N(Y|X, Y|X) • Zatem Y - Y|X • Tak więc błąd losowy • Dodatkowo zakładamy (tak jak w ANOV-ie), żeY|X nie zależy od X. • Y|Xestymujemy za pomocą sY|X .

  32. Tak więc nasz wyestymowany model Jak dobre są nasze estymatory ? SEb1 = = 0.322

  33. (b1- 1) / SEb1ma rozkład Studenta z df = n-2 stopniami swobody. Możemy więc skonstruować 95% PU dla1,

  34. Testowanie Chcemy przetestować czy Y i X są zależne, a dokładniej czy średnia Y zależy od X. W ramach modelu liniowego odpowiada to testowaniu hipotezy czy 1 =

  35. Czy (Y) zależy od (X) ? (Dokładniej - Czy X i Y są skorelowane ?) H0: 1 = 0. (Y) nie zależy (X). (Y|Xnie zależy od X) HA: 1 0 (Y|Xzależy od X) [HAmoże być kierunkowa, 1 < 0 lub1 > 0] Użyjemy testu niekierunkowego. ts = b1 / SEb1przy H0 ma rozkład Studenta z df = n-2 = stopniami swobody. Wartość krytyczna t.025 =3.182.

  36. ts = b1 / SEb1 = -0.7857/0.322 = 2.44 –3.182 < 2.44 < 3.182, więc Na poziomie istotności 0.05 nie mamy przesłanek aby twierdzić, że X i Y są skorelowane (albo że Y zależy od X). UWAGA Testujemy zależność Y od X w ramach modelu liniowego. Ten test nie jest w stanie wykryć pewnych nieliniowych form zależności. Mały rozmiar próby – kiepska moc.

  37. Przykład • Długość i ciężar węży • SSX = (x-x)2 =172 SPXY = xy – nxy =1237 • b1 = = 1237/172 = 7.19 • b0 = y - b1x = 152- 7.19*63 = -301 • Y = -301 + 7.19 X + błąd

  38. SEb1 = • 95% PUdla β1: 7.19 ± t0.025(7)*0.9531 = (4.9, 9.4) • Testowanie ts = b1/ SEb1 = 7.19/0.9531=7.54 P-wartość < 0.001

More Related