hypotesetest l.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Hypotesetest PowerPoint Presentation
Download Presentation
Hypotesetest

Loading in 2 Seconds...

play fullscreen
1 / 29

Hypotesetest - PowerPoint PPT Presentation


  • 179 Views
  • Uploaded on

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer. Konfidensinterval for s 2 – store stikprøver. Hvis X følger en c 2 -fordeling med n frihedsgrader, dvs. X ~ c 2 (n), gælder

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Hypotesetest' - oakes


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
hypotesetest

Hypotesetest

Hypotesetest og kritiske værdier

Type 1 og Type 2 fejl

Styrken af en test

Sammenligning af to populationer

konfidensinterval for s 2 store stikpr ver
Konfidensinterval for s2 – store stikprøver.
  • Hvis X følger en c2-fordeling med n frihedsgrader, dvs. X~c2(n), gælder
  • Når antal frihedsgrader er stort er en c2-fordeling approksimativt det samme som en normalfordeling:
  • Hvis en stikprøve af størrelse n er normalfordelt og s2 er stikprøvevariansen, så gælder der
konfidensinterval for s 2 store stikpr ver3
Konfidensinterval for s2 – store stikprøver.
  • Eksempel: n=400, s2=12. Find 95% konfidens int fors2.
  • Da stikprøven er stor har vi c2(n-1) ≈ N( n-1 , 2·(n-1) )
  • Den inverse transformation giver da
  • Vi kan nu finde a/2 og 1-a/2 fraktilerne i c2-fordelingen:
  • 95% konfidensinterval for s2.
hypoteser og hypotesetest
Hypoteser og hypotesetest.
  • En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable
    • Fx ”Er middelhøjden af Oecon studerende 175cm?”
  • I en hypotesetest testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra data.
  • For eksempel kan gennemsnittet af en stikprøve af jeres højder beregnes til 172,7 cm. Er det (signifikant) forskellig fra 175? Det er forskellig fra 175, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation, afhængig af eksempelvis stikprøvestørrelsen?
  • En hypotesetest består af 5 elementer:
    • Antagelser
    • Hypoteser
    • Teststørrelser
    • p-værdi
    • Beslutning/konklusion
eksempel test af middelv rdi to sidet test
Eksempel: Test af middelværdi (to-sidet test)
  • Antagelse: Test af m, X kvantitativ variabel, s2 kendt og n>30.
  • Hypoteser:
  • Stikprøvefordeling af når H0 er sand er approksimativ normal med middelværdim0og standard afvigelse
  • Teststørrelse:

standardisering

p v rdi og signifikansniveau a
p-værdi og signifikansniveau a
  • p-værdien af en test, er sandsynligheden for at observere en ny teststørrelse, der er mindst lige så ufarvorabel for H0 som den allerede observerede teststørrelse, når nul hypotesen er sand.
  • Signifikansniveaueta er et tal, således at H0 forkastes, hvis p-værdien er mindre end a.
  • a er normalvis 0.05 eller 0.01.
  • a vælges føranalysen foretages.
  • Hvor lille et signifikans niveau man vælger, afhænger af hvilke konsekvenser beslutningen om at forkaste H0 har. Hvis det er et spørgsmål om liv eller død, for eksempel i medicinske forsøg, vælges α meget lille. Men hvis det ”bare” er at teste om et folketingsparti er større end et andet, kan man godt α større.
eksempel
Hypoteser:

H0: m = 30

H1: m ≠ 30

Stikprøve:

n = 50

= 31.5

s = 5

Teststørrelse:

Signifikansniveau: a=0.05

Fordelingen Z under H0:

p-værdi:

Da p-værdi < a forkastes H0.

0

.

8

0

.

7

0

.

6

0

.

5

0

.

4

0

.

3

.017

.017

0

.

2

0

.

1

0

.

0

0

Eksempel
kritiske v rdier
Kritiske værdier
  • I tilfælde, hvor man ikke kan bestemme p-værdien kan man typisk finde de kritiske værdier.
  • De kritiske værdier svarer til teststørrelser, der har en p-værdi lig signifikansniveauet a.
  • Eksempel: To-sidet test af middelværdien, s kendt, a=0.05.
  • I dette tilfælde er de kritiske værdier -1.96 og 1.96
  • Tilsvarende kritiske værdier kan findes for andre fordelinger, fx t-fordelingen.
  • Dvs. hvis eller , så ved vi at p-værdien ≤ 0.05.
  • Hvis p-værdien ≤ 0.05 afviser vi H0.
eksempel9
H0: m = 30

H1: mm 30

Signifikansniveau:

a=0.05

Stikprøve:

n = 50

= 31.5

s = 5

Test størrelse:

Kritiske værdi:

Da 2,12 > 1,96 forkastes H0 (eller hvis den var mindre end -1,96)

Hvis højresidet test, dvs. H1:μ>30:

Da 2,12 > 1.645 forkastes H0

Hvis venstresidet test, dvs. H1:μ<30:

Da 2,12 ikke er mindre end -1,645, forkastes H0 ikke

Eksempel
slide10
En- og to-sidet test af middelværdi for store eller normale stikprøver og kendt varians og signifikansniveau a.

H0: m = m0

H1: m ≠ m0

To-sidet test

Forkast H0, hvis |z| > Za/2

H0: m = m0

H1: m < m0

Forkast H0, hvis z < -Za

En-sidet test

H0: m = m0

H1: m > m0

Forkast H0, hvis z > Za

I alle tre tilfælde er teststørrelsen

type 1 og type 2 fejl
Type 1 og type 2 fejl
  • Type 1 fejl: En sand H0 forkastes.
  • Type 2 fejl: En falsk H0 forkastes ikke.
  • Signifikans niveauet a er sandsynligheden for at begå en type 1 fejl.
  • Sandsynligheden for at begå en type 2 fejl betegnes β
  • Sandsynligheden for type 1 og type 2 fejl er inverst relaterede, dvs. når den ene stiger, så falder den anden, så man kan ikke vælge begge to så lavt som muligt – se næste slide.
hvordan og afh nger af hinanden
Hvordan α og β afhænger af hinanden
  • Typisk vælger man at fastsætte sandsynligheden for type 1 fejl, a, så man ikke begår store fejl.
  • For eksempel hvis H0 er, at en eller anden medicin er skadelig, er det bedre at være sikker på, at man ikke forkaster H0 selvom den er sand, end at være sikker på, at man ikke forkaster den, selvom den er falsk.

For forskellige n

og et bestemt μ

beregning af for en venstre sidet test
Beregning af  (for en venstre sidet test)
  • Se på følgende hypoteser:
  • H0:   1000
  • H1:   1000
  • Lad  = 5,  = 5%, og n = 100. Vi vil beregne  når  = 1 = 998.
  • Se næste slide
  • Figuren viser fordelingen af når  = 0 = 1000, og når  = 1 = 998.
  • Bemærk at H0 vil blive forkastet, når er mindre end den kritiske værdi givet ved .
  • Omvendt, H0 vil ikke blive forkastet, når er større end .
beregning af
Beregning af 

Fordeling af

når m = m0.

Fordeling af

når m = m1.

beregning af15
Beregning af 
  • Når  = 1 = 998, så er  sandsynligheden for ikke at forkaste H0, dvs. den er .
  • Når  = 1, så vil følge en normal fordeling med middelværdi 1og standard afvigelse = /n, så:
  • Styrken (power) af en test, er sandsynligheden for at den falske nul hypotese bliver opdaget af testen.
  • Styrken af testen = 1 –β = 1 – 0.0091 = 0.9909.
sammenligning af to grupper
Sammenligning af to grupper
  • Tjener mænd og kvinder lige meget? (Respons: Løn, Forklarende: Køn)
  • Er andelen af helbredte kræftpatienter den samme for to forskellige typer kemoterapi? (Respons: helbredte patienter, Forklarende: Kemotype)
  • Er andelen af overvægtige i 2006 den samme som andelen af overvægtige i 1999? (Forklarende: årstal, Respons: overvægtige)
  • Kører en VW Touran og en Skoda det samme antal kilometer per liter? (Forklarende: Bilmærke, Respons: antal kilometer per l)
  • Kører en VW Touran det samme antal kilometer per liter på almindelig benzin, som på bio benzin? (Forklarende: Benzin type, Respons: antal kilometer)
  • Er der forskel på hvor hurtigt man løber 5 km, når man har originale Nike sko og Super Nike sko på?
afh ngige og uafh ngige stikpr ver
Afhængige og uafhængige stikprøver
  • Ved en uafhængig stikprøve udtages en stikprøve fra hver gruppe.
  • Mænd og kvinders løn: Tag en stikprøve fra gruppen af mænd og en stikprøve fra gruppen af kvinder og sammenlign gennemsnitslønnen for de to grupper.
  • Kilometer per liter: Tilfældig stikprøve af Touran’er og tilfældig stikprøve af Skoda’er.
  • Ved en afhængig stikprøve er observationerne i de to grupper parrede. Oftest er det den samme person/genstand, der bliver observeret i to forskellige situationer.
  • Bio benzin kontra almindelig benzin: Vælg tilfældigt et antal VW Touran’er og test dem med de to forskellige typer benzin.
  • Original Nike sko kontra Super Nike sko: Vælg tilfældigt nogle personer til at løbe 5 km og lad dem teste begge par sko.
forklarende variabel og respons variabel
Forklarende variabel og respons variabel.
  • To grupper, der sammenlignes, udgør en bivariat variabel – dvs. en variabel, der kun har to kategorier, for eksempel mænd og kvinder. Denne variabel kaldes den forklarende variabel (eller den uafhængige variabel).
  • Den variabel, der sammenlignes, kaldes respons variablen (eller den afhængige variabel), for eksempel løn.
  • Når respons variablen er kvantitativ, sammenlignes middelværdier.
  • Når respons variablen er kvalitativ, sammenlignes andele.
  • Summeopgave: Se på eksemplerne – identificer respons og forklarende variabel og se på om responsen er kvalitativ eller kvantitativ.
resten af forel sningen
Resten af forelæsningen
  • Sammenligning af to middelværdier – kendt varians
  • Hypotesetest
  • Konfidensinterval
  • Sammenligning af to middelværdier – ukendt varians
  • Hypotesetest
  • Konfidensinterval
  • Sammenligning af to andele
  • Hypotesetest
  • Konfidensinterval
slide20
Population 1

Population 2

Sammenligning af to middelværdier – kendte varianser og store stikprøver eller populationer normalfordelte
slide22
Sammenligning af to middelværdier – kendte varianser og store stikprøver eller populationer normalfordelte
to normalfordelte populationer med ukendt varians
To Normalfordelte populationer med ukendt varians
  • Hypoteser:
  • H0: m1 = m2
  • H1: m1≠ m2
  • To situationer:
  • s12= s22
  • s12≠ s22

Hvis store stikprøver, bruges z i stedet for t-fordelingen. Bogen bruger z, når n1 og n2 er større end 30. SPSS regner altid med t-fordelingen

eksempel26
Eksempel
  • Teststørrelse:
  • Kritiske punkter:
    • ±ta/2(n1+n2-2) = ±t0.025(17) = ±2.11
  • Beslutning:
    • H0 afvises da 2.67 > 2.11
  • Forskel på højden af drenge og piger
  • Antag s12 = s22.
  • Hypoteser:
    • H0: m1 = m2
    • H1:m1≠ m2
  • Signifikansniveau:
    • a = 0.05

(antal drenge)

(antal piger)

(gennemsnitshøjde drenge)

(gennemsnitshøjde piger)

(est. varians drenge)

(est. varians piger)

konfidensintervaller for m 1 m 2
Konfidensintervaller for m1 - m2
  • Konfidensinterval for m1 - m2når s12= s22.

v = Antal frihedsgrader

  • Konfidensinterval for m1 - m2når s12≠ s22.
spss eksempel
SPSS Eksempel
  • Data: Vægt for 1206 mænd og 1432 kvinder.
  • Er der en forskel i middelvægten?

Analyze > Compare Means > Independent-Sample T Test

I dette datasæt tager variablen ”kon” værdierne 1 og 2 alt efter om det er mænd eller kvinder.

Vægt inddeles efter køn

spss eksempel output
SPSS Eksempel - output

t-teststørrelse alt efter om der er antaget ens eller forskellig varians

p-værdi for en to-sidet test: H1: m1≠m2

Antal frihedsgrader

95% konfidens-interval for m1-m2