F relasning 7
Download
1 / 15

Förelasning 7 - PowerPoint PPT Presentation


  • 126 Views
  • Uploaded on

Förelasning 7. Chitvå-test Regression forts. Analys av enkla frekvenstabeller. Ofta analyserar man frekvenstabeller med hjälp av diagram. Är skillnaden statistiskt signifikant? Exempel : Antal personer som föredrar att handla i olika matbutiker (stickprov n =120, siffror påhittade).

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Förelasning 7' - maik


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
F relasning 7

Förelasning 7

Chitvå-test

Regression forts.


Analys av enkla frekvenstabeller
Analys av enkla frekvenstabeller

  • Ofta analyserar man frekvenstabeller med hjälp av diagram.

    • Är skillnaden statistiskt signifikant?

      Exempel: Antal personer som föredrar att handla i olika matbutiker (stickprov n=120, siffror påhittade)

Statistiska metoder 2012


Analys av enkla frekvenstabeller1
Analys av enkla frekvenstabeller

  • Hypotesprövning

    H0: Det finns ingen signifikant skillnad mellan antalen i olika kategorierna:

    Ha: Det finns skillnad

Marknad Antal Förväntad

Willys 37 30

Lidl 28 30

Netto 12 30

ICA 43 30

För varje observerad frekvens O, kan man definiera förväntade frekvensen E under nollhypotesen som totalvärde S dividerad med antalet kategorier K

Statistiska metoder 2012


Analys av enkla frekvenstabeller2
Analys av enkla frekvenstabeller

  • Givet en envägsindelad frekvenstabell och de förväntade frekvenser är större än 5, använd chitvå-statistiken med K-1 frihetsgrader vid hypotesprövningen:

  • Rita fördelningen

  • Kritiska området=alltid högra svansen

  • Om vi är i det kritiska området  Förkastar H0

Statistiska metoder 2012


Analys av enkla frekvenstabeller3
Analys av enkla frekvenstabeller

  • MINITAB: Använd StatTablesChi-Square Goodness-of-fit-test

Test Contribution

Category Observed Proportion Expected to Chi-Sq

Willys 37 0,25 30 1,6333

Lidl 28 0,25 30 0,1333

Netto 12 0,25 30 10,8000

ICA 43 0,25 30 5,6333

N DF Chi-Sq P-Value

120 3 18,2 0,000

Statistiska metoder 2012


Analys av korstabeller
Analys av korstabeller

Blodgrupp Sverige USA

A 43 66

B 38 72

AB 11 23

O 8 19

  • Hypotesprövning

    H0: Fördelning i radkategorierna beror på kolumnkategorier

    Ha: Fördelningen är samma för alla kolumnkategorier

    Exempel:

    Antal personer med en viss blodgrupp (USA och Sverige) Skillnad mellan två länder?

Statistiska metoder 2012


Analys av korstabeller1
Analys av korstabeller

  • Skatta marginala frekvenser och totalsumman

  • För varje observerad frekvens O, definiera en förväntad frekvens E som produkten av motsvarande marginala frekvenser dividerade med totalsumman.

Statistiska metoder 2012


Analys av korstabeller2
Analys av korstabeller

  • Givet en tvåvägsindelad frekvenstabell och de förväntade frekvenser är alla större än 5 förutom kanske 20% och ingen förväntad frekvens är mindre än 1, använd chitvå-statistiken med (R-1)(K-1) frihetsgrader vid hypotesprövningen:

  • Om vi är i det kritiska området  Förkastar H0

Statistiska metoder 2012


Analys av korstabeller3
Analys av korstabeller

Sverige USA Total

1 43 66 109

38,93 70,07

0,426 0,237

2 38 72 110

39,29 70,71

0,042 0,023

3 11 23 34

12,14 21,86

0,108 0,060

4 8 19 27

9,64 17,36

0,280 0,155

Total 100 180 280

Chi-Sq = 1,331; DF = 3; P-Value = 0,722

  • MINITAB:Stat Tables Chi-Square test

Statistiska metoder 2012


Regression
Regression

  • Vi antar att följande modell gäller:

  • εi – slumpfel, normalfördelad med okända variansen σ2

  • Det är alltså ett statistiskt samband, fel:

    • Felaktiga mätningar

    • En eller flera viktiga variabler saknas i modellen

Statistiska metoder 2012


Regression1
Regression

Exempel: Ålder och vikt av barn under 3 år. Två olika stickprov olika bilder (innebär att εi är olika)

  • Anpassade regressionsekvationer är mycket lika!

    • Hur mycket ska koefficienterna variera från ett stickprov till ett annat? Konfidensintervall behövs!

Statistiska metoder 2012


Regression utskriften
Regression-utskriften

Regression Analysis: Vikt2 versus Ålder

The regression equation is

Vikt2 = 4,86 + 3,62 Ålder

PredictorCoef SE Coef T P

Constant 4,8586 0,1766 27,51 0,000

Ålder 3,6226 0,1047 34,58 0,000

S = 0,894781 R-Sq = 92,4% R-Sq(adj) = 92,3%

Analysis of Variance

Source DF SS MS F P

Regression 1 957,61 957,61 1196,06 0,000

Residual Error 98 78,46 0,80

Total 99 1036,07

Statistiska metoder 2012


Regression2
Regression

Hypotesprövning

  • H0: b=0

  • H1 b≠0

  • Använd T-statistik med n-2 frihetsgrader vid hypotesprövning

  • Konfidensintervall:

Statistiska metoder 2012


Prediktion
Prediktion

  • Kan vi prediktera utfall för de nya observationer?

    • Ex.1 Vilken är genomsnittlig vikt av flickor som är 1 år gamla?

    • Ex 2 I vilket intervall ligger genomsnittlig vikt av flickor som är ett år gamla? Konfidensinterval

    • Ex3 I vilket interval vikt för en valfri flicka som är 1 år gammal Prediktionsinterval

      Predicted Values for New Observations

      New

      Obs Fit SE Fit 99% CI 99% PI

      1 8,4813 0,1013 (8,2151; 8,7475) (6,1157; 10,8468)

      Values of Predictors for New Observations

      New

      Obs Ålder

      1 1,00

Statistiska metoder 2012


L sa hemma
Läsa hemma

  • Kapitel 8

  • Kompendiet

Statistiska metoder 2012


ad