Statisti no zaklju evanje inferen na statistika
This presentation is the property of its rightful owner.
Sponsored Links
1 / 40

Statistično zaključevanje (inferenčna statistika) PowerPoint PPT Presentation


  • 115 Views
  • Uploaded on
  • Presentation posted in: General

Statistično zaključevanje (inferenčna statistika). = zaključevanje o značilnostih populacije. ven. Inferenčna statistika. Izberemo vzorec. Določimo statistiko (npr. M ). Posplošujemo z vzorca na populacijo. ocenjevanje parametra Vprašanje: Kolikšen je parameter ( m ) v populaciji?

Download Presentation

Statistično zaključevanje (inferenčna statistika)

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Statisti no zaklju evanje inferen na statistika

Statistično zaključevanje

(inferenčna statistika)

= zaključevanje o značilnostih populacije

ven


Inferen na statistika

Inferenčna statistika

Izberemo vzorec.

Določimo statistiko (npr. M).

Posplošujemo z vzorca na populacijo.

  • ocenjevanje parametraVprašanje: Kolikšen je parameter (m) v populaciji?

  • testiranje hipotezVprašanje: Ali je M pomembno različna od neke vrednosti?

ven


Populacija in vzorec

Populacija in vzorec

  • posploševanje z vzorca na populacijo

  • opredelitev populacije in vzorcasestavljanje liste, s katere vzorčimo

  • reprezentativnost, nepristranskost vzorec ima podobne lastnosti kot populacija (enakost deležev)

  • velikost vzorca ekonomičen N, dopustna napaka vzorčenja, variabilnost pojava, pričakovana razlika, določitev N iz enačb za testiranje hipotez

ven


Vzor ne porazdelitve

Vzorčne porazdelitve

ven


Vzor ne porazdelitve1

Vzorčne porazdelitve

ven


Vzor ne porazdelitve2

Vzorčne porazdelitve

  • Če iz definirane populacije izberemo vse možne vzorce velikosti N, lahko za vsak vzorec določimo statistike (npr. M, SD). Statistike se od vzorca do vzorca spreminjajo. vzorčne porazdelitve statistik

    • opisnih statistik vzorca, npr. M, var, p, r…

    • drugih izrazov, npr.

  • Vsako vzorčno porazdelitev lahko opišemo: MstatistikeSD = SEstatistike

ven


Vzor ne porazdelitve3

Vzorčne porazdelitve

frekvenčna porazdelitev spremenljivke

SD

M

Vzorčne porazdelitve

različnih statistik

se razlikujejo:

normalna, F, t, c2

vzorčna porazdelitev statistike

SEstatistike

Mstatistike

ven


Vzor ne porazdelitve4

Če je vzorec velik, bo statistika vzorca bolj podobna parametru.

Razpršenost vzorčne porazdelitve se z večanjem vzorca manjša.

Vzorčne porazdelitve

frekvenčna porazdelitev spremenljivke

SD

M

vzorčna porazdelitev statistike

za manjše /

večje vzorce

SEstatistike

Mstatistike

ven


Standardna napaka

Standardna napaka

Standardna napaka M

SEM= standardni odklon

vzorčnih aritmetičnih sredin

Standardna napaka se z večanjem vzorca manjša.

ven


Ocenjevanje parametra

Ocenjevanje parametra

Vzorčna statistika je ocena populacijskega parametra.

Točkovna ocena parametra

  • Nepristranska ocena:Sredina vzorčne porazdelitve statistike je enaka ocenjevanemu parametru.Velja za vse mere centralne tendence, deleže, korelacijske koeficiente.

  • Pristranska ocena:Mere razpršenosti.

    Vzorčna SD podcenjuje vrednost s.

ven


Ocenjevanje parametra1

Ocenjevanje parametra

Intervalna ocena parametra

razpon vrednosti, znotraj katerega se bo populacijski parameter nahajal z določeno verjetnostjo B

= B-odstotni interval zaupanja

ven


Ocenjevanje parametra2

Intervalno ocenjevanje Mpri velikih vzorcih

Ocenjevanje parametra

SEM

M

m

vzorčna porazdelitev M je N.D.

N (0,1)

1

0

z


Statisti no zaklju evanje inferen na statistika

grafični

prikaz

kvantilov

SEM · zp

SDz · zp

vzorčna porazdelitev z

1 - a

p = a / 2

a / 2

SDz = 1

zsp

zzg

z = 0

vzorčna porazdelitev M

1 - a

p = a / 2

a / 2

SEM

sp

zg

ven


Ocenjevanje parametra3

Pri majhnih vzorcih

Interval zaupanja za m:

df = N - 1

Ocenjevanje parametra

Vzorčna porazdelitev M jeN.D. le, če je frekvenčna porazdelitev spremenljivke normalna.

preveriti

Vrednost SEM se spreminja z velikostjo vzorca. Vzorčna porazdelitev je odvisna od

stopenj prostosti.

SEM

m

1

0


Testiranje hipotez

Testiranje hipotez

  • Postavimo dve nasprotni si hipotezi (ničelno in alternativno).

    H0: V našem vzorcu je povprečni IQ enak 100 (oz. naš vzorec izhaja iz populacije, kjer je povprečni IQ enak 100; M = 100).

    H1: V našem vzorcu je povprečni IQ različen od 100.(oz. naš vzorec ne izhaja iz populacije, kjer je povprečni IQ enak 100; M  100).

  • Konstruiramo vzorčno porazdelitev (pod predpostavko pravilnosti ničelne hipoteze).

odvisna od

velikosti vzorca

odvisna od

razpršenosti

v populaciji

SE

100


Testiranje hipotez1

Če je vrednost statistike verjetna (znotraj intervala zaupanja), ohranimo ničelno hipotezo.

Če je vrednost višja/nižja od zgornje/spodnje meje intervala zaupanja (pade v kritično regijo), ničelno hipotezo zavrnemo. (Pravilnost ničelne hipoteze je malo verjetna. Alternativna hipoteza je verjetnejša. Statistika našega vzorca se od poznanega / predpostavljenega parametra pomembno razlikuje.)

Testiranje hipotez

Na osnovi vzorčne porazdelitve poznamo verjetnost

pojavljanja določene vrednosti statistike.

SE

SE

100

100

M

M


Napake pri statisti nem zaklju evanju

Napake pri statističnem zaključevanju

naš zaključek

r = 0

M = m

r 0

M m

pravilna potrditev ničelne hipoteze

r = 0

M = m

a napaka

dejansko

stanje

pravilna zavrnitev ničelne hipoteze

r 0

M m

b napaka


Napake pri statisti nem zaklju evanju1

zkrit.

zkrit.

z

Napake pri statističnem zaključevanju

a napaka

zkrit.

zkrit.

z

b napaka

ven


Raziskovalni na rti z 1 nv in 1 ov

Raziskovalni načrti z 1 NV in 1 OV

  • primerjava vzorca s populacijo (primerjava vzorčne statistike s poznano ali predpostavljeno vrednostjo parametra)

  • primerjava statistik dveh vzorcev

  • primerjava statistik več vzorcev

    Ali so vrednosti preveč različne?

    Ali vzorci pripadajo isti populaciji?

ven


Testiranje hipotez o povpre ju primerjava povpre ja vzorca z znano vrednostjo

Testiranje hipotez o povprečju: primerjava povprečja vzorca z znano vrednostjo

H0: M = m

H1: Mm

SEM

M

m

tkrit.

tkrit.

1

t primerjamo s tkrit

0

z


Testiranje hipotez o povpre ju primerjava povpre ja vzorca z znano vrednostjo1

Testiranje hipotez o povprečju: primerjava povprečja vzorca z znano vrednostjo

Če bi bila ničelna hipoteza pravilna (če bi vzorčili iz populacije s sredino 6.0), bi vrednosti t v 5 % vzorcev presegale 2.09. Verjetnost pojavljanja t vrednosti 4.60 zaradi napake vzorčenja bi bila zelo majhna, manjša od 5 %.

Večja verjetnost je, da vrednost našega vzorca ni posledica napake vzorčenja, temveč da naš vzorec pripada neki drugi populaciji. Ničelno hipotezo zavrnemo, sprejmemo alternativno. Povprečje našega vzorca statistično pomembno odstopa od 6.0.

Študenti v povprečju na nekem testu dosegajo rezultat 6.0,

rezultati testa v naši skupini pa so bili naslednji:

9 7 4 11 10 8 7 10 7 4 7 10 8 10 6 8 10 7 8 9

Vprašanje: Ali je naša skupina običajna skupina študentov ali morda ne? Ali je povprečje našega vzorca enako 6.0?

H0: M = 6.0

H1: M6.0

M = 8.0

s’ = 1.95

SEM = 1.95 / Sqrt(20) = 0.44

t = (8.0 - 6.0) / 0.44 = 4.60

df = N - 1 = 19

tkrit (19) = 2.09

t > tkrit

0.44

6.0

8.0 --- t = 4.6


T test

t-test

Primerjava povprečij dveh vzorcev

Ali oba vzorca izhajata iz iste populacije?Je razlika med njunimi Mničelna? Ima NV vpliv na OV?


Statisti no zaklju evanje inferen na statistika

Primer t testa

dva neodvisna vzorca

Vprašanje:

Ali se študenti iz EU po znanju slovenščine razlikujejo od študentov iz drugih držav?

Pr.1S1S2 7.07.5

14.05.010.05.011.06.0 8.51.0 5.06.0 4.59.011.03.0 9.06.010.07.0

M9.005.55

s’2.902.27var’8.415.15

t = (9.00-5.55) / 1.16 = 2.97df = 10+10-2 = 18; t.05(18) = 2.101

kritični t

Naša vzorca se razlikujeta za 3.45, medtem ko je variabilnost vrednosti znotraj vsakega vzorca sorazmerno majhna. Razlika med vzorcema je v primerjavi z razlikami med osebami znotraj vzorcev precejšnja. S t-testom ugotovimo, ali je razlika med sredinama obeh vzorcev tudi statistično pomembna.

Če bi neštetokrat vzorčili po dva vzorca iz iste populacije, bi pri 5% primerov vzorčenj vrednost t-testa presegla kritično vrednost 2.101. Naš dobljeni t znaša 2.97 in je višji od kritične vrednosti. To pomeni, da bi v manj kot 5% primerov vzorčenj iz iste populacije potegnili dva tako različna vzorca, kot sta naša. Ker je naša dobljena vrednost t višja od kritične, zaključujemo, da je verjetnost, da smo oba vzorca potegnili iz iste populacije, premajhna. Najverjetneje vzorca izhajata iz dveh različnih populacij. Zaključimo, da se aritmetični sredini pri naših vzorcih statistično pomembno razlikujeta, oz. da je S1 dosegala statistično pomembno drugačne rezultate od S2. Neodvisna spremenljivka (to, iz katere skupine držav je učenec) je imela učinek na merjeno odvisno spremenljivko (znanje slovenščine).


Analiza variance

Primerjava povprečij več vzorcev

Analiza variance

  • preverjamo pomembnost razlik med sredinami več vzorcev

  • meritve v več pogojih (oz. vzorčenje iz več populacij)

  • H0: ni razlik med njihovimi m

ven


Analiza variance1

Analiza variance

  • preverjamo pomembnost razlik med sredinami več vzorcev

  • meritve v več pogojih (oz. vzorčenje iz več populacij)

  • H0: ni razlik med njihovimi m

ven


Analiza variance2

Analiza variance

Ocena variance

Skupno varianco vseh podatkov lahko razstavimo na dva dela:

  • varianco napake, ki je posledica:

    • napak merjenja (slabih merskih instrumentov),

    • napak kontrole (zunanjih spremenljivk),

    • razlik med posamezniki

  • varianco, nastalo zaradi učinkov neodvisne spremenljivke

vsota kvadratov odklonov (SS)

df


Analiza variance3

Analizavariance

Mtot

Mj

Yi

skupna

variabilnost

variabilnost

znotraj skupin

variabilnost

med skupinami


Statisti no zaklju evanje inferen na statistika

Primer analize

variance za dva vzorca

2 3 4 5 6 7 8 9 10 11 12

MT = 7SSznotraj-1 = 1(2-4)2 + 2(3-4)2 + 3(4-4)2 + 2(5-4)2 + 1(6-4)2 =12

SSznotraj-2 = 1(8-10)2 + 2(9-10)2 + 3(10-10)2 + 2(11-10)2 + 1(12-10)2 =12

SSmed = 9(4-7)2 + 9(10-7)2 = 81 + 81 = 162

dfznotraj = N - a = 18 - 2 = 16 dfmed = a - 1 = 2 - 1 = 1

MSznotraj = SSznotraj / dfznotraj = 24 / 16 = 1.5MSmed = SSmed / dfmed = 162 / 1 = 162F = 162 /1.5 = 108Ft (1,16) = 4.49

ven


Statisti no zaklju evanje inferen na statistika

Primer analize

variance za dva vzorca

Tabela povzetka analize variance

izvor variabilnost

SS

df

MS

F

p

NV 162 1 162.0 108 < .001

napaka 2416 1.5

skupaj 186 89

Skupina 1 (M = 4.0, SD = 1.2) je dosegla statistično pomembno drugačne rezultate od skupine 2 (M = 10.0, SD = 1.2), F (1, 16) = 108, p < .001.

ven

t-test


Analiza variance4

Analiza variance

  • neponovljene in ponovljene meritve

  • pogoji:

    • nominalna NV

    • OV na vsaj intervalni merski ravni

    • normalna porazdelitev spremenljivke v populaciji

    • enakost varianc vzorcev

  • analiza variance za več NV

    • dvosmerna, trismerna ANOVA

    • glavni učinki + interakcija med NV

ven


Statisti no zaklju evanje za frekvence

Statistično zaključevanje za frekvence

  • Opis: tabele, frekvenčni poligoni, histogrami

  • Običajna vprašanja:- enakost deležev kategorij pri več vzorcih- ujemanje dejanskih podatkov s pričakovanimi, testiranje hipotez o obliki porazdelitve - povezanost (interakcija) med dvema nominalnima spremenljivkama

ven


C 2 test za eno spremenljivko

c2 test za eno spremenljivko

  • Ali je višja pogostost ene kategorije slučajna?

  • pričakovane frekvence

  • H0: Populacijska frekvenčna distribucija je enaka pričakovani.

  • odstopanje dejanskih od pričakovanih vrednosti

    … Pearsonov c2- približek c2 distribucije

    df = a - 1

ven


Primer c 2 testa za preverjanje pravokotnosti porazdelitve enakosti dele a oseb v vseh kategorijah

Primer c2 testa za preverjanje pravokotnosti porazdelitve (= enakosti deleža oseb v vseh kategorijah)

Delež izbir napačnih alternativ na vprašanju zaprtega tipa:

a) b) c)

fe30 4080skupaj 150

dejanski delež0.20 0.270.53

ft50 5050

teoretični delež0.33 0.330.33

c2(2)= (30-50)2/50 + (40-50)2/50 + (80-50)2/50 = 28

kritična vrednost c2 pri 5% tveganju: 5.99

Naš dobljeni c2 presega kritično vrednost. Če bi neštetokrat vzorčili iz populacije, kjer osebe enakovredno izbirajo napačne alternative (kjer je delež izbire vseh alternativ enak, in sicer 0.33), bi kritično vrednost c2 po slučaju preseglo le 5 % vzorcev. Ker so bili deleži v našem vzorcu zelo različni od teoretičnega deleža 0.33 in je zato c2 pri našem vzorcu zelo presegel kritično vrednost, ni preveč verjetno, da smo ga potegnili iz populacije, kjer osebe enako pogosto izbirajo vse tri alternative. Bolj verjetno kot to je, da smo ga povlekli iz populacije, kjer osebe različne alternative izbirajo različno pogosto. Zaključimo torej, da alternativni odgovori niso enako privlačni.

ven


C 2 test odvisnosti dveh spremenljivk

c2 test odvisnosti dveh spremenljivk

  • kontingenčna tabela

  • H0: Vpliv ene spremenljivke ni odvisen od druge spremenljivke (na vseh ravneh ene spremenljivke so ravni druge enako izražene).

  • pričakovana frekvenca ft = fvrsta fstolpec/ N

  • v vsakem polju izračunamo

  • seštejemo izračune v vseh poljih, dobimo c2

  • Dobljeno vrednost primerjamo s kritično vrednostjo c2

    df = (število vrstic - 1) (število stolpcev - 1)

ven


Statisti no zaklju evanje inferen na statistika

uspešnost pri nalogi 1

+-

ženske361450

(29)(21)

moški222850

(29)(21)

5842100

c2 = (36-29)2/29 + (14-21)2/21 + (22-29)2/29 + (28-21)2/21 = 8.05

df = (število vrstic - 1) ·(število stolpcev - 1) = (2-1)(2-1) = 1

kritična vrednost: c2.05 (1) = 3.841

Naš dobljeni c2 je višji od kritične vrednosti, kar pomeni, da je rezultat statistično pomemben. Če bi naš vzorec izhajal iz populacije, kjer se moški in ženske ne bi razlikovali v uspešnosti pri nalogi, bi v manj kot 5% vzorcev dejanske frekvence tako zelo odstopale od teoretičnih. To pomeni, da je bolj kot to, da smo vzorec vlekli iz populacije, kjer oba spola enako pogosto pravilno odgovorita, verjetno, da smo vzorec vlekli iz populacije, v kateri se ženske in moški razlikujejo v uspešnosti reševanja naloge. Zaključimo, da so ženske pri reševanju naloge statistično pomembno bolj uspešne kot moški.

robna vsota

frekvenc

V oklepajih so

navedene

teoretične

frekvence.

število vseh oseb

robna vsota frekvenc


Previdnost

Previdnost!

  • Interpretacija izsledka naj upošteva značilnosti raziskovalnega načrta.

  • Statistična pomembnost je relativen pojem. Raste z velikostjo vzorca.

    -------Pregledati velikost učinka

  • Ni statistično pomembno = ni dokazano.

    Če ničelne hipoteze ne zavrnemo, to še ne pomeni, da je pravilna. Pri opazovanem pojavu ni bilo tako izrazitega učinka NV, da bi ga zaznali, kar ne pomeni, da zagotovo ne obstaja.

  • V nekaterih primerih parametričnih testov ne moremo uporabiti.

ven


Izbor ustreznega statisti nega testa

vrsta statistike

raven merjenja

normalnost porazdelitve

enakost varianc

odvisni / neodvisni vzorci

majhni / veliki vzorci

vrednost ničelne hipoteze

nivo tveganja

enosmerno / dvosmerno testiranje

Neparametrični testi

pogosto pri majhnih vzorcih, pri omejenosti razpona, stališča (U-porazdelitev)

Pri intervalnih ali razmernostnih spremenljivkah z neparametričnimi testi ne upoštevamo vseh informacij - nižja moč testa (ničelno hipotezo, ki je napačna, težje ovržemo).

Izbor ustreznega statističnega testa

ven


Testiranje hipotez o povpre ju

Testiranje hipotez o povprečju

Povprečja

N.D.

parametrični testi

več vzorcev

2 vzorca

1 vzorec

neodvisna

neodvisnih

odvisnih

odvisna

enosmerna

ANOVA

(GLM - univariate)

enosmerna

ANOVA

(GLM -

repeated-measures)

t test

(one-sample)

t test

(independent)

t test

(paired-samples)

ven


Testiranje hipotez o povpre ju1

Testiranje hipotez o povprečju

Povprečja

ni N.D.

neparametrični testi

2 vzorca

1 vzorec

več vzorcev

odvisna

neodvisnih

neodvisna

odvisnih

binomski

test

- Mann-

Whitneyev

U

- medianski test

- Wilcoxonov

T test

(matched pairs)

- test predznakov

- Kruskal-

Wallisov H

- razširjeni medianski test

Friedmanov

test

ven


Osnovna literatura

Osnovna literatura

  • Ferguson, G. A. (1998). Statistical analysis in psychology and education (3.izd.). New York: McGraw-Hill.

  • Graveter, F.J., in Wallnau, L.B. (2000). Statistics for the Behavioral Sciences (5.izd.). Belmont, CA: Wadsworth/Thomson Learning.

  • Pagano, R.R. (2001). Understanding Statistics in the Behavioral Sciences (6.izd.). Belmont, CA: Wadsworth/Thomson Learning.

  • Petz, B. (1997). Osnovne statističke metode za nematematičare (3. izd.). Jastrebarsko: Naklada Slap.

  • Spatz, C. (2001). Basic Statistics (7.izd.). Belmont, CA: Wadsworth/Thomson Learning.

  • Spiegel, M. R. (1991). Theory and problems of statistics (2. izd.). New York: McGraw - Hill.

ven


  • Login