t rsadalomstatisztika
Download
Skip this Video
Download Presentation
TÁRSADALOMSTATISZTIKA

Loading in 2 Seconds...

play fullscreen
1 / 181

TÁRSADALOMSTATISZTIKA - PowerPoint PPT Presentation


  • 79 Views
  • Uploaded on

Wesley János Lelkészképző Főiskola. Pedagógia alapszak, I. évfolyam. TÁRSADALOMSTATISZTIKA. Előadó: Csákó Mihály egyetemi docens 30 kontaktóra + 60 egyéni munkaóra = 3 kredit (Levelező: 12 kontakt + 78 egyéni munkaóra) A jegyzet-rovatot is érdemes figyelni!!!. Az előadások beosztása:.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'TÁRSADALOMSTATISZTIKA' - halia


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
t rsadalomstatisztika
Wesley János Lelkészképző Főiskola

Pedagógia alapszak, I. évfolyam

TÁRSADALOMSTATISZTIKA

Előadó: Csákó Mihály

egyetemi docens

30 kontaktóra + 60 egyéni munkaóra = 3 kredit

(Levelező: 12 kontakt + 78 egyéni munkaóra)

A jegyzet-rovatot is érdemes figyelni!!!

az el ad sok beoszt sa
Az előadások beosztása:

1.Mi a statisztika és mire jó? A kurzus célja

2. Adatgyűjtés és ábrázolás: a hisztogram

3. Csoportok jellemzése: középértékek

4. Csoportok szóródása: a szórás

5. A normálgörbe

6. A normális közelítés módszere

7. Két változó kapcsolata: varianciaelemzés

8. Két változó kapcsolata: korreláció

9. Két változó kapcsolata: regresszió

10. Statisztikai következtetés: mintavétel

11. Valószínűségszámítás

12. Megbízhatósági próbák, szignifikancia

Csákó M.: Társadalomstatisztika

sz mol si gyakorlat
Számolási gyakorlat
  • Ránézésre becsüljék meg a következő számokat %-ban! (Kb. 1%,10%, 50% …?)
  • 99 a 407-ből?
  • 57 a 209-ből?
  • 99 a 197-ből?
  • 39 a 398-ból?

Ezek kb. a legnehezebb számolási feladatok amelyek előfordulhatnak a félév során.

Csákó M.: Társadalomstatisztika

az igazs g keres se a keny rfogyaszt s p ld ja
Az igazság keresése:a kenyérfogyasztás példája

1. A büntetés-végrehajtási intézetekben fogva tartott elítéltek több mint 98 %-a  kenyérfogyasztó.

2. A kenyérfogyasztó családokban felnövekedő gyermekek 50 %-a a standardizált teszteket átlag alatti eredménnyel teljesíti.

3. A XVIII. században, amikor gyakorlatilag minden kenyér otthon, a háztartásban készült, az átlag-életkor nem érte el az 50 évet, a csecsemőhalandó-ság elfogadhatatlanul magas volt, sok nő belehalt a szülésbe, és a lakosságot olyan járványok tizedel-ték, mint a tífusz, a sárgaláz és az influenza.

Csákó M.: Társadalomstatisztika

az igazs g keres se a keny rfogyaszt s p ld ja1
Az igazság keresése:a kenyérfogyasztás példája

4. Az erőszakos bűncselekmények több mint 90 %-át kenyérfogyasztás után 24  órán belül követik el.

 5. A kenyér alapanyaga a tésztának nevezett szub-sztancia. Kísérletek során bebizonyosodott: ebből az anyagból néhány dekagramm elég, hogy egy egér megfulladjon tőle. Az átlag magyar ennek sokszorosát fogyasztja el egy hónap alatt!

 6. A primitív törzsi társadalmakban, ahol a kenyér-fogyasztás ismeretlen, évszázadok óta feltűnően kevés rákos megbetegedést, Alzheimer-és  Par-kinson-kóros, csontritkulásos esetet jegyeztek fel.

Csákó M.: Társadalomstatisztika

az igazs g keres se a keny rfogyaszt s p ld ja2
Az igazság keresése:a kenyérfogyasztás példája

7. A kenyér bizonyítottan addiktív. Kísérleti alanyok, akiktől egy időre  megvonták, és csak vízzel táplálták őket, alig 2 nap elteltével már  kenyérért könyörögtek. 

8. A kenyérfogyasztás sok esetben csak előkészítője a "keményebb"  élelmiszerek, mint például a vaj, lekvár, méz fogyasztásának.

9. A kenyérről bebizonyosodott, hogy magába szívja a vizet. Mivel az emberi testet több mint 90%-ban víz alkotja, a huzamos kenyérfogyasztás beláthatatlan következményekkel járhat a szervezet molekuláris összetételében.

Csákó M.: Társadalomstatisztika

az igazs g keres se a keny rfogyaszt s p ld ja3
Az igazság keresése:a kenyérfogyasztás példája

10. Az újszülöttek köhögnek a kenyértől.

11. A kenyeret 200 Celsius-fok körüli hőmérsékleten sütik. Ez a hőmérséklet nem egészen egy perc alatt elpusztít egy felnőtt embert.

12. A legtöbb kenyérfogyasztó képtelen megkülönböztetni a tudományos  tényeket a statisztika álruhájába burkolt, értelmetlen locsogástól.

Csákó M.: Társadalomstatisztika

tal lkoz saink a statisztik val h tk znapi tapasztalatok
Találkozásaink a statisztikával: hétköznapi tapasztalatok
  • Népszámlálás
  • Az európai népesség öregedése
  • A magyar népesség fogyása
  • A cigány gyerekek iskolázottsága
  • Éves iskolai statisztikai jelentés
  • A levegő hőmérsékletének sokévi átlaga
  • Foglalkozási kategóriák átlagkeresete
  • Munkanélküliség mértéke
  • Stb.

Csákó M.: Társadalomstatisztika

p lda az alkalmaz sra
Példa az alkalmazásra
  • Freedman: májműtétes példája

Veszélyes bypass műtét, de életmentőnek tartják.

Kérdés: „megéri-e”?

Hogyan lehet megtudni?

Számoljuk meg az eredményt!

Csákó M.: Társadalomstatisztika

mit rt nk statisztik n
Mit értünk statisztikán?
  • Összeszámlálás,
  • Jelzőszámok
  • Kapcsolatkeresés,
  • Feltételezett kapcsolat ellenőrzése,
    • magyarázat-keresés
    • minőség-ellenőrzés
  • Kutatási módszer (- pl. survey)

Csákó M.: Társadalomstatisztika

sszefoglal s
ÖSSZEFOGLALÁS
  • Mivel kezdődik a statisztikai tevékenység?

Nem az adatgyűjtéssel,

hanem a kategóriák megtervezésével.

  • Mi mindenről kell dönteni az adatgyűjtéssel kapcsolatban?

Kiktől? – miféle válaszok lehetségesek?

Mit, milyen adatot gyűjtünk?

Hogyan gyűjtjük?

Csákó M.: Társadalomstatisztika

sszefoglal s c lok
ÖSSZEFOGLALÁS: Célok
  • Milyen célok érdekében gyűjtünk adatot?

Leggyakrabban egy népesség/csoport leírására.

  • Szélsőséges pl.: a népszámlálás – mi baj?

Több mint 20 kötet adat – áttekinthetetlen

A „demográfiai adatok” 1 kötet (vagy 19)…

  • „Magyarországon az átlagéletkor: év”
  • vagy: „Magyarországon az átlagkereset…”

Csákó M.: Társadalomstatisztika

v ltoz k
Változók
  • Miért vizsgáljuk a dolgokat vagy személyeket?
  • mert nem egyformák, sokfélék,
  • és ráadásul változnak.
  • Dolgoknak vagy személyeknek azt a tulajdonságát, jellemzőjét, amelyet vizsgálunk, változónak nevezzük.
  • Pl.: életkor; fizetés; gyerekszám; munkahelyváltoztatások száma.
  • Nem biztos, hogy megszámlálható (pl. lakóhely).

Csákó M.: Társadalomstatisztika

a tank nyv p ld ja j vedelem az us ban
A tankönyv példája: jövedelem az USÁ-ban

Csákó M.: Társadalomstatisztika

a tank nyv p ld ja j vedelem az us ban1
A tankönyv példája: jövedelem az USÁ-ban

A függőleges tengely =

= sűrűségskála (%/egység)

Csákó M.: Társadalomstatisztika

a tank nyv gyakorl feladata 1
A tankönyv gyakorló feladata 1.

Csákó M.: Társadalomstatisztika

a tank nyv gyakorl feladata 2 3
A tankönyv gyakorló feladata 2-3.

Csákó M.: Társadalomstatisztika

a tank nyv gyakorl feladata 4
A tankönyv gyakorló feladata 4.

Csákó M.: Társadalomstatisztika

az ap k letkora grafikon
Az apák életkora: grafikon

Csoportosított adatok.

Ez a grafikon csak szemléltető eszköz

- csak egy dolgot mutat.

Csákó M.: Társadalomstatisztika

az ap k letkor szerint hisztogram
Az apák életkor szerint: hisztogram

A hisztogram pontosan megfelel az adatoknak, nemcsak szemléltet.

Csákó M.: Társadalomstatisztika

feladat rajzolj k meg a hisztogramot
Feladat: Rajzolják meg a hisztogramot!

IDE

Csákó M.: Társadalomstatisztika

k z p rt kek
KÖZÉPÉRTÉKEK
  • A középértékekkel (átlag) egy csoport gyors áttekintését kívánjuk nyújtani.
  • Alkalmazásuk feltételei:

1. legyen értelmezhető csoport, amelyet jellemez (pl. 7.osztály; bérből élők…)

2. a célnak megfelelőt válasszuk a középértékek közül

Csákó M.: Társadalomstatisztika

k z p rt kek1
KÖZÉPÉRTÉKEK
  • A középértékek fajtái:

- számtani átlag

- medián

- módusz

- négyzetes átlag

- harmonikus átlag

- mértani átlag

Csákó M.: Társadalomstatisztika

k z p rt kek2
KÖZÉPÉRTÉKEK
  • A számtani átlag a legismertebb.

Képlete: a1+a2+…+anΣa

ā = =

n n

Csákó M.: Társadalomstatisztika

k z p rt kek3
KÖZÉPÉRTÉKEK
  • Mikor jó és mikor problémás a számtani közép: pl. testvérszám; testmagasság.
  • A módusz a középtendenciát jobban kiemeli (ha van) = leggyakoribb érték
  • A medián jó jelzőszám, de előnytelen matematikailag további számításokhoz

Csákó M.: Társadalomstatisztika

k z p rt kek4
KÖZÉPÉRTÉKEK
  • A hetedikesek kérésünkre megjelölték egy [0; 100] egyenes szakaszon, hány % esélyük van rá, hogy érdemi választ kapjanak tanáraiktól a kérdéseikre.
  • Az esélyüket átlagosan 58,9%-ra becsülték.
  • A medián érték 59,8%, a módusz pedig 41-60% (mivel csoportosítottuk a válaszokat).
  • Mi a véleményük erről? Mit jelent ez? Milyenek lehetnek a vélemények részletesebben?

Csákó M.: Társadalomstatisztika

k z p rt kek5
KÖZÉPÉRTÉKEK

N= 2762 81 182  133  169 45 = 699

% 3,98,9  11,626,0  19,024,2 6,4 = 100

Átlag = 

Módusz = 40–60% 

Medián = 350. eset =

=180. a (40-60)-ban =

= 59,78  59,8 

Csákó M.: Társadalomstatisztika

k z p rt kek6
KÖZÉPÉRTÉKEK

Csákó M.: Társadalomstatisztika

k z p rt kek7
KÖZÉPÉRTÉKEK

Példa:

  • Márta néni fantasztikus matektanár:

minden osztályában eléri matekból a 3,2 átlagot,

még az összevont osztályban is!

Hogyan?

  • „a” osztály: 2- 6; 3- 1; 4- 2; 5- 3 (12 fő)
  • „b” osztály: 2- 2; 3- 6; 4- 4; 5- 0 (12 fő)

Csákó M.: Társadalomstatisztika

slide31
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

31

slide32
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

32

slide33
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

33

slide34
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

34

slide35
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

35

slide36
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

36

k z p rt kek8
KÖZÉPÉRTÉKEK

Hogyan lehetne kifejezni a két osztály különbségét?

Miben is áll ez a különbség?

Átlag „a”: 12+3+8+15=38 38/12=3,17 ≈ 3,2

Átlag: „b”: 4+18+16+0=38 38/12=3,17 ≈ 3,2

Az átlaguk azonos – mi eltérő? A szóródás

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

37

a sz r s
A SZÓRÁS

Eredmény:

A két osztály átlageredménye azonos (3,2)

de az egyikben nagy különbségek vannak a tanulók között (s  1,3), míg a másikban közel állnak egymáshoz (s  0,7).

Vagyis a szórás segítségével tudjuk számszerűsíteni a különbséget.

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

38

a sz r d s m rt ke
A SZÓRÓDÁS MÉRTÉKE

Mi a tanulság?

A valóság a szóródásban rejlik, a középérték erős absztrakció.

A mozgás mindig különbségből ered, oka tehát a különbségek okában van.

 Valamiképpen fogalmilag ki kell fejezni a változatosságot:

 a szórás mérőszámaival.

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

39

a sz r d s m r se
A SZÓRÓDÁS MÉRÉSE

Első megközelítés: szélső értékek, vagyis az eloszlás kiterjedése.

Pl. az emberi testmagasság

A legmagasabb ismert férfi:

Robert Pershing Wadlow (1918-1941) 272 cm

A legmagasabb ismert nő:

Zeng Jinlian (1964-1982) 246 cm

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

40

a sz r d s m r se1
A SZÓRÓDÁS MÉRÉSE

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

41

a sz r d s m r se2
A SZÓRÓDÁS MÉRÉSE

A valaha ismert legalacsonyabb emberek:

Nő: Pauline Musters (1876-1895) 59 cm.

Férfi: Calvin Philips (1791-1812) 67 cm.

Eleget tudunk-e így az emberi testmagas-ságról?

Nem: az eloszlás még sokféle lehet a két végpont között.

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

42

a sz r d s m r se3
A SZÓRÓDÁS MÉRÉSE

Második megközelítés

= az esetek zömének kiterjedése

= interkvartilis távolság

Pl. a tanári válasz esélye:

N= 2762 81 182  133  169 45 = 699

% 3,98,9  11,626,0  19,024,2 6,4 = 100

kvartilis = a 175. eset (40-60%)

kvartilis = medián

kvartilis = az 525. eset (80-100%)

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

43

a sz r d s m r se4
A SZÓRÓDÁS MÉRÉSE
  • Harmadik megközelítés

= az esetek átlagtól való távolságának átlaga =

= szórás (s)

  • A kiszámítás módja: négyzetes átlag

Σ(a – ā)2

s =  N

Magyarázat: az összeadás tagjai előjelesek.

(Lássuk Márta néni osztályainak példáján!)

Csákó M.: Társadalomstatisztika

slide45
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

45

slide46
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

46

slide47
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

47

slide48
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

48

slide49
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

49

slide50
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

50

slide51
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

51

slide52
WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

52

a sz r d s m r se5
A SZÓRÓDÁS MÉRÉSE

= Az osztályok különbsége abban áll, hogy az „A” osztályban az eredmények szórása csaknem kétszer akkora, mint a „B”-ben:

sa=1,3 osztályzat

sb=0,7 osztályzat

a sz r segys g
A SZÓRÁSEGYSÉG
  • 103. OLDAL ÁBRA

Csákó M.: Társadalomstatisztika

a norm lg rbe
A NORMÁLGÖRBE
  • 101. OLDAL ÁBRA

Csákó M.: Társadalomstatisztika

a norm lg rbe haszn lata
A NORMÁLGÖRBE HASZNÁLATA

Mekkora a 0 és 1 közötti intervallumba eső terület?

Csákó M.: Társadalomstatisztika

g rbe alatti ter letek
GÖRBE ALATTI TERÜLETEK

Csákó M.: Társadalomstatisztika

variancia elemz s

VARIANCIA-ELEMZÉS

FIGYELEM!

Ez a fejezet

NINCS BENNE

a tankönyvben!!!

mit l vannak a k l nbs gek
Mitől vannak a különbségek?

Az ember igyekszik egyszerűnek látni a világot (pl. átlag).

Ugyanez a törekvés a szabványosításban, a normában stb.

Kénytelenek vagyunk beengedni valahogy a sokféleséget (pl. szórás).

Ugyanez tör be a „tűrés” műszaki fogalmában, a „kalo”-ban stb.

Csákó M.: Társadalomstatisztika

59

mi kell a magyar zathoz
Mi kell a magyarázathoz ?

Mit akarunk megmagyarázni?

A szórást. (= Az esetek különbözőségét.)

Kell legalább még egy változó(= tehát ez is változik, azaz több értéke lehet)

Sőt: nem is lehet más, csak változó.

Ui. ami ugyanolyan, az nem okoz különbséget.

Egy lehetőség: a varianciaelemzés.

Csákó M.: Társadalomstatisztika

60

mire j a varianciaelemz s
Mire jó a varianciaelemzés?

Mikor használható? - Ha egy nominális (kategoriális) változóval akarunk magyarázni egy folytonos kvantitatív változót.

Példák: Mennyire befolyásolja a lakóhely a jövedelmet? vagy a dolgozó neme?

Azaz: Ha az elemek csoportokat alkotnak, felmerülhet, hogy a csoportba tartozás okozza a szóródást vagy annak egy részét

Csákó M.: Társadalomstatisztika

61

variancia elemz s1
VARIANCIA-ELEMZÉS

Variancia = teljes szórásnégyzetösszeg

vagyis az összes elem átlagtól való távolságának négyzetes összege (amiből a szórást számítjuk)

Ezt probáljuk „feldarabolni”: mekkora része származik a csoportbontásból.

Vegyünk egy példát! (A tkv. adatai, 64. old.)

Csákó M.: Társadalomstatisztika

gyereksz m s iskol zotts g
Gyerekszám és iskolázottság

Csákó M.: Társadalomstatisztika

gyereksz m s iskol zotts g1
Gyerekszám és iskolázottság

Csákó M.: Társadalomstatisztika

gyereksz m s iskol zotts g2
Gyerekszám és iskolázottság

Csákó M.: Társadalomstatisztika

teljes variancia csoportok s f tlag k z tti csoporton bel li variancia
Teljes variancia = (csoportok és főátlag közötti) + csoporton belüli variancia

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

Csákó M.: Társadalomstatisztika

variancia elemz s2
VARIANCIA-ELEMZÉS

Hány változót használtunk?

Kettőt! 1. gyerekszám; 2. iskolázottság

Milyen változók ezek?

a gyerekszám kvantitatív és diszkrét*

az iskolázottság kvalitatív (dichotóm) – itt!

A varianciaelemzés akkor használható, ha egy kvalitatív változónak egy kvantitatív változóra való hatását akarjuk megtudni.

(* Valójában csak folytonos változók varianciáját lehet felbontani. Ezt sokszor nem tartják be. Itt pedig a számítások egyszerűsége és az adatok hozzáférhetősége miatt használtunk diszkrét változót.)

Csákó M.: Társadalomstatisztika

a korrel ci

A KORRELÁCIÓ

Csákó M.: Társadalomstatisztika

a varianciaelemz st l a korrel ci ig
A varianciaelemzéstől a korrelációig
  • A varianciaelemzés megmutatta egy nominális (kategoriális) változó hatását egy folytonos kvantitatív változóra.
  • De mit csináljunk, ha a magyarázó változónk is folytonos kvantitatív? (Pl. testmagasság a testsúly magyarázatára, vagy életkor a kereset magyarázatára

Minden egyes esetet mégsem tekinthetünk külön kategóriának!

Csákó M.: Társadalomstatisztika

69

hogyan br zolunk k t v ltoz t
Hogyan ábrázolunk két változót?

a konkrét eset

Csákó M.: Társadalomstatisztika

70

hogyan br zolunk k t v ltoz t gyakorl s
Hogyan ábrázolunk két változót? (Gyakorlás)

Ábrázoljunk néhány apa-fiú párt!

Legyen F=A;

F=A+5cm;

F=A-2cm;

F=A+17cm;

minden F = A+15% !

Figyeljük meg az esetek elhelyezkedését a F=A szabályhoz képest!

Csákó M.: Társadalomstatisztika

71

descartes f le koordin tarendszer
Descartes-féle koordinátarendszer

Két változó értékei (adatpár) egy pontot határoz meg: P(x,y)

Két pont meghatároz egy egyenest.

Egyenlete: y=mx+b

Mikor egyenes két változó kapcsolatának képe?

(pl. az apák és fiak testmagasságának összefüggése?)

Haszigorú függvénykapcsolat van közöttük: vagyis ha az apa magasságából egyértelműen meg lehet mondani a fia magasságát.

Csákó M.: Társadalomstatisztika

72

descartes f le koordin tarendszer1
Descartes-féle koordinátarendszer

Csákó M.: Társadalomstatisztika

73

descartes f le koordin tarendszer2
Descartes-féle koordinátarendszer

Csákó M.: Társadalomstatisztika

74

van e itt szigor f ggv nykapcsolat
Van-e itt szigorú függvénykapcsolat?

Csákó M.: Társadalomstatisztika

75

k t v ltoz kapcsolata
Két változó kapcsolata

A társadalomban nincs szigorú függvénykapcsolat.

A kapcsolat képe nem egyenes,

hanem pontfelhő.

Különböző alakú pontfelhők lehetnek.

Hogyan lehetne őket pontosabban leírni?

Csákó M.: Társadalomstatisztika

76

pr b ljuk k r lrajzolni
Próbáljuk körülrajzolni

Csákó M.: Társadalomstatisztika

77

k r lrajzol s mit tudunk hozz
Körülrajzolás: mit tudunk hozzá?

Az apák magasságának

a) átlagát,

b) szórását

A fiak magasságának

c) átlagát,

d) szórását.

Csákó M.: Társadalomstatisztika

78

hogyan haszn ljuk amit tudunk
Hogyan használjuk, amit tudunk?

Csákó M.: Társadalomstatisztika

79

milyen lesz a pontfelh alakja
Milyen lesz a pontfelhő alakja?

Csákó M.: Társadalomstatisztika

80

korrel ci s egy tthat sz m t sa
Korrelációs együttható számítása

r = (standard x * standard y) átlaga

átszámítjuk standard értékbe mind x-et, mind y-t*;

minden pontra összeszorozzuk

a szorzatokat átlagoljuk.

* Vagyis a szórásukkal fejezzük ki őket: hány szórásnyira vannak az átlaguktól.

Csákó M.: Társadalomstatisztika

81

a korrel ci s egy tthat s a pontfelh
A korrelációs együttható és a pontfelhő

Csákó M.: Társadalomstatisztika

82

a korrel ci s egy tthat s a pontfelh1
A korrelációs együttható és a pontfelhő

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

83

83

korrel ci s egy tthat
Korrelációs együttható

Az előző ábrákban látható, hogy

0 ≤ r ≤ 1

De ezt még tovább finomítjuk gyakorlati példák segítségével.

Csákó M.: Társadalomstatisztika

86

kutat si p ld k a korrel ci ra
Kutatási példák a korrelációra

Csákó M.: Társadalomstatisztika

negat v korrel ci s egy tthat k
Negatív korrelációs együtthatók

Csákó M.: Társadalomstatisztika

negat v korrel ci s egy tthat k1
Negatív korrelációs együtthatók

Csákó M.: Társadalomstatisztika

negat v korrel ci s egy tthat k2
Negatív korrelációs együtthatók

Csákó M.: Társadalomstatisztika

korrel ci s egy tthat1
Korrelációs együttható

Az előző ábrákban látható, hogy ki kell terjesztenünk r értékét a negatív számok felé:

-1 ≤ r ≤ 1

.Ha r = -1 : szigorú negatív függvénykapcsolat,

Ha r = 0, akkor nincs kapcsolat,

Ha r = 1 : szigorú pozitív függvénykapcsolat

Csákó M.: Társadalomstatisztika

92

a sz r segyenes
A szórásegyenes

Csákó M.: Társadalomstatisztika

kiv telek
Kivételek
  • Az r csak lineáris kapcsolatok erőssége mérésére alkalmas.
  • A baloldali pontfelhő nem egy egyenes mentén szóródik.

Csákó M.: Társadalomstatisztika

kiv telek1
Kivételek

Csákó M.: Társadalomstatisztika

kiv telek2
Kivételek
  • Problémákat okozhatnak az un. magányos elemek. (Pl. magas apa törpenövésű fia; vagy: milliárdos villája egy felsőközép-rétegű kertvárosi kerületben – egymaga elhúzza az átlagot)
  • Megoldás lehet: kihagyjuk őket
    • Lásd ezt a megoldást pontozásos sportoknál: síugrás, műkorcsolyázás
  • De csak óvatosan, mert a valósághoz ezek is hozzátartoznak! Kihagyásuk is torzít.

Csákó M.: Társadalomstatisztika

a korrel ci s egy tthat rdekess gei
A korrelációs együttható érdekességei
  • Az r nem az abszolút számok közötti kapcsolatot méri, hanem a szóráshoz képest vett adatok kapcsolatát
  • Miért?
  • Mert standard egységbe számoltuk át az adatokat – más szóval: a szóráshoz viszonyítottuk őket.

Csákó M.: Társadalomstatisztika

a korrel ci s egy tthat rdekess gei1
A korrelációs együttható érdekességei

Az r értéke nem változik, ha…

a) … x értékeit ugyanazzal a számmal megszorozzuk.

b) … x értékeihez ugyanazt a számot hozzáadjuk (kivonjuk).

c) … a változókat (x, y) felcseréljük. Oksági összefüggést nem jelent!

Csákó M.: Társadalomstatisztika

a korrel ci s egy tthat rdekess gei2
A korrelációs együttható érdekességei

Un. ökológiai korrelációk

  • Azokat a korrelációkat hívjuk így, amelyeket csoportosított adatokból számítottak.
  • Pl. Doll: cigarettafogyasztás – tüdőrák országonként (11 ország)
  • Pl. iskolázottság és jövedelem kapcsolata USA teljes (25-54 éves): r = 0,44 államokra átlagolva 51 adatpárból: r = 0,64

Csákó M.: Társadalomstatisztika

a korrel ci s egy tthat rdekess gei3
A korrelációs együttható érdekességei

Saját „ökológiai korrelációs” példám:

  • Szakmunkástanulók 21 rangsora alapján képzett kategóriák szépen szétváltak. ( társadalmi szakmablokkok)
  • Diszkriminancia-elemzéssel kevéssé rekonstruálható
  • Ok: a csoportokon belüli szórást figyelmen kívül hagytuk.

Csákó M.: Társadalomstatisztika

mit jelent a regresszi
Mit jelent a regresszió?
  • Politikai-köznyelvi értelemben: a progresszió = haladás, akkor a regresszió = visszafejlődés
  • A statisztikában más a jelentése: két összefüggő változó egyikénekvisszavezetése a másikra
  • Pl. a testsúly és a testmagasság összefügg  megpróbálhatjuk visszavezetni a testsúlyt a test-magasságra (ld. a tkv. példáját)

Csákó M.: Társadalomstatisztika

a regresszi l p senk nt 1
A regresszió lépésenként – 1.

Csákó M.: Társadalomstatisztika

a regresszi l p senk nt 2
A regresszió lépésenként – 2.

Az átlag + 1 szórás

testmagassághoz

tartozó testsúlyátlag

Csákó M.: Társadalomstatisztika

a regresszi l p senk nt 3
A regresszió lépésenként – 3.

A magasság ± 2 szórásához

tartozó testsúlyátlagok

Csákó M.: Társadalomstatisztika

a regresszi l p senk nt 4
A regresszió lépésenként – 4.

A testmagasság szórásaihoz

tartozó testsúlyátlagokat

összekötő egyenes: a

regressziós egyenes.

Csákó M.: Társadalomstatisztika

a regresszi l p senk nt 5
A regresszió lépésenként – 5.
  • Figyeljék meg a szórásegyenes és a regressziós egyenes viszonyát!
  • A regressziós egyenes kevésbé meredek. Miért?
  • Mert az egyes esetek nem ugyanannyira térnek el a magasság átlagától, mint a testsúly átlagától.
  • Milyen kapcsolat lenne, ha ugyanannyira térnének el?

Csákó M.: Társadalomstatisztika

regresszi y becsl se
Regresszió = y becslése
  • y x-re vonatkozó (vagy: x szerinti) regressziós egyenese becslést ad az egyes x értékekhez tartozó y értékek átlagára.
  • Az x egy szórásnyi változásához átlagosan az y értékek r szórásnyi változása kapcsolódik.
  • A korrelációs együttható csak a kapcsolat erősségét mutatja meg, az összefüggés módját pedig a regressziós egyenes.

Csákó M.: Társadalomstatisztika

regresszi y becsl se1
Regresszió = y becslése

ahol r = a korrelációs együttható !

Csákó M.: Társadalomstatisztika

regresszi y becsl se2
Regresszió = y becslése

Csákó M.: Társadalomstatisztika

egyedi eset becsl se
Egyedi eset becslése

Becslés egy adott magasságú egyén

súlyára = az átlag!

Csákó M.: Társadalomstatisztika

egyedi eset becsl se1
Egyedi eset becslése

Regressziós

egyenes

A hiba természetesen negatív előjelű is lehet.

Csákó M.: Társadalomstatisztika

a regresszi sz m t s felt telei
A regressziószámítás feltételei
  • Kvantitatív változók
  • Folytonos változók
  • Normáleloszlás (haranggörbe-szerű)
  • „Rögbilabda alakú” pontfelhő
  • Lineáris kapcsolat

Csákó M.: Társadalomstatisztika

gyakorlatok 1
Gyakorlatok – 1.

Csákó M.: Társadalomstatisztika

gyakorlatok 2
Gyakorlatok – 2.

Egy hallgatót 650 ponttal vettek fel az egyetemre. Tippeljük meg az évvégi tanulmányi átlagát! (Tkv. 196–197.)

Tudjuk hozzá:

  • a felvételi pontátlaga = 550; szórása 80 p.
  • az évvégi átlag = 2,6; szórása = 0,6
  • a felvételi pontok és az évvégi átlag közötti kapcsolat: r = 0,4

Csákó M.: Társadalomstatisztika

gyakorlatok 21
Gyakorlatok – 2.

A megoldás menete:

1 – Mennyivel jobban felvételizett az átlagnál?

2 – Regressziós becslés a tanulmányi eredmény átlagtól való eltérésére

3 – Mennyit jelent ez az eltérés osztályzatban?

4 – Mit jelent ez az eredmény?

Csákó M.: Társadalomstatisztika

k vetkeztet s y b l x re
Következtetés y-ból x-re
  • Ugyanolyan számítással becsülhetjük-e a testmagasságot a testsúlyból, ahogyan a testsúlyt becsültük a testmagasságból?

Csákó M.: Társadalomstatisztika

k t regresszi s egyenes van
Két regressziós egyenes van!
  • y-nak x szerinti regressziós egyenesének meredeksége: r*(y szórása)
  • x-nek y szerinti regressziós egyenesének meredeksége: r*(x szórása)

súlyátlag=160

magasságátlag=70

Csákó M.: Társadalomstatisztika

mintav tel
MINTAVÉTEL

Mit nevezünk mintának?

  • A kutatók többnyire az emberek egy nagyobb csoportjáról – ez a populáció – szeretnének megállapítani számszerű adatokat – un. paramétereket.
  • Mivel a populáció túl nagy, kiválasztanak belőle egy részt, és csak arról gyűjtenek adatokat. Ez a kiválasztott rész a minta.
  • A paramétereket a minta adataiból becsülik: fel-tételezve, hogy a minta olyan, mint a populáció.

Csákó M.: Társadalomstatisztika

mintav tel1
MINTAVÉTEL

DE OLYAN-E A MINTA, MINT A POPULÁCIÓ?

Mikor lesz jó a becslés?

Ha a minta tényleg olyan, mint a populáció.

Hogyan tudhatnánk meg?

Össze kéne hasonlítani! De ezt nem lehet: hiszen épp azért veszünk mintát, mert az egész populációt nem tudjuk megnézni.

Csak azt tudjuk ellenőrizni,

hogyan választották ki a mintát.

Csákó M.: Társadalomstatisztika

mintav tel2
MINTAVÉTEL

Példa a mintavételi eljárás fontosságára:

Roosevelt és Landon megválasztási esélye (1936):

  • A Literary Digest előrejelzése: 43%
  • a Gallup előrejelzése: 56%
  • Roosevelt eredménye: 62%

A különbség oka: a mintavétel módja

Csákó M.: Társadalomstatisztika

mintav tel3
MINTAVÉTEL

A Literary Digest eljárása:

  • postai kérdőív 10 millió (!) embernek

A neveket honnan választják? telefonkönyvekből, klubnévsorokból

DE: a telefonja a családok ¼ részének volt!

 ez a minta torzít a gazdagok javára!

Csákó M.: Társadalomstatisztika

mintav tel4
MINTAVÉTEL

Kétféle torzítás fordul elő:

  • mintavételi torzítás (mint láttuk)
  • a nem válaszolók torzítása

Akik nem válaszolnak, azok nagyon különbözhetnek a válaszolóktól!

(Ez az egyik nehézsége ma a választási előrejelzéseknek Magyarországon.)

Csákó M.: Társadalomstatisztika

mintav tel5
MINTAVÉTEL

A véletlen mintavétel a legjobb módszer

= a populáció minden tagjának ugyanakkora esélye legyen bekerülni a mintába.

Az egyszerű véletlen mintavétel valójában visszatevés nélküli sorsolás (mint a lottó).

De így változik a későbbi húzások valószínűsége!

Ha nagy a populáció, egy húzás valószínűségét elhanyagolhatóan növeli csak, hogy nem tesszük vissza a kihúzottakat. (Pl. 1/68000; 1/67999…)

Ez is ritkán valósítható meg, ezért többnyire többlépcsős csoportos mintavételt alkalmazunk.

Csákó M.: Társadalomstatisztika

mintav tel6
Mintavétel

Az egyszerű véletlen mintavétel ritkán valósítható meg, ezért többnyire többlépcsős csoportos mintavételt alkalmazunk.

Pl. osztályokat választunk, abból diákokat:

Legyen Bp-en 500 hetedik osztály, és válasszunk belőle 50-et.

Hányféleképpen lehet?

első 2. 3. … 49. 50.

500*499*498*…*452*451 = legalább 133 számjegyű !

A megítélése valószínűségszámítási feladat.

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

126

2 val sz n s gsz m t s

2. Valószínűségszámítás

2.1. Alapfogalmak, szabályok

2.2. A binomiális formula

2.3. Várható érték és standard hiba

es lyek val sz n s g
Esélyek, valószínűség
  • Valószínűség = az eseteknek várhatóan hány százalékában fog bekövetkezni a dolog, ha sokszor, egymástól függetlenül, azonos körülmények között megismételjük a kísérletet. (rövidítése: p – probability)
  • Egy dolognak és az ellentétének a valószínűsége együtt mindig = 100%. (Vagyis: A + nemA = 1)

Csákó M.: Társadalomstatisztika

es lyek val sz n s g1
Esélyek, valószínűség
  • Véletlenszerű húzás esetén egy dobozban lévő minden lap/golyó kihúzásának ugyanakkora az esélye.
  • Ha visszatevéssel húzunk egymás után többször, akkor ez az esély nem változik.
  • Ha nem tesszük vissza a kihúzott lapot, akkor a következő húzásnál eggyel kevesebb lapból húzunk  nő az esély.

Csákó M.: Társadalomstatisztika

gyakorl s 1
Ugyanolyan valószínű, hogy bekövetkezik. mint hogy nem.

Ez egészen biztosan bekövetkezik.

Ez nem következhet be.

Bekövetkezhet, de nem valószínű.

Nagyon valószínű, de nem biztos.

Programhiba

Gyakorlás 1.

Melyik számnak melyik állítás felel meg?

- 50%

0%

10%

50%

90%

100%

200%

Csákó M.: Társadalomstatisztika

gyakorl s 2
Gyakorlás 2.
  • 1000-szer dobunk egy érmével. Hány fejre számíthatunk?
  • 100 lapot húzhatunk két doboz egyikéből, visszatevéssel. Minden húzásért annyi $-t kapunk, amekkora szám a lapon van. Melyik dobozt választaná? Miért?

1

2

1

3

Csákó M.: Társadalomstatisztika

es lyek val sz n s g2
Esélyek, valószínűség
  • Feltétlen valószínűség:
    • pl. annak a valószínűsége, hogy a pikk dáma a második lap a pakliban. (1/52)
  • Feltételes valószínűség:
    • pl. annak a valószínűsége, hogy a pikk dáma a második lap, HA az első a kőr 7. (1/51 – mert az első lapot már kivettük.)

Csákó M.: Társadalomstatisztika

es lyek val sz n s g3
Esélyek, valószínűség

Példa: Mi a valószínűsége annak, hogy elsőre a pikk dámát, és azt megtartva, másodikra a kőr királyt húzzuk a pakliból?

Pikk dáma: 1/52

Kőr király: 1/51

Szorzási szabály:

  • Két esemény együttes bekövetkezésének valószínűsége = külön-külön valószínűsé-gük szorzata (pa,b= pa*pb; pl.: 1/52*1/51)

Csákó M.: Társadalomstatisztika

es lyek val sz n s g4
Esélyek, valószínűség

Független és nem független események:

  • nem független a második esemény, ha valószínűsége függ az első bekövetkezésétől;
  • Visszatevés nélküli húzások összefüggenek, visszatevésesek függetlenek egymástól.
  • Nem független események együttes bekövetkezésekor a feltételes valószínűségeket szorozzuk össze, független eseményeknél feltétel nélküli valószínűségüket.

Csákó M.: Társadalomstatisztika

es lyek val sz n s g5
Esélyek, valószínűség

Függetlenség  kölcsönös kizárás (!!!)

Két esemény kölcsönösen kizárja egymást, ha egyik bekövetkezése esetén a másik nem következhet be.

Összeadási szabály: két egymást kölcsönö-sen kizáró esemény közül legalább az egyik bekövetkezésének valószínűsége = = a kettő valószínűségeinek összege.

Csákó M.: Társadalomstatisztika

es lyek val sz n s g6
Esélyek, valószínűség

Szorzáskor

Összeadáskor

Csákó M.: Társadalomstatisztika

ism tl gyakorlat
Ismétlő gyakorlat

Egy-egy lapot húzunk az „A” és a „B” dobozból.

Állapítsák meg annak valószínűségét, hogy…

  • a húzott számok egyike 2 és a másika 5.
  • a számok összege 7.
  • a két szám egyenlő.

1

2

3

4

5

1

2

3

4

5

6

„B” doboz

„A” doboz

Csákó M.: Társadalomstatisztika

ism tl gyakorlat bemutat sa
„A”=1 és „B”=6.

„A”=2 és „B”=5.

„A”=3 és „B”=4.

„A”=4 és „B”=3.

„A”=5 és „B”=2.

b) Hányféle „kimenet” van összesen?

Akkor p(7) = ?

Ismétlő gyakorlat (bemutatása)

1

2

3

4

5

1

2

3

4

5

6

„B” doboz

„A” doboz

Mi annak valószínűsége, hogy a számok összege 7

a) hányféleképpen fordulhat elő a 7 mint összeg?

Csákó M.: Társadalomstatisztika

kutat si p lda
Kutatási példa

A középiskolások jogtudatának fokát azzal mértük, hogy három gyakorlati példából hányban ismerik fel, mihez van joguk. Kérdésenként 3 válaszból kellett a helyeset kiválasztani.

Csákó M.: Társadalomstatisztika

kutat si p lda1
Melyik eredménynek mekkora a valószínűsége?

Hányféleképpen lehet 0 találat? Nem 1-féleképpen!!!

Jelöljük az 1. kérdést normál, a 2.-at dőlt, a 3.-at vastag betűkkel, legyen R=rossz, J=jó, és számozzuk a lehetséges válaszokat!

0: (R1 R1R1)

(R1 R1R2) (R1 R2 R1) (R2 R1 R1)

ugyanez a számok felcserélésével

(R2 R2R2)

Vagyis: 8-féleképpen lehet 0 szintű jogtudat!!!

Kutatási példa

Csákó M.: Társadalomstatisztika

kutat si p lda2
Kutatási példa

Jelöljük az ábrán az egyes szintek valószínűségét!

Csákó M.: Társadalomstatisztika

kutat si p lda3
Kutatási példa
  • Megállapítás: A magyar középiskolások jogismereti válaszainak eloszlása nem tér el attól, mintha csak találgatnának.
  • Következtetés: A magyar középiskolások általában nem ismerik a jogaikat.
  • A valószínűségi eloszlás figyelembe vétele ahhoz segített, hogy ne csak a normához (3), hanem a „0-ponthoz” is mérhessünk.
  • Mire gondolhatnánk, ha 0 találatból több, 2 és 3 találatból sokkal kevesebb lenne, mint valószínű?

Csákó M.: Társadalomstatisztika

es lyek val sz n s g7
Esélyek, valószínűség

Példa: Mekkora a valószínűsége annak, hogy a lottón a 8-jegyű joker-számban két 0 lesz?

  • Tíz szám közül húznak, visszatevéssel. Mennyi a kedvező eset, és mennyi az összes?

Egyszerűbb példa: 5-ször húzunk visszatevéssel 9 zöld és 1 piros golyó közül – mekkora a való-színűsége annak, hogy kétszer húzunk pirosat?

  • Itt könnyű listát csinálni a kedvező esetekről: PPZZZ PZPZZ PZZPZ PZZZP ZPPZZ ZPZPZ ZPZZP ZZPPZ ZZPZP ZZZPP (10 kedvező)

Csákó M.: Társadalomstatisztika

binomi lis egy tthat
Binomiális együttható

A binomiális együttható azt mondja meg, hányféleképpen lehet sorba rendezni n elemet, ha közülük k egyfajtájú és n-k egy másik fajtájú:

n!

k! * (n-k)!

Az előbbi példa lehetséges sorrendjei: 5! 5*4*3*2*1

2!*(5-2)! (2*1)*(3*2*1)

(Ha bonyolultnak látszik a mondat, helyettesítse be így:

k = „néhány”

n-k = „a többi”.)

=

=

5*2 = 10

Csákó M.: Társadalomstatisztika

binomi lis formula
Binomiális formula

A formula nem más, mint a binomiális együttható alkalmazása a keresett valószínűség kiszámítá-sára (k és n-k valószínűségével kell szorozni).

Pl. a piros és zöld golyók esetében:

p(piros) = 1/10; p(zöld) = 9/10

Két piros golyóra p=(1/10)2 …. (a kitevő=k),

Három zöld golyóra p=(9/10)3 …. (a kitevő=n-k).

Csákó M.: Társadalomstatisztika

a nagy sz mok t rv nye
A nagy számok törvénye

Ha több „fej” jött egymás után, megnő-e az „írások” valószínűsége?

NEM!

=> Mindig 50% marad.

  • Minél hosszabb a feldobás-sorozat, annál nagyobb az abszolút eltérés a várható értéktől, de annál kisebb az eltérés százalékban.
  • De mindig van „véletlen hiba”.

Csákó M.: Társadalomstatisztika

a nagy sz mok t rv nye1
A nagy számok törvénye

A dobások számá-val a hiba abszolút nagysága nő.

A dobások számá-nak növekedésével a „fejek” aránya egyre kevésbé tér el az 50%-tól.

Csákó M.: Társadalomstatisztika

a nagy sz mok t rv nye2
A nagy számok törvénye

„Fejek” száma = várható érték + véletlen hiba

  • A véletlen hiba a dobások számával nő,
  • de egyre kevésbé tér el az 50%-tól.
  • A véletlen hiba nagyjából a dobások száma sokszorozódásának négyzetgyöke arányában nő.
  • = 100-szor annyi dobás hibája kb. 10-szeresre nő

Csákó M.: Társadalomstatisztika

v letlen folyamatok
Véletlen folyamatok
  • Az érme feldobálása, a rulettezés, egy választási előrejelzés mintavétele – mind véletlen folyamat, vagyis:
  • a következő dobásoknál, pörgetésnél, mintavételnél más lesz a fejek, a nyertesek, a szocialisták és jobbikosok aránya.
  • A statisztika megpróbálja kiszámítani közelítőleg, h. mennyire függenek a számok a véletlentől.

Csákó M.: Társadalomstatisztika

v letlen folyamatok1
Véletlen folyamatok

Két fő gondolat:

1. hasonlóságot keresünk a minket érdeklő véletlen folyamat (mintavétel) és egy dobozból való véletlen húzások között;

2. a bennünket érdeklő ingadozást (pl. Fidesz szavazók becsült aránya) párhuzamba állítjuk a dobozból húzott számok összegének véletlen ingadozásával.

Csákó M.: Társadalomstatisztika

dobozmodell bevezet se
Dobozmodell bevezetése
  • Ebből a dobozból húztunk 25-ször, vissza-tevéssel, feljegyeztük a lapokra írt számokat, és összeadtuk őket.
  • Tízszer megismételtük a sorozatot és a következő eredményeket kaptuk:

88 84 80 90 83 78 95 94 80 89

1

2

3

4

5

6

Csákó M.: Társadalomstatisztika

dobozmodell bevezet se1
Dobozmodell bevezetése

Csákó M.: Társadalomstatisztika

dobozmodell bevezet se2
Dobozmodell bevezetése

Jó, hogy ezt tudjuk a húzás-sorozatokról, de

hogyan csináljunk modellt?

Az alapvető eldöntendő kérdések:

  • Milyen számok kerüljenek a dobozba?
  • Melyikből mennyi?
  • Hányat húzzunk?

Egyelőre csak szerencsejátékokra nézzük. (Rulett)

Csákó M.: Társadalomstatisztika

dobozmodell bevezet se3
Dobozmodell bevezetése

Szerkesszünk dobozmodellt nevadai ruletthez!

A fő: a dobozból minden számot ugyanolyan valószínűséggel húzhassunk, mint amekkora a annak a valószínűsége, hogy annyit nyerjünk a valóságban.

Tegyünk fel 1$-t a

a) párosra

b) harmadik tucatra

c) sarokra (négy számra)

Csákó M.: Társadalomstatisztika

dobozmodell s mintav tel
Dobozmodell és mintavétel
  • Dobozmodellel tudjuk ellenőrizni (vala-mennyire) a mintavételünket:
  • Ha ismerjük a populáció egy változójának eloszlását (pl. férfi/nő), akkor kiszámíthat-juk, mekkora lehet a standard hiba a mintában.

Csákó M.: Társadalomstatisztika

dobozmodell bevezet se4
Dobozmodell bevezetése

Fontos fogalmak:

várható érték = a modell alapján várt összeg

véletlen hiba = a várható érték eltérése a ténytől

standard hiba = a modell alapján várt eltérés

összeg = várható érték + véletlen hiba

várható érték = (doboz átlaga)* húzások

standard hiba = a doboz szórása* húzások

Csákó M.: Társadalomstatisztika

dobozmodell s mintav tel1
Dobozmodell és mintavétel

Pl. (a tkv-ből):

Egy populációban 46% férfi és 54% nő van.

Az első 100 fős mintában 51% ffi és 49% nő.

mintabeli % = alapsokaságbeli % + véletlen hiba

  • Egyszerű véletlen mintában a %-arány várható értéke = alapsokaságbeli %-arány.
  • A %-arány standard hibájához szükségünk van a darabszám standard hibájára:

a darabszám standard hibája

a %-arány standard hibája

= * 100%

a minta nagysága

Csákó M.: Társadalomstatisztika

mintav tel s standard hiba
Mintavétel és standard hiba
  • A mintabeli darabszám standard hibája a mintanagyság négyzetgyökével arányosan nő.
  • A mintabeli %-arány standard hibája a mintanagyság négyzetgyökével arányosan csökken.

Csákó M.: Társadalomstatisztika

a statisztikai becsl s
Mit tehetünk akkor, ha nem ismerjük az alapsokaság eloszlását? (épp azt keressük)

Pl. hányan regisztráltatnák magukat?

A mintabeli arányt fogadjuk el a doboz szórásának megállapításához (100 fős minta 10000 választóból)

(pl. 64 igen 36 nem  s=0,64*0,36 = 0,2304 = 0,48)

A standard hiba akkor 100 * 0,48 = 4,8

vagyis a regisztrálók aránya 64% ± 4,8%

Ez az un. bootstrap módszer.

A statisztikai becslés

1

0

?? db

?? db

Csákó M.: Társadalomstatisztika

a statisztikai becsl s1
A statisztikai becslés

Konfidencia-intervallum =

Milyen határok között megbízható a becslés?

  • A normálgörbét vesszük segítségül:

± 2SH-n belül 95% biztonságú!

Csákó M.: Társadalomstatisztika

mire j a szignifikancia pr ba
Mire jó a szignifikancia-próba?
  • Válaszol arra a kérdésre, hogy egy eredmény a véletlen műve-e, vagy valami más oka kell legyen.
  • Más megfogalmazásban: származhat-e az eredmény a mintavétel véletlen ingadozásából?

Csákó M.: Társadalomstatisztika

mire j a szignifikancia pr ba1
Mire jó a szignifikancia-próba?

Pl. adótörvényt egyszerűsítő törvényjavaslat

  • A javaslat szerint a beszedett adó mennyisége nem fog változni.
  • Mit is jelent ez?

∑ változás = új adózás – régi adózás = 0.

Ha v > 0, akkor többet szednek be;

ha v < 0, akkor kevesebbet szednek be.

Csákó M.: Társadalomstatisztika

mire j a szignifikancia pr ba2
Mire jó a szignifikancia-próba?

Ellenőrzés: mekkora lehet a standard hiba?

Lépések:

  • 100 lapos mintát vettek 100 000 adólapból.
  • Mintaátlag = - 219 $; szórás 725 $
  • Eredhet-e a várt 0 $ és a „tényleges” -219 $ különbsége a mintavétel véletlen ingadozásából?
  • Dobozmodellt készítenek: 100000 lappal és 100-at húznak közülük.
  • A doboz szórását az adatok szórásával becsülik!
  • Akkor SH = 100 * 725 $ / 100 = 72,5 $

Az átlag (-219$) a feltevéstől (0$) 3 SH-nyira van!

Csákó M.: Társadalomstatisztika

mire j a szignifikancia pr ba3
Mire jó a szignifikancia-próba?

Mit is jelent ez?

  • Használjunk normális közelítést! (Az adóváltozások eloszlása nem normális, de az átlag körüli ingadozás normális!)
  • Az átlag ekkora eltérésének valószínűsége mindössze p = 1‰ – tehát nem véletlen.

 tehát a kincstár valószínűleg átlagosan >200 $-t fog veszteni adófizetőnként, azaz összesen kb. 20 md-ot (100 000 adózóval)

Csákó M.: Társadalomstatisztika

mit haszn ltunk a p ld ban
Mit használtunk a példában?
  • A (null)hipotézist (változás = 0)
  • Mintavételt (átlag, szórás)
  • Az ellenhipotézist (változás = -219$)
  • Dobozmodellt
  • Az átlag körüli véletlen ingadozásról szerzett ismereteket (SH számítása)
  • A normális közelítést

Csákó M.: Társadalomstatisztika

szignifikancia pr ba
Szignifikancia-próba

Nullhipotézis = Az eltérést a véletlen okozza.

Ellenhipotézis = Az eltérésnek más oka van.

  • Dobozmodell nélkül nincs korrekt szignfikancia-próba!

Próbastatisztika – azt méri, mennyire térnek el az adatok a nullhipotézis szerint várható értéktől.

Ezekkel kiszámítjuk a szignifikanciaszintet.

Csákó M.: Társadalomstatisztika

szignifikancia pr ba1
Szignifikancia-próba

z-próba: z =

A z-próba azt mondja meg, hogy a megfigyelt érték hány standard hibányira van a nullhipotézis alapján kiszámolt várható értéktől.

A z-próbát két független minta össze-hasonlítására is használhatjuk.

megfigyelt érték – várható érték

standard hiba

Csákó M.: Társadalomstatisztika

szignifikanciaszint
Szignifikanciaszint
  • Megfigyelt szignifikanciaszint = annak valószínűsége, hogy olyan szélsőséges próbastatisztikát kapunk, mint amit meg-figyeltünk – ehhez feltesszük, hogy a nullhipotézis igaz.
  • NEM AZT jelenti, hogy mennyire valószínű a nullhipotézis,
  • hanem azt, hogy mennyire valószínű a próbastatisztika, HA igaz a nullhipotézis.

Csákó M.: Társadalomstatisztika

szignifikancia pr b k
Szignifikancia-próbák

z-próba (az előbb láttuk) – nagy mintára

t-próba – olyan, mint a z-próba, de kis mintán alkalmazható torzítás nélkül

χ2-próba (khí-négyzet próba) – több kategória összehasonlítására alkalmas: összeadja a (megfigyelt érték – várható érték)

SH törteket.

Az összeg már nem normáleloszlású, ezért külön táblázat tartalmazza a χ2-görbék alatti területekhez tartozó valószínűségeket.

Csákó M.: Társadalomstatisztika

2 pr ba sz m t sa
χ2-próba számítása

Csákó M.: Társadalomstatisztika

2 pr ba sz m t sa1
χ2-próba számítása

Csákó M.: Társadalomstatisztika

szignifikancia
χ2-próba számításaSZIGNIFIKANCIA

Csákó M.: Társadalomstatisztika

szignifikancia1
χ2-próba számításaSZIGNIFIKANCIA

Csákó M.: Társadalomstatisztika

szignifikancia2
χ2-próba számításaSZIGNIFIKANCIA

Csákó M.: Társadalomstatisztika

2 pr ba sz m t sa2
χ2-próba számítása

A fiúk és lányok tanulmányi eredményének összehasonlításában a χ2-összeg = 10,16

A táblázat szabadságfoka (df) = ahány cella „szabadon” kitölthető, ha ismerjük a „peremeloszlást” (=az „összesen”-eket) – ez most itt df = 2.

Nézzük meg a táblázatot (585. oldal) !

A szabadságfok = 2 sorban

a legnagyobb szám 9,21 – és ott p = 1% !

Csákó M.: Társadalomstatisztika

2 pr ba sz m t sa3
χ2-próba számítása

Mit jelent ez?

  • Értelmezés: Azt, hogy ilyen nagy próbastatisztikát (χ2 =10,16) csak 1%-nál is kisebb valószínűséggel kaphatnánk véletlenül. Vagyis:
  • Következtetés: Nyugodtan elvethetjük azt a null-hipotézist, hogy a fiúk és a lányok tanulmányi eredménye közötti eltérés oka pusztán a véletlen mintavétel. A fiúk és a lányok eredménye tényleg különbözik egymástól.

Csákó M.: Társadalomstatisztika

sszefoglal s1
ÖSSZEFOGLALÁS

Csákó M.: Társadalomstatisztika

mir l sz lt ez a kurzus
Miről szólt ez a kurzus?

Megszámlálható és megmérhető dolgok adatainak kezeléséről :

- hogyan tudjuk leírni őket;

- hogyan tudunk jellemzőik alapján következtetéseket levonni;

- hogyan tudunk közöttük kapcsolatokat megállapítani;

- hogyan tudunk olyanokat megismerni, amelyekhez nem férünk hozzá;

- hogyan tudunk megbizonyosodni arról, hogy következtetéseink nem a véletlen művei.

Csákó M.: Társadalomstatisztika

mir l sz lt ez a kurzus1
Miről szólt ez a kurzus?
  • Leírás: hisztogram, átlag, szórás
  • Következtetések normálgörbével
  • Kapcsolatok megállapítása: varianciaelemzéssel, korreláció- és regressziószámítással
  • Az alapsokaság paramétereinek becslése mintavétellel
  • A valószínűségszámítás alkalmazása a standard hiba kiszámítására és a minta véletlen ingadozásának ellenőrzésére (dobozmodellel)

Csákó M.: Társadalomstatisztika

ad