T rsadalomstatisztika
Download
1 / 181

TÁRSADALOMSTATISZTIKA - PowerPoint PPT Presentation


  • 79 Views
  • Uploaded on

Wesley János Lelkészképző Főiskola. Pedagógia alapszak, I. évfolyam. TÁRSADALOMSTATISZTIKA. Előadó: Csákó Mihály egyetemi docens 30 kontaktóra + 60 egyéni munkaóra = 3 kredit (Levelező: 12 kontakt + 78 egyéni munkaóra) A jegyzet-rovatot is érdemes figyelni!!!. Az előadások beosztása:.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' TÁRSADALOMSTATISZTIKA' - halia


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
T rsadalomstatisztika

Wesley János Lelkészképző Főiskola

Pedagógia alapszak, I. évfolyam

TÁRSADALOMSTATISZTIKA

Előadó: Csákó Mihály

egyetemi docens

30 kontaktóra + 60 egyéni munkaóra = 3 kredit

(Levelező: 12 kontakt + 78 egyéni munkaóra)

A jegyzet-rovatot is érdemes figyelni!!!


Az el ad sok beoszt sa
Az előadások beosztása:

1.Mi a statisztika és mire jó? A kurzus célja

2. Adatgyűjtés és ábrázolás: a hisztogram

3. Csoportok jellemzése: középértékek

4. Csoportok szóródása: a szórás

5. A normálgörbe

6. A normális közelítés módszere

7. Két változó kapcsolata: varianciaelemzés

8. Két változó kapcsolata: korreláció

9. Két változó kapcsolata: regresszió

10. Statisztikai következtetés: mintavétel

11. Valószínűségszámítás

12. Megbízhatósági próbák, szignifikancia

Csákó M.: Társadalomstatisztika


Sz mol si gyakorlat
Számolási gyakorlat

  • Ránézésre becsüljék meg a következő számokat %-ban! (Kb. 1%,10%, 50% …?)

  • 99 a 407-ből?

  • 57 a 209-ből?

  • 99 a 197-ből?

  • 39 a 398-ból?

    Ezek kb. a legnehezebb számolási feladatok amelyek előfordulhatnak a félév során.

Csákó M.: Társadalomstatisztika


Az igazs g keres se a keny rfogyaszt s p ld ja
Az igazság keresése:a kenyérfogyasztás példája

1. A büntetés-végrehajtási intézetekben fogva tartott elítéltek több mint 98 %-a  kenyérfogyasztó.

2. A kenyérfogyasztó családokban felnövekedő gyermekek 50 %-a a standardizált teszteket átlag alatti eredménnyel teljesíti.

3. A XVIII. században, amikor gyakorlatilag minden kenyér otthon, a háztartásban készült, az átlag-életkor nem érte el az 50 évet, a csecsemőhalandó-ság elfogadhatatlanul magas volt, sok nő belehalt a szülésbe, és a lakosságot olyan járványok tizedel-ték, mint a tífusz, a sárgaláz és az influenza.

Csákó M.: Társadalomstatisztika


Az igazs g keres se a keny rfogyaszt s p ld ja1
Az igazság keresése:a kenyérfogyasztás példája

4. Az erőszakos bűncselekmények több mint 90 %-át kenyérfogyasztás után 24  órán belül követik el.

 5. A kenyér alapanyaga a tésztának nevezett szub-sztancia. Kísérletek során bebizonyosodott: ebből az anyagból néhány dekagramm elég, hogy egy egér megfulladjon tőle. Az átlag magyar ennek sokszorosát fogyasztja el egy hónap alatt!

 6. A primitív törzsi társadalmakban, ahol a kenyér-fogyasztás ismeretlen, évszázadok óta feltűnően kevés rákos megbetegedést, Alzheimer-és  Par-kinson-kóros, csontritkulásos esetet jegyeztek fel.

Csákó M.: Társadalomstatisztika


Az igazs g keres se a keny rfogyaszt s p ld ja2
Az igazság keresése:a kenyérfogyasztás példája

7. A kenyér bizonyítottan addiktív. Kísérleti alanyok, akiktől egy időre  megvonták, és csak vízzel táplálták őket, alig 2 nap elteltével már  kenyérért könyörögtek. 

8. A kenyérfogyasztás sok esetben csak előkészítője a "keményebb"  élelmiszerek, mint például a vaj, lekvár, méz fogyasztásának.

9. A kenyérről bebizonyosodott, hogy magába szívja a vizet. Mivel az emberi testet több mint 90%-ban víz alkotja, a huzamos kenyérfogyasztás beláthatatlan következményekkel járhat a szervezet molekuláris összetételében.

Csákó M.: Társadalomstatisztika


Az igazs g keres se a keny rfogyaszt s p ld ja3
Az igazság keresése:a kenyérfogyasztás példája

10. Az újszülöttek köhögnek a kenyértől.

11. A kenyeret 200 Celsius-fok körüli hőmérsékleten sütik. Ez a hőmérséklet nem egészen egy perc alatt elpusztít egy felnőtt embert.

12. A legtöbb kenyérfogyasztó képtelen megkülönböztetni a tudományos  tényeket a statisztika álruhájába burkolt, értelmetlen locsogástól.

Csákó M.: Társadalomstatisztika


Tal lkoz saink a statisztik val h tk znapi tapasztalatok
Találkozásaink a statisztikával: hétköznapi tapasztalatok

  • Népszámlálás

  • Az európai népesség öregedése

  • A magyar népesség fogyása

  • A cigány gyerekek iskolázottsága

  • Éves iskolai statisztikai jelentés

  • A levegő hőmérsékletének sokévi átlaga

  • Foglalkozási kategóriák átlagkeresete

  • Munkanélküliség mértéke

  • Stb.

Csákó M.: Társadalomstatisztika


P lda az alkalmaz sra
Példa az alkalmazásra tapasztalatok

  • Freedman: májműtétes példája

    Veszélyes bypass műtét, de életmentőnek tartják.

    Kérdés: „megéri-e”?

    Hogyan lehet megtudni?

    Számoljuk meg az eredményt!

Csákó M.: Társadalomstatisztika


Mit rt nk statisztik n
Mit értünk statisztikán? tapasztalatok

  • Összeszámlálás,

  • Jelzőszámok

  • Kapcsolatkeresés,

  • Feltételezett kapcsolat ellenőrzése,

    • magyarázat-keresés

    • minőség-ellenőrzés

  • Kutatási módszer (- pl. survey)

Csákó M.: Társadalomstatisztika


Sszefoglal s
ÖSSZEFOGLALÁS tapasztalatok

  • Mivel kezdődik a statisztikai tevékenység?

    Nem az adatgyűjtéssel,

    hanem a kategóriák megtervezésével.

  • Mi mindenről kell dönteni az adatgyűjtéssel kapcsolatban?

    Kiktől? – miféle válaszok lehetségesek?

    Mit, milyen adatot gyűjtünk?

    Hogyan gyűjtjük?

Csákó M.: Társadalomstatisztika


Sszefoglal s c lok
ÖSSZEFOGLALÁS: Célok tapasztalatok

  • Milyen célok érdekében gyűjtünk adatot?

    Leggyakrabban egy népesség/csoport leírására.

  • Szélsőséges pl.: a népszámlálás – mi baj?

    Több mint 20 kötet adat – áttekinthetetlen

    A „demográfiai adatok” 1 kötet (vagy 19)…

  • „Magyarországon az átlagéletkor: év”

  • vagy: „Magyarországon az átlagkereset…”

Csákó M.: Társadalomstatisztika


V ltoz k
Változók tapasztalatok

  • Miért vizsgáljuk a dolgokat vagy személyeket?

  • mert nem egyformák, sokfélék,

  • és ráadásul változnak.

  • Dolgoknak vagy személyeknek azt a tulajdonságát, jellemzőjét, amelyet vizsgálunk, változónak nevezzük.

  • Pl.: életkor; fizetés; gyerekszám; munkahelyváltoztatások száma.

  • Nem biztos, hogy megszámlálható (pl. lakóhely).

Csákó M.: Társadalomstatisztika


A tank nyv p ld ja j vedelem az us ban
A tankönyv példája: jövedelem az USÁ-ban tapasztalatok

Csákó M.: Társadalomstatisztika


A tank nyv p ld ja j vedelem az us ban1
A tankönyv példája: jövedelem az USÁ-ban tapasztalatok

A függőleges tengely =

= sűrűségskála (%/egység)

Csákó M.: Társadalomstatisztika


A tank nyv gyakorl feladata 1
A tankönyv gyakorló feladata 1. tapasztalatok

Csákó M.: Társadalomstatisztika


A tank nyv gyakorl feladata 2 3
A tankönyv gyakorló feladata 2-3. tapasztalatok

Csákó M.: Társadalomstatisztika


A tank nyv gyakorl feladata 4
A tankönyv gyakorló feladata 4. tapasztalatok

Csákó M.: Társadalomstatisztika


A 18 vesek apj nak s anyj nak letkora 2010 2011
A 18 évesek apjának és anyjának életkora (2010-2011) tapasztalatok

Csákó M.: Társadalomstatisztika


Az ap k letkora grafikon
Az apák életkora: grafikon tapasztalatok

Csoportosított adatok.

Ez a grafikon csak szemléltető eszköz

- csak egy dolgot mutat.

Csákó M.: Társadalomstatisztika


Az ap k letkor szerint hisztogram
Az apák életkor szerint: hisztogram tapasztalatok

A hisztogram pontosan megfelel az adatoknak, nemcsak szemléltet.

Csákó M.: Társadalomstatisztika


Feladat rajzolj k meg a hisztogramot
Feladat: Rajzolják meg a hisztogramot! tapasztalatok

IDE

Csákó M.: Társadalomstatisztika


K z p rt kek
KÖZÉPÉRTÉKEK tapasztalatok

  • A középértékekkel (átlag) egy csoport gyors áttekintését kívánjuk nyújtani.

  • Alkalmazásuk feltételei:

    1. legyen értelmezhető csoport, amelyet jellemez (pl. 7.osztály; bérből élők…)

    2. a célnak megfelelőt válasszuk a középértékek közül

Csákó M.: Társadalomstatisztika


K z p rt kek1
KÖZÉPÉRTÉKEK tapasztalatok

  • A középértékek fajtái:

    - számtani átlag

    - medián

    - módusz

    - négyzetes átlag

    - harmonikus átlag

    - mértani átlag

Csákó M.: Társadalomstatisztika


K z p rt kek2
KÖZÉPÉRTÉKEK tapasztalatok

  • A számtani átlag a legismertebb.

    Képlete: a1+a2+…+anΣa

    ā = =

    n n

Csákó M.: Társadalomstatisztika


K z p rt kek3
KÖZÉPÉRTÉKEK tapasztalatok

  • Mikor jó és mikor problémás a számtani közép: pl. testvérszám; testmagasság.

  • A módusz a középtendenciát jobban kiemeli (ha van) = leggyakoribb érték

  • A medián jó jelzőszám, de előnytelen matematikailag további számításokhoz

Csákó M.: Társadalomstatisztika


K z p rt kek4
KÖZÉPÉRTÉKEK tapasztalatok

  • A hetedikesek kérésünkre megjelölték egy [0; 100] egyenes szakaszon, hány % esélyük van rá, hogy érdemi választ kapjanak tanáraiktól a kérdéseikre.

  • Az esélyüket átlagosan 58,9%-ra becsülték.

  • A medián érték 59,8%, a módusz pedig 41-60% (mivel csoportosítottuk a válaszokat).

  • Mi a véleményük erről? Mit jelent ez? Milyenek lehetnek a vélemények részletesebben?

Csákó M.: Társadalomstatisztika


K z p rt kek5
KÖZÉPÉRTÉKEK tapasztalatok

N= 2762 81 182  133  169 45 = 699

% 3,98,9  11,626,0  19,024,2 6,4 = 100

Átlag = 

Módusz = 40–60% 

Medián = 350. eset =

=180. a (40-60)-ban =

= 59,78  59,8 

Csákó M.: Társadalomstatisztika


K z p rt kek6
KÖZÉPÉRTÉKEK tapasztalatok

Csákó M.: Társadalomstatisztika


K z p rt kek7
KÖZÉPÉRTÉKEK tapasztalatok

Példa:

  • Márta néni fantasztikus matektanár:

    minden osztályában eléri matekból a 3,2 átlagot,

    még az összevont osztályban is!

    Hogyan?

  • „a” osztály: 2- 6; 3- 1; 4- 2; 5- 3 (12 fő)

  • „b” osztály: 2- 2; 3- 6; 4- 4; 5- 0 (12 fő)

Csákó M.: Társadalomstatisztika


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

31


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

32


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

33


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

34


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

35


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

36


K z p rt kek8
KÖZÉPÉRTÉKEK tapasztalatok

Hogyan lehetne kifejezni a két osztály különbségét?

Miben is áll ez a különbség?

Átlag „a”: 12+3+8+15=38 38/12=3,17 ≈ 3,2

Átlag: „b”: 4+18+16+0=38 38/12=3,17 ≈ 3,2

Az átlaguk azonos – mi eltérő? A szóródás

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

37


A sz r s
A SZÓRÁS tapasztalatok

Eredmény:

A két osztály átlageredménye azonos (3,2)

de az egyikben nagy különbségek vannak a tanulók között (s  1,3), míg a másikban közel állnak egymáshoz (s  0,7).

Vagyis a szórás segítségével tudjuk számszerűsíteni a különbséget.

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

38


A sz r d s m rt ke
A SZÓRÓDÁS MÉRTÉKE tapasztalatok

Mi a tanulság?

A valóság a szóródásban rejlik, a középérték erős absztrakció.

A mozgás mindig különbségből ered, oka tehát a különbségek okában van.

 Valamiképpen fogalmilag ki kell fejezni a változatosságot:

 a szórás mérőszámaival.

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

39


A sz r d s m r se
A SZÓRÓDÁS MÉRÉSE tapasztalatok

Első megközelítés: szélső értékek, vagyis az eloszlás kiterjedése.

Pl. az emberi testmagasság

A legmagasabb ismert férfi:

Robert Pershing Wadlow (1918-1941) 272 cm

A legmagasabb ismert nő:

Zeng Jinlian (1964-1982) 246 cm

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

40


A sz r d s m r se1
A SZÓRÓDÁS MÉRÉSE tapasztalatok

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

41


A sz r d s m r se2
A SZÓRÓDÁS MÉRÉSE tapasztalatok

A valaha ismert legalacsonyabb emberek:

Nő: Pauline Musters (1876-1895) 59 cm.

Férfi: Calvin Philips (1791-1812) 67 cm.

Eleget tudunk-e így az emberi testmagas-ságról?

Nem: az eloszlás még sokféle lehet a két végpont között.

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

42


A sz r d s m r se3
A SZÓRÓDÁS MÉRÉSE tapasztalatok

Második megközelítés

= az esetek zömének kiterjedése

= interkvartilis távolság

Pl. a tanári válasz esélye:

N= 2762 81 182  133  169 45 = 699

% 3,98,9  11,626,0  19,024,2 6,4 = 100

kvartilis = a 175. eset (40-60%)

kvartilis = medián

kvartilis = az 525. eset (80-100%)

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

43


A sz r d s m r se4
A SZÓRÓDÁS MÉRÉSE tapasztalatok

  • Harmadik megközelítés

    = az esetek átlagtól való távolságának átlaga =

    = szórás (s)

  • A kiszámítás módja: négyzetes átlag

    Σ(a – ā)2

    s =  N

    Magyarázat: az összeadás tagjai előjelesek.

    (Lássuk Márta néni osztályainak példáján!)

Csákó M.: Társadalomstatisztika


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

45


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

46


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

47


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

48


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

49


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

50


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

51


WJLF Pedagógia BA tapasztalatok

Csákó M.: Társadalomstatisztika

52


A sz r d s m r se5
A SZÓRÓDÁS MÉRÉSE tapasztalatok

= Az osztályok különbsége abban áll, hogy az „A” osztályban az eredmények szórása csaknem kétszer akkora, mint a „B”-ben:

sa=1,3 osztályzat

sb=0,7 osztályzat


A sz r segys g
A SZÓRÁSEGYSÉG tapasztalatok

  • 103. OLDAL ÁBRA

Csákó M.: Társadalomstatisztika


A norm lg rbe
A NORMÁLGÖRBE tapasztalatok

  • 101. OLDAL ÁBRA

Csákó M.: Társadalomstatisztika


A norm lg rbe haszn lata
A NORMÁLGÖRBE HASZNÁLATA tapasztalatok

Mekkora a 0 és 1 közötti intervallumba eső terület?

Csákó M.: Társadalomstatisztika


G rbe alatti ter letek
GÖRBE ALATTI TERÜLETEK tapasztalatok

Csákó M.: Társadalomstatisztika


Variancia elemz s

VARIANCIA-ELEMZÉS tapasztalatok

FIGYELEM!

Ez a fejezet

NINCS BENNE

a tankönyvben!!!


Mit l vannak a k l nbs gek
Mitől vannak a különbségek? tapasztalatok

Az ember igyekszik egyszerűnek látni a világot (pl. átlag).

Ugyanez a törekvés a szabványosításban, a normában stb.

Kénytelenek vagyunk beengedni valahogy a sokféleséget (pl. szórás).

Ugyanez tör be a „tűrés” műszaki fogalmában, a „kalo”-ban stb.

Csákó M.: Társadalomstatisztika

59


Mi kell a magyar zathoz
Mi kell a magyarázathoz tapasztalatok ?

Mit akarunk megmagyarázni?

A szórást. (= Az esetek különbözőségét.)

Kell legalább még egy változó(= tehát ez is változik, azaz több értéke lehet)

Sőt: nem is lehet más, csak változó.

Ui. ami ugyanolyan, az nem okoz különbséget.

Egy lehetőség: a varianciaelemzés.

Csákó M.: Társadalomstatisztika

60


Mire j a varianciaelemz s
Mire jó a varianciaelemzés? tapasztalatok

Mikor használható? - Ha egy nominális (kategoriális) változóval akarunk magyarázni egy folytonos kvantitatív változót.

Példák: Mennyire befolyásolja a lakóhely a jövedelmet? vagy a dolgozó neme?

Azaz: Ha az elemek csoportokat alkotnak, felmerülhet, hogy a csoportba tartozás okozza a szóródást vagy annak egy részét

Csákó M.: Társadalomstatisztika

61


Variancia elemz s1
VARIANCIA-ELEMZÉS tapasztalatok

Variancia = teljes szórásnégyzetösszeg

vagyis az összes elem átlagtól való távolságának négyzetes összege (amiből a szórást számítjuk)

Ezt probáljuk „feldarabolni”: mekkora része származik a csoportbontásból.

Vegyünk egy példát! (A tkv. adatai, 64. old.)

Csákó M.: Társadalomstatisztika


Gyereksz m s iskol zotts g
Gyerekszám és iskolázottság tapasztalatok

Csákó M.: Társadalomstatisztika


Gyereksz m s iskol zotts g1
Gyerekszám és iskolázottság tapasztalatok

Csákó M.: Társadalomstatisztika


Gyereksz m s iskol zotts g2
Gyerekszám és iskolázottság tapasztalatok

Csákó M.: Társadalomstatisztika


Teljes variancia csoportok s f tlag k z tti csoporton bel li variancia
Teljes variancia = (csoportok és főátlag közötti) + csoporton belüli variancia

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

Csákó M.: Társadalomstatisztika


Variancia elemz s2
VARIANCIA-ELEMZÉS csoporton belüli variancia

Hány változót használtunk?

Kettőt! 1. gyerekszám; 2. iskolázottság

Milyen változók ezek?

a gyerekszám kvantitatív és diszkrét*

az iskolázottság kvalitatív (dichotóm) – itt!

A varianciaelemzés akkor használható, ha egy kvalitatív változónak egy kvantitatív változóra való hatását akarjuk megtudni.

(* Valójában csak folytonos változók varianciáját lehet felbontani. Ezt sokszor nem tartják be. Itt pedig a számítások egyszerűsége és az adatok hozzáférhetősége miatt használtunk diszkrét változót.)

Csákó M.: Társadalomstatisztika


A korrel ci

A KORRELÁCIÓ csoporton belüli variancia

Csákó M.: Társadalomstatisztika


A varianciaelemz st l a korrel ci ig
A varianciaelemzéstől a korrelációig csoporton belüli variancia

  • A varianciaelemzés megmutatta egy nominális (kategoriális) változó hatását egy folytonos kvantitatív változóra.

  • De mit csináljunk, ha a magyarázó változónk is folytonos kvantitatív? (Pl. testmagasság a testsúly magyarázatára, vagy életkor a kereset magyarázatára

    Minden egyes esetet mégsem tekinthetünk külön kategóriának!

Csákó M.: Társadalomstatisztika

69


Hogyan br zolunk k t v ltoz t
Hogyan ábrázolunk két változót? csoporton belüli variancia

a konkrét eset

Csákó M.: Társadalomstatisztika

70


Hogyan br zolunk k t v ltoz t gyakorl s
Hogyan ábrázolunk két változót? (Gyakorlás) csoporton belüli variancia

Ábrázoljunk néhány apa-fiú párt!

Legyen F=A;

F=A+5cm;

F=A-2cm;

F=A+17cm;

minden F = A+15% !

Figyeljük meg az esetek elhelyezkedését a F=A szabályhoz képest!

Csákó M.: Társadalomstatisztika

71


Descartes f le koordin tarendszer
Descartes-féle koordinátarendszer csoporton belüli variancia

Két változó értékei (adatpár) egy pontot határoz meg: P(x,y)

Két pont meghatároz egy egyenest.

Egyenlete: y=mx+b

Mikor egyenes két változó kapcsolatának képe?

(pl. az apák és fiak testmagasságának összefüggése?)

Haszigorú függvénykapcsolat van közöttük: vagyis ha az apa magasságából egyértelműen meg lehet mondani a fia magasságát.

Csákó M.: Társadalomstatisztika

72


Descartes f le koordin tarendszer1
Descartes-féle koordinátarendszer csoporton belüli variancia

Csákó M.: Társadalomstatisztika

73


Descartes f le koordin tarendszer2
Descartes-féle koordinátarendszer csoporton belüli variancia

Csákó M.: Társadalomstatisztika

74


Van e itt szigor f ggv nykapcsolat
Van-e itt szigorú függvénykapcsolat? csoporton belüli variancia

Csákó M.: Társadalomstatisztika

75


K t v ltoz kapcsolata
Két változó kapcsolata csoporton belüli variancia

A társadalomban nincs szigorú függvénykapcsolat.

A kapcsolat képe nem egyenes,

hanem pontfelhő.

Különböző alakú pontfelhők lehetnek.

Hogyan lehetne őket pontosabban leírni?

Csákó M.: Társadalomstatisztika

76


Pr b ljuk k r lrajzolni
Próbáljuk körülrajzolni csoporton belüli variancia

Csákó M.: Társadalomstatisztika

77


K r lrajzol s mit tudunk hozz
Körülrajzolás: mit tudunk hozzá? csoporton belüli variancia

Az apák magasságának

a) átlagát,

b) szórását

A fiak magasságának

c) átlagát,

d) szórását.

Csákó M.: Társadalomstatisztika

78


Hogyan haszn ljuk amit tudunk
Hogyan használjuk, amit tudunk? csoporton belüli variancia

Csákó M.: Társadalomstatisztika

79


Milyen lesz a pontfelh alakja
Milyen lesz a pontfelhő alakja? csoporton belüli variancia

Csákó M.: Társadalomstatisztika

80


Korrel ci s egy tthat sz m t sa
Korrelációs együttható számítása csoporton belüli variancia

r = (standard x * standard y) átlaga

átszámítjuk standard értékbe mind x-et, mind y-t*;

minden pontra összeszorozzuk

a szorzatokat átlagoljuk.

* Vagyis a szórásukkal fejezzük ki őket: hány szórásnyira vannak az átlaguktól.

Csákó M.: Társadalomstatisztika

81


A korrel ci s egy tthat s a pontfelh
A korrelációs együttható és a pontfelhő csoporton belüli variancia

Csákó M.: Társadalomstatisztika

82


A korrel ci s egy tthat s a pontfelh1
A korrelációs együttható és a pontfelhő csoporton belüli variancia

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

83

83




Korrel ci s egy tthat
Korrelációs együttható csoporton belüli variancia

Az előző ábrákban látható, hogy

0 ≤ r ≤ 1

De ezt még tovább finomítjuk gyakorlati példák segítségével.

Csákó M.: Társadalomstatisztika

86


Csákó M.: Társadalomstatisztika csoporton belüli variancia


Kutat si p ld k a korrel ci ra
Kutatási példák a korrelációra csoporton belüli variancia

Csákó M.: Társadalomstatisztika


Negat v korrel ci s egy tthat k
Negatív korrelációs együtthatók csoporton belüli variancia

Csákó M.: Társadalomstatisztika


Negat v korrel ci s egy tthat k1
Negatív korrelációs együtthatók csoporton belüli variancia

Csákó M.: Társadalomstatisztika


Negat v korrel ci s egy tthat k2
Negatív korrelációs együtthatók csoporton belüli variancia

Csákó M.: Társadalomstatisztika


Korrel ci s egy tthat1
Korrelációs együttható csoporton belüli variancia

Az előző ábrákban látható, hogy ki kell terjesztenünk r értékét a negatív számok felé:

-1 ≤ r ≤ 1

.Ha r = -1 : szigorú negatív függvénykapcsolat,

Ha r = 0, akkor nincs kapcsolat,

Ha r = 1 : szigorú pozitív függvénykapcsolat

Csákó M.: Társadalomstatisztika

92


A sz r segyenes
A szórásegyenes csoporton belüli variancia

Csákó M.: Társadalomstatisztika


Kiv telek
Kivételek csoporton belüli variancia

  • Az r csak lineáris kapcsolatok erőssége mérésére alkalmas.

  • A baloldali pontfelhő nem egy egyenes mentén szóródik.

Csákó M.: Társadalomstatisztika


Kiv telek1
Kivételek csoporton belüli variancia

Csákó M.: Társadalomstatisztika


Kiv telek2
Kivételek csoporton belüli variancia

  • Problémákat okozhatnak az un. magányos elemek. (Pl. magas apa törpenövésű fia; vagy: milliárdos villája egy felsőközép-rétegű kertvárosi kerületben – egymaga elhúzza az átlagot)

  • Megoldás lehet: kihagyjuk őket

    • Lásd ezt a megoldást pontozásos sportoknál: síugrás, műkorcsolyázás

  • De csak óvatosan, mert a valósághoz ezek is hozzátartoznak! Kihagyásuk is torzít.

Csákó M.: Társadalomstatisztika


A korrel ci s egy tthat rdekess gei
A korrelációs együttható érdekességei csoporton belüli variancia

  • Az r nem az abszolút számok közötti kapcsolatot méri, hanem a szóráshoz képest vett adatok kapcsolatát

  • Miért?

  • Mert standard egységbe számoltuk át az adatokat – más szóval: a szóráshoz viszonyítottuk őket.

Csákó M.: Társadalomstatisztika


A korrel ci s egy tthat rdekess gei1
A korrelációs együttható érdekességei csoporton belüli variancia

Az r értéke nem változik, ha…

a) … x értékeit ugyanazzal a számmal megszorozzuk.

b) … x értékeihez ugyanazt a számot hozzáadjuk (kivonjuk).

c) … a változókat (x, y) felcseréljük. Oksági összefüggést nem jelent!

Csákó M.: Társadalomstatisztika


A korrel ci s egy tthat rdekess gei2
A korrelációs együttható érdekességei csoporton belüli variancia

Un. ökológiai korrelációk

  • Azokat a korrelációkat hívjuk így, amelyeket csoportosított adatokból számítottak.

  • Pl. Doll: cigarettafogyasztás – tüdőrák országonként (11 ország)

  • Pl. iskolázottság és jövedelem kapcsolata USA teljes (25-54 éves): r = 0,44 államokra átlagolva 51 adatpárból: r = 0,64

Csákó M.: Társadalomstatisztika


A korrel ci s egy tthat rdekess gei3
A korrelációs együttható érdekességei csoporton belüli variancia

Saját „ökológiai korrelációs” példám:

  • Szakmunkástanulók 21 rangsora alapján képzett kategóriák szépen szétváltak. ( társadalmi szakmablokkok)

  • Diszkriminancia-elemzéssel kevéssé rekonstruálható

  • Ok: a csoportokon belüli szórást figyelmen kívül hagytuk.

Csákó M.: Társadalomstatisztika


A regresszi sz m t s tkv 188 252 old

A REGRESSZIÓSZÁMÍTÁS csoporton belüli variancia(Tkv. 188–252. old.)


Mit jelent a regresszi
Mit jelent a regresszió? csoporton belüli variancia

  • Politikai-köznyelvi értelemben: a progresszió = haladás, akkor a regresszió = visszafejlődés

  • A statisztikában más a jelentése: két összefüggő változó egyikénekvisszavezetése a másikra

  • Pl. a testsúly és a testmagasság összefügg  megpróbálhatjuk visszavezetni a testsúlyt a test-magasságra (ld. a tkv. példáját)

Csákó M.: Társadalomstatisztika


A regresszi l p senk nt 1
A regresszió lépésenként – 1. csoporton belüli variancia

Csákó M.: Társadalomstatisztika


A regresszi l p senk nt 2
A regresszió lépésenként – 2. csoporton belüli variancia

Az átlag + 1 szórás

testmagassághoz

tartozó testsúlyátlag

Csákó M.: Társadalomstatisztika


A regresszi l p senk nt 3
A regresszió lépésenként – 3. csoporton belüli variancia

A magasság ± 2 szórásához

tartozó testsúlyátlagok

Csákó M.: Társadalomstatisztika


A regresszi l p senk nt 4
A regresszió lépésenként – 4. csoporton belüli variancia

A testmagasság szórásaihoz

tartozó testsúlyátlagokat

összekötő egyenes: a

regressziós egyenes.

Csákó M.: Társadalomstatisztika


A regresszi l p senk nt 5
A regresszió lépésenként – 5. csoporton belüli variancia

  • Figyeljék meg a szórásegyenes és a regressziós egyenes viszonyát!

  • A regressziós egyenes kevésbé meredek. Miért?

  • Mert az egyes esetek nem ugyanannyira térnek el a magasság átlagától, mint a testsúly átlagától.

  • Milyen kapcsolat lenne, ha ugyanannyira térnének el?

Csákó M.: Társadalomstatisztika


Regresszi y becsl se
Regresszió = y becslése csoporton belüli variancia

  • y x-re vonatkozó (vagy: x szerinti) regressziós egyenese becslést ad az egyes x értékekhez tartozó y értékek átlagára.

  • Az x egy szórásnyi változásához átlagosan az y értékek r szórásnyi változása kapcsolódik.

  • A korrelációs együttható csak a kapcsolat erősségét mutatja meg, az összefüggés módját pedig a regressziós egyenes.

Csákó M.: Társadalomstatisztika


Regresszi y becsl se1
Regresszió = y becslése csoporton belüli variancia

ahol r = a korrelációs együttható !

Csákó M.: Társadalomstatisztika


Regresszi y becsl se2
Regresszió = y becslése csoporton belüli variancia

Csákó M.: Társadalomstatisztika


Egyedi eset becsl se
Egyedi eset becslése csoporton belüli variancia

Becslés egy adott magasságú egyén

súlyára = az átlag!

Csákó M.: Társadalomstatisztika


Egyedi eset becsl se1
Egyedi eset becslése csoporton belüli variancia

Regressziós

egyenes

A hiba természetesen negatív előjelű is lehet.

Csákó M.: Társadalomstatisztika


A regresszi sz m t s felt telei
A regressziószámítás feltételei csoporton belüli variancia

  • Kvantitatív változók

  • Folytonos változók

  • Normáleloszlás (haranggörbe-szerű)

  • „Rögbilabda alakú” pontfelhő

  • Lineáris kapcsolat

Csákó M.: Társadalomstatisztika


Gyakorlatok 1
Gyakorlatok – 1. csoporton belüli variancia

Csákó M.: Társadalomstatisztika


Gyakorlatok 2
Gyakorlatok – 2. csoporton belüli variancia

Egy hallgatót 650 ponttal vettek fel az egyetemre. Tippeljük meg az évvégi tanulmányi átlagát! (Tkv. 196–197.)

Tudjuk hozzá:

  • a felvételi pontátlaga = 550; szórása 80 p.

  • az évvégi átlag = 2,6; szórása = 0,6

  • a felvételi pontok és az évvégi átlag közötti kapcsolat: r = 0,4

Csákó M.: Társadalomstatisztika


Gyakorlatok 21
Gyakorlatok – 2. csoporton belüli variancia

A megoldás menete:

1 – Mennyivel jobban felvételizett az átlagnál?

2 – Regressziós becslés a tanulmányi eredmény átlagtól való eltérésére

3 – Mennyit jelent ez az eltérés osztályzatban?

4 – Mit jelent ez az eredmény?

Csákó M.: Társadalomstatisztika


K vetkeztet s y b l x re
Következtetés csoporton belüli varianciay-ból x-re

  • Ugyanolyan számítással becsülhetjük-e a testmagasságot a testsúlyból, ahogyan a testsúlyt becsültük a testmagasságból?

Csákó M.: Társadalomstatisztika


K t regresszi s egyenes van
Két regressziós egyenes van! csoporton belüli variancia

  • y-nak x szerinti regressziós egyenesének meredeksége: r*(y szórása)

  • x-nek y szerinti regressziós egyenesének meredeksége: r*(x szórása)

súlyátlag=160

magasságátlag=70

Csákó M.: Társadalomstatisztika


Mintav tel hiba val sz n s g

MINTAVÉTEL, HIBA, VALÓSZÍNŰSÉG csoporton belüli variancia


Mintav tel
MINTAVÉTEL csoporton belüli variancia

Mit nevezünk mintának?

  • A kutatók többnyire az emberek egy nagyobb csoportjáról – ez a populáció – szeretnének megállapítani számszerű adatokat – un. paramétereket.

  • Mivel a populáció túl nagy, kiválasztanak belőle egy részt, és csak arról gyűjtenek adatokat. Ez a kiválasztott rész a minta.

  • A paramétereket a minta adataiból becsülik: fel-tételezve, hogy a minta olyan, mint a populáció.

Csákó M.: Társadalomstatisztika


Mintav tel1
MINTAVÉTEL csoporton belüli variancia

DE OLYAN-E A MINTA, MINT A POPULÁCIÓ?

Mikor lesz jó a becslés?

Ha a minta tényleg olyan, mint a populáció.

Hogyan tudhatnánk meg?

Össze kéne hasonlítani! De ezt nem lehet: hiszen épp azért veszünk mintát, mert az egész populációt nem tudjuk megnézni.

Csak azt tudjuk ellenőrizni,

hogyan választották ki a mintát.

Csákó M.: Társadalomstatisztika


Mintav tel2
MINTAVÉTEL csoporton belüli variancia

Példa a mintavételi eljárás fontosságára:

Roosevelt és Landon megválasztási esélye (1936):

  • A Literary Digest előrejelzése: 43%

  • a Gallup előrejelzése: 56%

  • Roosevelt eredménye: 62%

    A különbség oka: a mintavétel módja

Csákó M.: Társadalomstatisztika


Mintav tel3
MINTAVÉTEL csoporton belüli variancia

A Literary Digest eljárása:

  • postai kérdőív 10 millió (!) embernek

    A neveket honnan választják? telefonkönyvekből, klubnévsorokból

    DE: a telefonja a családok ¼ részének volt!

     ez a minta torzít a gazdagok javára!

Csákó M.: Társadalomstatisztika


Mintav tel4
MINTAVÉTEL csoporton belüli variancia

Kétféle torzítás fordul elő:

  • mintavételi torzítás (mint láttuk)

  • a nem válaszolók torzítása

    Akik nem válaszolnak, azok nagyon különbözhetnek a válaszolóktól!

    (Ez az egyik nehézsége ma a választási előrejelzéseknek Magyarországon.)

Csákó M.: Társadalomstatisztika


Mintav tel5
MINTAVÉTEL csoporton belüli variancia

A véletlen mintavétel a legjobb módszer

= a populáció minden tagjának ugyanakkora esélye legyen bekerülni a mintába.

Az egyszerű véletlen mintavétel valójában visszatevés nélküli sorsolás (mint a lottó).

De így változik a későbbi húzások valószínűsége!

Ha nagy a populáció, egy húzás valószínűségét elhanyagolhatóan növeli csak, hogy nem tesszük vissza a kihúzottakat. (Pl. 1/68000; 1/67999…)

Ez is ritkán valósítható meg, ezért többnyire többlépcsős csoportos mintavételt alkalmazunk.

Csákó M.: Társadalomstatisztika


Mintav tel6
Mintavétel csoporton belüli variancia

Az egyszerű véletlen mintavétel ritkán valósítható meg, ezért többnyire többlépcsős csoportos mintavételt alkalmazunk.

Pl. osztályokat választunk, abból diákokat:

Legyen Bp-en 500 hetedik osztály, és válasszunk belőle 50-et.

Hányféleképpen lehet?

első 2. 3. … 49. 50.

500*499*498*…*452*451 = legalább 133 számjegyű !

A megítélése valószínűségszámítási feladat.

WJLF Pedagógia BA

Csákó M.: Társadalomstatisztika

126


2 val sz n s gsz m t s

2. Valószínűségszámítás csoporton belüli variancia

2.1. Alapfogalmak, szabályok

2.2. A binomiális formula

2.3. Várható érték és standard hiba


Es lyek val sz n s g
Esélyek, valószínűség csoporton belüli variancia

  • Valószínűség = az eseteknek várhatóan hány százalékában fog bekövetkezni a dolog, ha sokszor, egymástól függetlenül, azonos körülmények között megismételjük a kísérletet. (rövidítése: p – probability)

  • Egy dolognak és az ellentétének a valószínűsége együtt mindig = 100%. (Vagyis: A + nemA = 1)

Csákó M.: Társadalomstatisztika


Es lyek val sz n s g1
Esélyek, valószínűség csoporton belüli variancia

  • Véletlenszerű húzás esetén egy dobozban lévő minden lap/golyó kihúzásának ugyanakkora az esélye.

  • Ha visszatevéssel húzunk egymás után többször, akkor ez az esély nem változik.

  • Ha nem tesszük vissza a kihúzott lapot, akkor a következő húzásnál eggyel kevesebb lapból húzunk  nő az esély.

Csákó M.: Társadalomstatisztika


Gyakorl s 1

Ugyanolyan valószínű, hogy bekövetkezik. mint hogy nem. csoporton belüli variancia

Ez egészen biztosan bekövetkezik.

Ez nem következhet be.

Bekövetkezhet, de nem valószínű.

Nagyon valószínű, de nem biztos.

Programhiba

Gyakorlás 1.

Melyik számnak melyik állítás felel meg?

- 50%

0%

10%

50%

90%

100%

200%

Csákó M.: Társadalomstatisztika


Gyakorl s 2
Gyakorlás 2. csoporton belüli variancia

  • 1000-szer dobunk egy érmével. Hány fejre számíthatunk?

  • 100 lapot húzhatunk két doboz egyikéből, visszatevéssel. Minden húzásért annyi $-t kapunk, amekkora szám a lapon van. Melyik dobozt választaná? Miért?

1

2

1

3

Csákó M.: Társadalomstatisztika


Es lyek val sz n s g2
Esélyek, valószínűség csoporton belüli variancia

  • Feltétlen valószínűség:

    • pl. annak a valószínűsége, hogy a pikk dáma a második lap a pakliban. (1/52)

  • Feltételes valószínűség:

    • pl. annak a valószínűsége, hogy a pikk dáma a második lap, HA az első a kőr 7. (1/51 – mert az első lapot már kivettük.)

Csákó M.: Társadalomstatisztika


Es lyek val sz n s g3
Esélyek, valószínűség csoporton belüli variancia

Példa: Mi a valószínűsége annak, hogy elsőre a pikk dámát, és azt megtartva, másodikra a kőr királyt húzzuk a pakliból?

Pikk dáma: 1/52

Kőr király: 1/51

Szorzási szabály:

  • Két esemény együttes bekövetkezésének valószínűsége = külön-külön valószínűsé-gük szorzata (pa,b= pa*pb; pl.: 1/52*1/51)

Csákó M.: Társadalomstatisztika


Es lyek val sz n s g4
Esélyek, valószínűség csoporton belüli variancia

Független és nem független események:

  • nem független a második esemény, ha valószínűsége függ az első bekövetkezésétől;

  • Visszatevés nélküli húzások összefüggenek, visszatevésesek függetlenek egymástól.

  • Nem független események együttes bekövetkezésekor a feltételes valószínűségeket szorozzuk össze, független eseményeknél feltétel nélküli valószínűségüket.

Csákó M.: Társadalomstatisztika


Es lyek val sz n s g5
Esélyek, valószínűség csoporton belüli variancia

Függetlenség  kölcsönös kizárás (!!!)

Két esemény kölcsönösen kizárja egymást, ha egyik bekövetkezése esetén a másik nem következhet be.

Összeadási szabály: két egymást kölcsönö-sen kizáró esemény közül legalább az egyik bekövetkezésének valószínűsége = = a kettő valószínűségeinek összege.

Csákó M.: Társadalomstatisztika


Es lyek val sz n s g6
Esélyek, valószínűség csoporton belüli variancia

Szorzáskor

Összeadáskor

Csákó M.: Társadalomstatisztika


Ism tl gyakorlat
Ismétlő gyakorlat csoporton belüli variancia

Egy-egy lapot húzunk az „A” és a „B” dobozból.

Állapítsák meg annak valószínűségét, hogy…

  • a húzott számok egyike 2 és a másika 5.

  • a számok összege 7.

  • a két szám egyenlő.

1

2

3

4

5

1

2

3

4

5

6

„B” doboz

„A” doboz

Csákó M.: Társadalomstatisztika


Ism tl gyakorlat bemutat sa

„A”=1 és „B”=6. csoporton belüli variancia

„A”=2 és „B”=5.

„A”=3 és „B”=4.

„A”=4 és „B”=3.

„A”=5 és „B”=2.

b) Hányféle „kimenet” van összesen?

Akkor p(7) = ?

Ismétlő gyakorlat (bemutatása)

1

2

3

4

5

1

2

3

4

5

6

„B” doboz

„A” doboz

Mi annak valószínűsége, hogy a számok összege 7

a) hányféleképpen fordulhat elő a 7 mint összeg?

Csákó M.: Társadalomstatisztika


Kutat si p lda
Kutatási példa csoporton belüli variancia

A középiskolások jogtudatának fokát azzal mértük, hogy három gyakorlati példából hányban ismerik fel, mihez van joguk. Kérdésenként 3 válaszból kellett a helyeset kiválasztani.

Csákó M.: Társadalomstatisztika


Kutat si p lda1

Melyik eredménynek mekkora a valószínűsége? csoporton belüli variancia

Hányféleképpen lehet 0 találat? Nem 1-féleképpen!!!

Jelöljük az 1. kérdést normál, a 2.-at dőlt, a 3.-at vastag betűkkel, legyen R=rossz, J=jó, és számozzuk a lehetséges válaszokat!

0: (R1 R1R1)

(R1 R1R2) (R1 R2 R1) (R2 R1 R1)

ugyanez a számok felcserélésével

(R2 R2R2)

Vagyis: 8-féleképpen lehet 0 szintű jogtudat!!!

Kutatási példa

Csákó M.: Társadalomstatisztika


Kutat si p lda2
Kutatási példa csoporton belüli variancia

Jelöljük az ábrán az egyes szintek valószínűségét!

Csákó M.: Társadalomstatisztika


Kutat si p lda3
Kutatási példa csoporton belüli variancia

  • Megállapítás: A magyar középiskolások jogismereti válaszainak eloszlása nem tér el attól, mintha csak találgatnának.

  • Következtetés: A magyar középiskolások általában nem ismerik a jogaikat.

  • A valószínűségi eloszlás figyelembe vétele ahhoz segített, hogy ne csak a normához (3), hanem a „0-ponthoz” is mérhessünk.

  • Mire gondolhatnánk, ha 0 találatból több, 2 és 3 találatból sokkal kevesebb lenne, mint valószínű?

Csákó M.: Társadalomstatisztika


Es lyek val sz n s g7
Esélyek, valószínűség csoporton belüli variancia

Példa: Mekkora a valószínűsége annak, hogy a lottón a 8-jegyű joker-számban két 0 lesz?

  • Tíz szám közül húznak, visszatevéssel. Mennyi a kedvező eset, és mennyi az összes?

    Egyszerűbb példa: 5-ször húzunk visszatevéssel 9 zöld és 1 piros golyó közül – mekkora a való-színűsége annak, hogy kétszer húzunk pirosat?

  • Itt könnyű listát csinálni a kedvező esetekről: PPZZZ PZPZZ PZZPZ PZZZP ZPPZZ ZPZPZ ZPZZP ZZPPZ ZZPZP ZZZPP (10 kedvező)

Csákó M.: Társadalomstatisztika


Binomi lis egy tthat
Binomiális együttható csoporton belüli variancia

A binomiális együttható azt mondja meg, hányféleképpen lehet sorba rendezni n elemet, ha közülük k egyfajtájú és n-k egy másik fajtájú:

n!

k! * (n-k)!

Az előbbi példa lehetséges sorrendjei: 5! 5*4*3*2*1

2!*(5-2)! (2*1)*(3*2*1)

(Ha bonyolultnak látszik a mondat, helyettesítse be így:

k = „néhány”

n-k = „a többi”.)

=

=

5*2 = 10

Csákó M.: Társadalomstatisztika


Binomi lis formula
Binomiális formula csoporton belüli variancia

A formula nem más, mint a binomiális együttható alkalmazása a keresett valószínűség kiszámítá-sára (k és n-k valószínűségével kell szorozni).

Pl. a piros és zöld golyók esetében:

p(piros) = 1/10; p(zöld) = 9/10

Két piros golyóra p=(1/10)2 …. (a kitevő=k),

Három zöld golyóra p=(9/10)3 …. (a kitevő=n-k).

Csákó M.: Társadalomstatisztika


A nagy sz mok t rv nye
A nagy számok törvénye csoporton belüli variancia

Ha több „fej” jött egymás után, megnő-e az „írások” valószínűsége?

NEM!

=> Mindig 50% marad.

  • Minél hosszabb a feldobás-sorozat, annál nagyobb az abszolút eltérés a várható értéktől, de annál kisebb az eltérés százalékban.

  • De mindig van „véletlen hiba”.

Csákó M.: Társadalomstatisztika


A nagy sz mok t rv nye1
A nagy számok törvénye csoporton belüli variancia

A dobások számá-val a hiba abszolút nagysága nő.

A dobások számá-nak növekedésével a „fejek” aránya egyre kevésbé tér el az 50%-tól.

Csákó M.: Társadalomstatisztika


A nagy sz mok t rv nye2
A nagy számok törvénye csoporton belüli variancia

„Fejek” száma = várható érték + véletlen hiba

  • A véletlen hiba a dobások számával nő,

  • de egyre kevésbé tér el az 50%-tól.

  • A véletlen hiba nagyjából a dobások száma sokszorozódásának négyzetgyöke arányában nő.

  • = 100-szor annyi dobás hibája kb. 10-szeresre nő

Csákó M.: Társadalomstatisztika


V letlen folyamatok
Véletlen folyamatok csoporton belüli variancia

  • Az érme feldobálása, a rulettezés, egy választási előrejelzés mintavétele – mind véletlen folyamat, vagyis:

  • a következő dobásoknál, pörgetésnél, mintavételnél más lesz a fejek, a nyertesek, a szocialisták és jobbikosok aránya.

  • A statisztika megpróbálja kiszámítani közelítőleg, h. mennyire függenek a számok a véletlentől.

Csákó M.: Társadalomstatisztika


V letlen folyamatok1
Véletlen folyamatok csoporton belüli variancia

Két fő gondolat:

1. hasonlóságot keresünk a minket érdeklő véletlen folyamat (mintavétel) és egy dobozból való véletlen húzások között;

2. a bennünket érdeklő ingadozást (pl. Fidesz szavazók becsült aránya) párhuzamba állítjuk a dobozból húzott számok összegének véletlen ingadozásával.

Csákó M.: Társadalomstatisztika


Dobozmodell bevezet se
Dobozmodell bevezetése csoporton belüli variancia

  • Ebből a dobozból húztunk 25-ször, vissza-tevéssel, feljegyeztük a lapokra írt számokat, és összeadtuk őket.

  • Tízszer megismételtük a sorozatot és a következő eredményeket kaptuk:

    88 84 80 90 83 78 95 94 80 89

1

2

3

4

5

6

Csákó M.: Társadalomstatisztika


Dobozmodell bevezet se1
Dobozmodell bevezetése csoporton belüli variancia

Csákó M.: Társadalomstatisztika


Dobozmodell bevezet se2
Dobozmodell bevezetése csoporton belüli variancia

Jó, hogy ezt tudjuk a húzás-sorozatokról, de

hogyan csináljunk modellt?

Az alapvető eldöntendő kérdések:

  • Milyen számok kerüljenek a dobozba?

  • Melyikből mennyi?

  • Hányat húzzunk?

    Egyelőre csak szerencsejátékokra nézzük. (Rulett)

Csákó M.: Társadalomstatisztika


Dobozmodell bevezet se3
Dobozmodell bevezetése csoporton belüli variancia

Szerkesszünk dobozmodellt nevadai ruletthez!

A fő: a dobozból minden számot ugyanolyan valószínűséggel húzhassunk, mint amekkora a annak a valószínűsége, hogy annyit nyerjünk a valóságban.

Tegyünk fel 1$-t a

a) párosra

b) harmadik tucatra

c) sarokra (négy számra)

Csákó M.: Társadalomstatisztika


3 hib k val sz n s ge

3. Hibák valószínűsége csoporton belüli variancia


Dobozmodell s mintav tel
Dobozmodell és mintavétel csoporton belüli variancia

  • Dobozmodellel tudjuk ellenőrizni (vala-mennyire) a mintavételünket:

  • Ha ismerjük a populáció egy változójának eloszlását (pl. férfi/nő), akkor kiszámíthat-juk, mekkora lehet a standard hiba a mintában.

Csákó M.: Társadalomstatisztika


Dobozmodell bevezet se4
Dobozmodell bevezetése csoporton belüli variancia

Fontos fogalmak:

várható érték = a modell alapján várt összeg

véletlen hiba = a várható érték eltérése a ténytől

standard hiba = a modell alapján várt eltérés

összeg = várható érték + véletlen hiba

várható érték = (doboz átlaga)* húzások

standard hiba = a doboz szórása* húzások

Csákó M.: Társadalomstatisztika


Dobozmodell s mintav tel1
Dobozmodell és mintavétel csoporton belüli variancia

Pl. (a tkv-ből):

Egy populációban 46% férfi és 54% nő van.

Az első 100 fős mintában 51% ffi és 49% nő.

mintabeli % = alapsokaságbeli % + véletlen hiba

  • Egyszerű véletlen mintában a %-arány várható értéke = alapsokaságbeli %-arány.

  • A %-arány standard hibájához szükségünk van a darabszám standard hibájára:

a darabszám standard hibája

a %-arány standard hibája

= * 100%

a minta nagysága

Csákó M.: Társadalomstatisztika


Mintav tel s standard hiba
Mintavétel és standard hiba csoporton belüli variancia

  • A mintabeli darabszám standard hibája a mintanagyság négyzetgyökével arányosan nő.

  • A mintabeli %-arány standard hibája a mintanagyság négyzetgyökével arányosan csökken.

Csákó M.: Társadalomstatisztika


A statisztikai becsl s

Mit tehetünk akkor, ha nem ismerjük az alapsokaság eloszlását? (épp azt keressük)

Pl. hányan regisztráltatnák magukat?

A mintabeli arányt fogadjuk el a doboz szórásának megállapításához (100 fős minta 10000 választóból)

(pl. 64 igen 36 nem  s=0,64*0,36 = 0,2304 = 0,48)

A standard hiba akkor 100 * 0,48 = 4,8

vagyis a regisztrálók aránya 64% ± 4,8%

Ez az un. bootstrap módszer.

A statisztikai becslés

1

0

?? db

?? db

Csákó M.: Társadalomstatisztika


A statisztikai becsl s1
A statisztikai becslés eloszlását? (épp azt keressük)

Konfidencia-intervallum =

Milyen határok között megbízható a becslés?

  • A normálgörbét vesszük segítségül:

    ± 2SH-n belül 95% biztonságú!

Csákó M.: Társadalomstatisztika


4 szignifikanciasz m t sok

4. Szignifikanciaszámítások eloszlását? (épp azt keressük)


Mire j a szignifikancia pr ba
Mire jó a szignifikancia-próba? eloszlását? (épp azt keressük)

  • Válaszol arra a kérdésre, hogy egy eredmény a véletlen műve-e, vagy valami más oka kell legyen.

  • Más megfogalmazásban: származhat-e az eredmény a mintavétel véletlen ingadozásából?

Csákó M.: Társadalomstatisztika


Mire j a szignifikancia pr ba1
Mire jó a szignifikancia-próba? eloszlását? (épp azt keressük)

Pl. adótörvényt egyszerűsítő törvényjavaslat

  • A javaslat szerint a beszedett adó mennyisége nem fog változni.

  • Mit is jelent ez?

    ∑ változás = új adózás – régi adózás = 0.

    Ha v > 0, akkor többet szednek be;

    ha v < 0, akkor kevesebbet szednek be.

Csákó M.: Társadalomstatisztika


Mire j a szignifikancia pr ba2
Mire jó a szignifikancia-próba? eloszlását? (épp azt keressük)

Ellenőrzés: mekkora lehet a standard hiba?

Lépések:

  • 100 lapos mintát vettek 100 000 adólapból.

  • Mintaátlag = - 219 $; szórás 725 $

  • Eredhet-e a várt 0 $ és a „tényleges” -219 $ különbsége a mintavétel véletlen ingadozásából?

  • Dobozmodellt készítenek: 100000 lappal és 100-at húznak közülük.

  • A doboz szórását az adatok szórásával becsülik!

  • Akkor SH = 100 * 725 $ / 100 = 72,5 $

    Az átlag (-219$) a feltevéstől (0$) 3 SH-nyira van!

Csákó M.: Társadalomstatisztika


Mire j a szignifikancia pr ba3
Mire jó a szignifikancia-próba? eloszlását? (épp azt keressük)

Mit is jelent ez?

  • Használjunk normális közelítést! (Az adóváltozások eloszlása nem normális, de az átlag körüli ingadozás normális!)

  • Az átlag ekkora eltérésének valószínűsége mindössze p = 1‰ – tehát nem véletlen.

     tehát a kincstár valószínűleg átlagosan >200 $-t fog veszteni adófizetőnként, azaz összesen kb. 20 md-ot (100 000 adózóval)

Csákó M.: Társadalomstatisztika


Mit haszn ltunk a p ld ban
Mit használtunk a példában? eloszlását? (épp azt keressük)

  • A (null)hipotézist (változás = 0)

  • Mintavételt (átlag, szórás)

  • Az ellenhipotézist (változás = -219$)

  • Dobozmodellt

  • Az átlag körüli véletlen ingadozásról szerzett ismereteket (SH számítása)

  • A normális közelítést

Csákó M.: Társadalomstatisztika


Szignifikancia pr ba
Szignifikancia-próba eloszlását? (épp azt keressük)

Nullhipotézis = Az eltérést a véletlen okozza.

Ellenhipotézis = Az eltérésnek más oka van.

  • Dobozmodell nélkül nincs korrekt szignfikancia-próba!

    Próbastatisztika – azt méri, mennyire térnek el az adatok a nullhipotézis szerint várható értéktől.

    Ezekkel kiszámítjuk a szignifikanciaszintet.

Csákó M.: Társadalomstatisztika


Szignifikancia pr ba1
Szignifikancia-próba eloszlását? (épp azt keressük)

z-próba: z =

A z-próba azt mondja meg, hogy a megfigyelt érték hány standard hibányira van a nullhipotézis alapján kiszámolt várható értéktől.

A z-próbát két független minta össze-hasonlítására is használhatjuk.

megfigyelt érték – várható érték

standard hiba

Csákó M.: Társadalomstatisztika


Szignifikanciaszint
Szignifikanciaszint eloszlását? (épp azt keressük)

  • Megfigyelt szignifikanciaszint = annak valószínűsége, hogy olyan szélsőséges próbastatisztikát kapunk, mint amit meg-figyeltünk – ehhez feltesszük, hogy a nullhipotézis igaz.

  • NEM AZT jelenti, hogy mennyire valószínű a nullhipotézis,

  • hanem azt, hogy mennyire valószínű a próbastatisztika, HA igaz a nullhipotézis.

Csákó M.: Társadalomstatisztika


Szignifikancia pr b k
Szignifikancia-próbák eloszlását? (épp azt keressük)

z-próba (az előbb láttuk) – nagy mintára

t-próba – olyan, mint a z-próba, de kis mintán alkalmazható torzítás nélkül

χ2-próba (khí-négyzet próba) – több kategória összehasonlítására alkalmas: összeadja a (megfigyelt érték – várható érték)

SH törteket.

Az összeg már nem normáleloszlású, ezért külön táblázat tartalmazza a χ2-görbék alatti területekhez tartozó valószínűségeket.

Csákó M.: Társadalomstatisztika


2 pr ba sz m t sa
χ eloszlását? (épp azt keressük)2-próba számítása

Csákó M.: Társadalomstatisztika


2 pr ba sz m t sa1
χ eloszlását? (épp azt keressük)2-próba számítása

Csákó M.: Társadalomstatisztika


Szignifikancia

χ eloszlását? (épp azt keressük)2-próba számítása

SZIGNIFIKANCIA

Csákó M.: Társadalomstatisztika


Szignifikancia1

χ eloszlását? (épp azt keressük)2-próba számítása

SZIGNIFIKANCIA

Csákó M.: Társadalomstatisztika


Szignifikancia2

χ eloszlását? (épp azt keressük)2-próba számítása

SZIGNIFIKANCIA

Csákó M.: Társadalomstatisztika


2 pr ba sz m t sa2
χ eloszlását? (épp azt keressük)2-próba számítása

A fiúk és lányok tanulmányi eredményének összehasonlításában a χ2-összeg = 10,16

A táblázat szabadságfoka (df) = ahány cella „szabadon” kitölthető, ha ismerjük a „peremeloszlást” (=az „összesen”-eket) – ez most itt df = 2.

Nézzük meg a táblázatot (585. oldal) !

A szabadságfok = 2 sorban

a legnagyobb szám 9,21 – és ott p = 1% !

Csákó M.: Társadalomstatisztika


2 pr ba sz m t sa3
χ eloszlását? (épp azt keressük)2-próba számítása

Mit jelent ez?

  • Értelmezés: Azt, hogy ilyen nagy próbastatisztikát (χ2 =10,16) csak 1%-nál is kisebb valószínűséggel kaphatnánk véletlenül. Vagyis:

  • Következtetés: Nyugodtan elvethetjük azt a null-hipotézist, hogy a fiúk és a lányok tanulmányi eredménye közötti eltérés oka pusztán a véletlen mintavétel. A fiúk és a lányok eredménye tényleg különbözik egymástól.

Csákó M.: Társadalomstatisztika


Sszefoglal s1
ÖSSZEFOGLALÁS eloszlását? (épp azt keressük)

Csákó M.: Társadalomstatisztika


Mir l sz lt ez a kurzus
Miről szólt ez a kurzus? eloszlását? (épp azt keressük)

Megszámlálható és megmérhető dolgok adatainak kezeléséről :

- hogyan tudjuk leírni őket;

- hogyan tudunk jellemzőik alapján következtetéseket levonni;

- hogyan tudunk közöttük kapcsolatokat megállapítani;

- hogyan tudunk olyanokat megismerni, amelyekhez nem férünk hozzá;

- hogyan tudunk megbizonyosodni arról, hogy következtetéseink nem a véletlen művei.

Csákó M.: Társadalomstatisztika


Mir l sz lt ez a kurzus1
Miről szólt ez a kurzus? eloszlását? (épp azt keressük)

  • Leírás: hisztogram, átlag, szórás

  • Következtetések normálgörbével

  • Kapcsolatok megállapítása: varianciaelemzéssel, korreláció- és regressziószámítással

  • Az alapsokaság paramétereinek becslése mintavétellel

  • A valószínűségszámítás alkalmazása a standard hiba kiszámítására és a minta véletlen ingadozásának ellenőrzésére (dobozmodellel)

Csákó M.: Társadalomstatisztika


ad