250 likes | 343 Views
Gazdaságstatisztika. Hipotézisvizsgálatok Alapfogalamak Nemparaméteres próbák I. 16 . előadás. Hol járunk?. Nyitó gondolatok a témakörhöz. Adottak feltevések, melyek igazak (elfogadhatók), vagy nem igazak (nem elfogadhatók) Ezeket a feltevéseket hipotéziseknek nevezzük
E N D
Gazdaságstatisztika Hipotézisvizsgálatok Alapfogalamak Nemparaméteres próbák I. 16. előadás
Nyitó gondolatok a témakörhöz • Adottak feltevések, melyek igazak (elfogadhatók), vagy nem igazak (nem elfogadhatók) • Ezeket a feltevéseket hipotéziseknek nevezzük • Azokat a statisztikai eljárásokat, amelyek segítségével hipotézisek elfogadásáról döntünk hipotézisvizsgálatoknak nevezzük • Ezeket másként statisztikai próbáknak nevezzük • Terminológia • “Szakácskönyv” • Mikor, melyik próbát alkalmazzuk • Olyan műveleteket végezzünk és olyan módszereket alkalmazzunk, amelyeket értünk • A képletek… a képletgyűjtemény… és a táblázatok
A “szakácskönyv” (elöljáróban) Hipotézisvizsgálatok Nemparaméteres próbák Paraméteres próbák Többmintás próbák Illeszkedésvizsgálatχ2-próbával H0: F=F0 Többnormáliseloszlásúvalószínűségiváltozóvárhatóértékeire Többnormáliseloszlásúvalószínűségiváltozószórásnégyzeteire Homogenitásvizsgálatχ2-próbával H0: F(ξ)=G(η) Variancia analízis H0: μ1=μ2=…=μn Cochran-féle C próba H0: σ1=σ2=…=σn Függetlenségvizsgálatχ2-próbával H0: ξésηfüggetlen Egymintás próbák Kétmintás próbák Normáliseloszlásúvalószínűségiváltozóvárhatóértékére Normáliseloszlásúvalószínűségiváltozószórásnégyzetére Kétnormáliseloszlásúvalószínűségiváltozóvárhatóértékeire Kétnormáliseloszlásúvalószínűségiváltozószórásnégyzeteire χ2-próba a szórásnégyzetre H0: σ2=σ20 Egymintás z-próba H0: μ=μ0 σ ismert,vagy n>30 F-próba H0: σ21 =σ22 Független minták esetén Páros minták esetén Egymintás t-próba H0: μ=μ0 σ ismeretlen Kétmintás z-próba H0: μ1=μ2 σ1, σ2 ismert, vagy n1,n2>30 Páros t-próba H0: μ1-μ2=d0 Kétmintás t-próba H0: μ1=μ2 σ1 = σ2
Hipotézis Statisztikai hipotézisen a vizsgált sokaság(ok)ra (valószínűség-eloszlásra) vagy ennek paramétere(i)re vonatkozó valamilyen feltevést értünk.
A nullhipotézis a sokaság alapján „igaz” „hamis” „elfogadás” Döntés a minta alapján „elutasítás” Bevezetés Minta-1 Mintából következtetünk !!! Minta-2 Másodfajú hiba Nincs hiba Hibát követhetünk el !!! Minta-3 Másodfajú hiba () Elsőfajú hiba () Elsőfajú hiba Nincs hiba e
Hipotézisvizsgálatok fajtái • Paraméteres próbák • A vizsgált valószínűségi változó (vagy változók) eloszlása ismert, de ismeretlen paramétert vagy paramétereket tartalmaz, és a hipotézisvizsgálat ezekre a paraméterekre irányul. • Ilyenek például a • középérték(ek)re vonatkozó • szórás(ok)ra vonatkozó • egyéb paraméterekre vonatkozó próbák • Nemparaméteres próbák • A vizsgált valószínűségi változó (vagy változók) eloszlása ismeretlen, a hipotézis magára az eloszlásra vonatkozik. • Ilyenek például az • illeszkedésvizsgálat • homogenitásvizsgálat • függetlenségvizsgálat.
Statisztikai próbák általános menete (1) • egy valószínűségi változó • eloszlására, vagy az eloszlás paramétereire vonatkozó hipotézisek (H0, H1) felállítása • H0 : nullhipotézis • H1 : alternatív hipotézis (ellenhipotézis) • Próba kiválasztása • szignifikancia szint kiválasztása • , jellemzően 0,1; 0,05; 0,01 értékű • Mintavétel • A valószínűségi változóra vonatkozó statisztikai minta felvétele. • Próbastatisztika kiszámítása • próbastatisztika kiszámítása, , ahol az összes n elemű statisztikai minta halmaza
Statisztikai próbák általános menete (2) • kritikus tartomány (elutasítási tartomány) meghatározása úgy, hogy • Azt jelenti, hogy ha H0 igaz, akkor a próbastatisztika legfeljebb valószínűséggel esik a kritikus tartományba • A kritikus tartomány lehet egy- vagy kétoldali • Kétoldali: a nullhipotézisben feltételezett helyzettől való eltérés ténye a fontos. • Egyoldali: a nullhipotézisben feltételezett helyzettől való meghatározott irányú eltérés a fontos. • az elfogadási tartomány • Azt jelenti, hogy ha H0 igaz, akkor a próbastatisztika -nál nagyobb valószínűséggel esik az elfogadási tartományba
Statisztikai próbák általános menete (3) Egy- és kétoldali kritikus (elutasítási) tartományok
Statisztikai próbák általános menete (4) • Döntés a nullhipotézisről • A próbastatisztika kritikus tartományba történő esése alapján. (A jegyzet ezt a megközelítést követi.) • H0–át elfogadjuk, ha • H0–át elutasítjuk, ha • Az úgynevezett pérték és a szignifikancia szint összehasonlítása alapján. (Statisztikai programcsomagok.) • A p érték az a legnagyobb szignifikancia szint, amely mellet a nullhipotézist még elfogadjuk.
χ2 -próbák alkalmazásai Mi ezekkelfoglalkozunk. • Teljes eseményrendszer valószínűségeinek tesztelése • Illeszkedésvizsgálatok • Tiszta • Becsléses • Homogenitásvizsgálat • Függetlenségvizsgálat
Döntési elv χ2 -próbák esetén f(2) P(2szám< 2krit()|H0 igaz) = 1- = DF =1- 2 szám 2 szám 2 2 krit
Illeszkedésvizsgálat χ2 -próbával • Az illeszkedésvizsgálat olyan statisztikai próba, amelynek során arról döntünk, hogy egy valószínűségi változó F eloszlásfüggvénye adott F0 eloszlásfüggvénnyel egyezik meg. • H0: F=F0 • Fajtái • Tiszta illeszkedésvizsgálat • A nullhipotézis az eloszlás paramétereinek ismeretét is feltételezi. • Például: egy gyártósoron elkészített tengelyek hossza 200mm várható értékű, 13mm szórású normális eloszlású valószínűségi változónak tekinthető. • Becsléses illeszkedésvizsgálat • A nullhipotézis csak az eloszlás jellegét tételezi fel. • Például: egy gyártósoron elkészített tengelyek hossza normális eloszlású valószínűségi változónak tekinthető. • Ilyenkor az eloszlás paramétereit a mintából becsüljük.
Példa (*) • Egy dobókockáról szeretnénk megtudni, hogy szabályos-e, azaz minden szám előfordulásának valószínűsége azonos-e. • Ennek eldöntése céljából 600 dobást hajtottunk végre a kockával. A dobások eredményeit az alábbi táblázat összegzi.
Példa (*) - megoldás • Jelölje a valószínűségi változó a kockával dobott számértéket. • Ha a kocka szabályos, akkor minden dobható érték bekövetkezési valószínűsége azonos, 1/6-od értékű. Ekkor diszkért egyenletes eloszlású valószínűségi változó. • A feladatot tehát formalizálhatjuk a következő null- és alternatív hipotézis felállításával: • H0: diszkrét egyenletes eloszlású • H1: nem diszkrét egyenletes eloszlású • Ebben a felírásban a feladat egy illeszkedésvizsgálat végrehajtása • A diszkrét egyenletes eloszlásnak nincs paramétere, ezért tiszta illeszkedésvizsgálatot hajtunk végre
Példa (*) - megoldás DF = r-l-l fi = tapasztalati gyakoriság Fi = elméleti gyakoriság (most minden kategóriában 100) Szabadsági fok r = kategóriák, osztályok száma (most 6) l = becsült paraméterek száma (most 0)
Példa (*) - megoldás összesen 600 dobás
Példa (*) - megoldás 2 szám= 2,02 DF = 6 - 1 = 5 2 krit= 11,1 = 0,05 2 szám << 2 krit H0-t elfogadjuk, azaz a kocka szabályos.
Példa (*) A Tiszán adott időszakban levonuló árhullámok számát vizsgálva az elmúlt 68 év során, az alábbi eredményeket kapták: 30 év volt, amikor nem volt árhullám, 25 olyan év volt , amikor 1 árhullám vonult le az adott időszakban, 9 év volt amikor 2 és 4 olyan év volt, amikor 3, vagy annál több árhullám következett be.Feltehető-e, hogy adott időszakban a folyón levonuló árhullámok száma Poisson-eloszlással modellezhető?
Hipotézisvizsgálatok Nemparaméteres próbák Paraméteres próbák Többmintás próbák Illeszkedésvizsgálat χ2-próbával H0: F=F0 Többnormáliseloszlásúvalószínűségiváltozóvárhatóértékeire Többnormáliseloszlásúvalószínűségiváltozószórásnégyzeteire Homogenitásvizsgálatχ2-próbával H0: F(ξ)=G(η) Variancia analízis H0: μ1=μ2=…=μn Cochran-féle C próba H0: σ1=σ2=…=σn Függetlenségvizsgálatχ2-próbával H0: ξésηfüggetlen Egymintás próbák Kétmintás próbák Normáliseloszlásúvalószínűségiváltozóvárhatóértékére Normáliseloszlásúvalószínűségiváltozószórásnégyzetére Kétnormáliseloszlásúvalószínűségiváltozóvárhatóértékeire Kétnormáliseloszlásúvalószínűségiváltozószórásnégyzeteire χ2-próba a szórásnégyzetre H0: σ2=σ20 Egymintás z-próba H0: μ=μ0 σ ismert,vagy n>30 F-próba H0: σ21 =σ22 Független minták esetén Páros minták esetén Egymintás t-próba H0: μ=μ0 σ ismeretlen Kétmintás z-próba H0: μ1=μ2 σ1, σ2 ismert, vagy n1,n2>30 Páros t-próba H0: μ1-μ2=d0 Kétmintás t-próba H0: μ1=μ2 σ1 = σ2
Példa (*) - megoldás • Jelölje a valószínűségi változó a Tiszán adott időszakban levonuló árhullámok számát. • A feladatot formalizálhatjuk a következő null- és alternatív hipotézis felállításával: • H0: Poisson-eloszlású • H1: nem Poisson-eloszlású • Mivel a feladat nem azt kérdezi, hogy egy konkért Poiosson-eloszlást követ-e, hanem csak annyit, hogy Poisson-eloszlást követ-e, ezért becsléses illeszkedésvizsgálatot hajtunk végre
Példa (*) - megoldás H0: Poisson-eloszlás = ? 0,8 = 0.05 2 krit= 5,99 DF = r-l-l = 4-1-1 = 2
0 30 1 25 2 9 3- 4 Példa (*) - megoldás pk k fi Fi 0,4493 30,55 0,3595 0,1438 0,0474 24,45 9,78 3,22 0,8 0,273 2 krit= 5,99 2sz = 0,273 H0-t elfogadjuk, az árhullámok száma 0,8 paraméterű Poisson-eloszlással modellezhető.
Illeszkedésvizsgálat χ2 -próbávalKapcsolódó feladatok • A Gazdaságstatisztika példatárban • VII. Hipotézisvizsgálatok • Nemparaméteres próbák • 1., 2., 5., feladatok • Paraméteres és nemparaméteres feladatok • 1.a), 2.a) feladatok