Matematikai alapok é s val ószínűségszámítás

Matematikai alapok és valószínűségszámítás Statisztikai becslés Statisztikák eloszlása

Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyátképezõ populáció bizonyos paramétereit a populációból vett mintasegítségével becsüljük. A minta akkor jó, ha reprezentatív apopulációra nézve, amit a legjobban akkor biztosíthatunk, havéletlen, vagy más szóval random mintát veszünk, ami azt jelenti,hogy a populáció minden egyes tagjának azonos esélye van a mintábakerülésre.

Bevezetés Példa: Tegyük fel, hogy egy adott populációt az első éves pszichológiaszakos hallgatók képezik. Egy 10 elemű mintát veszünk ebből apopulációból a következõképpen: a neveket felírjuk egy-egy papírra,egy dobozból húzunk 10 nevet. Ebben az esetben a mintavételvéletlen lesz: minden egyes nevet azonos valószínûséggel húzunkki. Az egyes események (húzások), egymástól függetlenek.

Mintavétel Példa: Tegyük fel, hogy egy adott populációt a telefonkönyvben szereplõszemélyek alkotnak. Ebbõl a populációból szeretnénk egy mintátvenni oly módon, hogy véletlenszerûen kiválasztunk egy személyt,majd aztán szisztematikusan haladva minden 100. személy választjukki a mintába kerülésre. Véletlenszerû-e a mintavétel ebben azesetben?

Mintavétel A véletlen mintavétel nagyon fontos lépés a mintareprezentativitásának biztosítására, DE: A véletlen mintavétel nem mindíg garantálja, hogy a minta valóbanreprezentatív lesz a populációra nézve. Pl.: nõk:férfiak arányaegy populációban 43:57, de ha 100 fõs mintát veszünk, lehet, hogya mintabeli arány 38:62 lesz, akkor is, ha a mintavételvéletlenszerû volt. Ilyenkor alkalmazzák a rétegzettmintavételt, azaz, egy változó mentén felosztják a mintát, jelenesetben pl. véletlenszerûen választanak 43 nőt és véletlenszerűenválasztanak 57 férfit, akik a 100 fős mintát alkotják.

Statisztikai becslés A véletlen mintavétel segítségével tehát elérhetõ,hogy a minta a lehetõ legreprezentatívabb legyen a populációranézve. A mintavétel azonban nem cél, csak eszköz, ahhoz, hogy a mintaalapján becsülni tudjuk a populáció különbözõ paramétereit, amikreaz érdeklõdésünk irányul.

Statisztikai becslés A megfelelő módon kiválasztott mintában kiszámolhatjukaz érdeklõdésünk tárgyát képezõ paraméter értéket, amit amintabeli, vagy tapasztalati értéknek nevezünk, és ez atapasztalati érték lesz a populációbeli, vagy elméleti értékbecslése. Ezeket a minta adataiból számolt értékeket statisztikának nevezzük. A becsült érték a gyakorlatban szinte sohasem fog pontosanmegegyezni az általa becsült populációbeli értékkel, hanemvalamennyire szinte mindíg eltér attól. Egy adott populációbeliparaméter és a mintabeli paraméter különbsége a becslés hibája. Abecslés akkor jó, ha torzítatlan, azaz egyik irányba sem elfogult,azaz a becslés uo. valószínûséggel lesz kisebb, mint nagyobb, minta becsülendő paraméter. Azt mondhatjuk tehát, hogy a becslésekvárható értéke (ha valós populációról van szó a becslések átlaga)megegyezik a paraméter elméleti értékével.

Statisztikák elméleti eloszlása Láttuk tehát, hogy a populáció paramétereit a mintábólszámított statisztikával becsülhetjük, például a populáció átlagáta mintaból számolt átlaggal. Azt is láttuk, hogy ez a becslés nagyvalószínûséggel nem fog megegyezni a populációbeli értékkel, hanemhibával terhelt lesz. Ha a populációból egy másik mintát veszünk,abban is kiszámolhatjuk az adott statisztika (becslés) értékét,ami vélhetõleg szintén nem egyezik majd pontosan a becsülendõpopulációparaméterrel, de így már 2 becslésünk lesz a populációparaméterre. Ezek átlagát vehetjük, és azt is tekinthetjük amegfelelõ elméleti paraméter becslésének. Aztán vehetünk még egymintát, ebben is számolhatjuk a megfelelõ statisztikát, és ígytovább.

Statisztikák elméleti eloszlása Ily módon tehát vehetjük egy adott populáció összes nelemû mintáját és mindegyikben kiszámolhatjuk a megfelelõstatisztika értékét. Ezek az értékek mind a populáció- paraméterbecslései lesznek, és ha a becslés torzítatlan, akkor apopuláció-paraméter körül fognak ingadozni. Már viszonylag kisszámú populációból is nagyon nagyszámú mintát vehetünk, melyekbenaz adott statisztikák értékei bizonyos eloszlást fognak követni.

Statisztikák elméleti eloszlása Az átlagot például véve tekintsünk egy populációt,amelyben egy bizonyos X véletlen változó normál eloszlást követµ átlaggal, és σ szórással (X ~ N(µ, σ) ). Ha ebbõl apopulációból 30 elemû mintákat veszünk, akkor a minták átlaganormál eloszlást fog követni melynek várható értéke(átlaga) megegyezik az eredeti véletlen változó X átlagával: szórása pedig egyenlõ lesz az X szórásának és amintaelemszám gyökének hányadosával. Azt hogy a mintaátlagok, apopulációátlag becslései mennyire ingadoznak a populációátlag (amiegyenlõ a mintaátlagok elméleti eloszlásának átlagával) körül, amintaátlagok elméleti eloszlásának szórása fejezi ki.

A becslés standard hibája Ez az érték tehát a becslések hibájának nagyságátfejezi ki és a becslés standard hibájának (SE) nevezzük. Tehát abecslés standard hibája megegyezik a becslõ statisztika elméletieloszlásának szórásával. Ha a populáció szórása nem ismert, akkor a minta szórásával becsülhetjük, így a standard hiba becslése:

A becslés standard hibája Mint a standard hiba képletébõl is látható, azelemszám növelésével a standard hiba csökken, azaz a becslő statisztikák átlagosan egyre kisebb hibával becslik a populációátlagát. A becslés standard hibájával kapcsolatos a becslés két további fontos ismérve, a hatékonyság, ami arra utal, hogy a becslés kis hibával közelíti a becsülendő paramétert, és a konzisztencia, ami arra utal, hogy a mintanagyság növelésével a becslő statisztika elméleti eloszlásának szórása, vagyis standard hibája, egyre kisebb lesz.

Intervallumbecslés Az eddigiekben tárgyalt becslést pontbecslésneknevezzük, mert a becsülendõ populáció-paraméter becslésekéntegyetlen értéket, egyetlen pontot adunk meg. Láttuk, hogy a mintaelemszámának növelésével a becslés egyre pontosabb lesz, depontosan ritkán fog megegyezni a populáció-paraméterrel. A statisztikai becslés egy másik típusát az ún. Intervallumbecslésjelenti, amikor nem pontos értéket adunk meg a populációparaméterbecsléseként, hanem egy tartományt, intervallumot, amibe abecsülendõ paraméter bizonyos valószínûséggel bele fog esni. Ezt avalószínûséget a becslés megbízhatóságának, konfidenciájánaknevezzük, az intervallumot pedig megbízhatósági tartománynak, vagykonfidencia intervallumnak.

Intervallumbecslés Az átlagok példájánál maradva: láttuk, hogy amintaátlagok normál eloszlást követnek µ várható értékkel ésszórással. Ha 95%-os konfidenciaintervallumot szeretnénk az átlagra, akkor meg kell adnunk azt atartományt, ami a populációátlagot 95%-os valószínûséggeltartalmazza. Standard normál eloszlás esetén az értékek 95%-osvalószínûséggel a -1.96 és 1.96 szórásnyi tartományba esnek, tehátaz átlag esetén a -1.96*,1.96* tartomány lesz a 95%-os konfidenciaintervallum.

Matematikai alapok é s val ószínűségszámítás

Matematikai alapok é s val ószínűségszámítás

Presentation Transcript

Mentés - Visszaállítás

Szkriptelés alapok

Scriptelés alapok

Számítástechnika matematikai alapjai

Számítógépes grafika

Vízellátás 2.előadás

EFFAS – Számvitel modul I. évfolyam

Az Európai Unió környezetpolitikája Dr. Dióssy László c. egyetemi docens

micro3.mht.bme.hu/Mumo/

1. Környezetjog története, elméleti alapok

Algoritmusok bonyolults ága és kommunikációs bonyolultság Gáspár Merse Előd fizika szeminárium

Multimédia alapok

Kockázat elemzés

Földtani ismeretek

Biztonsági kérdések

Bevezetés a méréstechnikába és jelfeldolgozásba

Szemcsehalmazok mechanikai modellezése

Tételek, bizonyítások tanítása

AGYAGÁSVÁNYOK APRÍTÁSÁNAK ÉS KERÁMIÁK ALAKADÁSÁNAK MATEMATIKAI MODELLEZÉSE

CNC programozás

INNOVÁCIÓ-MENEDZSMENT

(ellen) Reform