170 likes | 349 Views
Adattípusok, adatsorok jellegadó értékei. dr. Jeney László egyetemi adjunktus jeney@caesar.elte.hu. Regionális és környezeti elemzési módszerek I. BME Regionális és környezeti gazdaságtan mesterszak (MSc) 2013/2014, II. félév BCE Gazdaságföldrajz és Jövőkutatás Tanszék. Mérési skálák.
E N D
Adattípusok, adatsorok jellegadó értékei dr. Jeney László egyetemi adjunktus jeney@caesar.elte.hu Regionális és környezeti elemzési módszerek I. BME Regionális és környezeti gazdaságtan mesterszak (MSc) 2013/2014, II. félév BCE Gazdaságföldrajz és Jövőkutatás Tanszék
Statisztikai fogalmak • Sokaság: • A megismerni kívánt, megfigyelt egységek halmaza • Ismérvek: • A sokaság jellemzésére, részekre bontására alkalmas vizsgálati szempontok • Területi elemzések: legalább 2 ismérv • Területi ismérv • Változók: időbeli, mennyiségi, minőségi ismérvek • Adatok jól csoportosíthatók az összehasonlíthatóságuk szerint mérési (vagy adat) skálák rendszere
Mérési skálák hierarchiája • Mindegyik mérési skála rendelkezik az alatt lévő tulajdonságaival • A „hierarchia csúcsán” az arányskála áll • Legteljesebb összehasonlításra ad lehetőséget • Mérési skála meghatározza a matematikai-statisztikai módszereket • Brazil válogatott nem 63X jobb mint a magyar • 0 átlagú adatsort nem lehet az átlag %-ában megadni • Többváltozós vizsgálatoknál: • Többféle mérési skála, de azonos mérési skálájú adatokra van szükség adat-transzformáció
Mérési skálák transzformációja • Leggyakrabban: • intervallum- vagy arányskálán mért jellemzők ordinális adatskálára átalakítása (pl. komplex mutatóknál: rangsorolás) • Azonos értékek: rangszámok is azonosak • Páratlan számú (pl. 3) adat egyezése: középső rangszám (8., 9. és 10. helyett 9., 9. és 9.) • Páros számú (pl. 2) adat egyezése: rangszámok átlaga (4. és 5. helyett 4,5. és 4,5.) • Nincs holtversenyben elsőség • 1. és 2. helyett 1,5. és 1,5 (1. és 1. helyett)
Adatsorok 2 fő típusa: nem fajlagos és fajlagos mutatók • Nem fajlagos (abszolút) mutatók • Pl. népességszám, GDP, személygépkocsik száma, terület, városlakók száma • Jelölése: xi azaz x abszolút mutató értéke adott „i” régióban • Fajlagos mutatók (relatív vagy származtatott mutatók) • Pl. egy főre jutó GDP, ezer lakosra jutó személygépkocsik, népsűrűség, városlakók aránya • Lehet százalékos részesedés is: pl. városlakók aránya • Jelölése: yi azaz y fajlagos mutató értéke adott „i” régióban • Általában 2 nem fajlagos mutató hányadosa, pl. GDP és népesség (ritkán 2 fajlagos mutató hányadosa, pl. megyei GDP/fő az országos átlagos GDP/fő %-ában) • Esetükben súlyozni kell (pl. súlyozott átlag, súlyozott szórás) • A súly a fajlagos mutató képletének nevezőjében van, jelölése fi azaz f súly értéke adott „i” régióban • Súly gyakran népességszám, de nem mindig
Nem fajlagos – fajlagos mutatók valamint a súly közötti átszámítások • Ha a nem fajlagos mutató (GDP) és a súly (népességszám) ismert • A fajlagos mutató (GDP/fő): a nem fajlagos mutató és a súly hányadosa • Ha a nem fajlagos (GDP) és a fajlagos mutató ismert (GDP/fő) • A súly (népesség): a nem fajlagos és a fajlagos mutató hányadosa • Ha a fajlagos mutató (GDP/fő) és a súly (népesség) ismert • Nem fajlagos mutató (GDP): a fajlagos mutató és a súly szorzata
Adatsorok jellegadó értékei • Középértékek • Számtani átlag / súlyozott számtani átlag • Mértani átlag • Helyzeti középértékek (módusz, medián) • Szélső értékek • Maximum • Minimum • Adatsor terjedelme és szórása (átvezet a területi egyenlőtlenségi mutatók felé) • Terjedelem-típusú mutatók • Szórás-típusú mutatók
Középértékek: átlagok • Számtani átlag • Az eredeti számok helyébe helyettesítve azok összege változatlan • n db adat (xi) • Excel fx= ÁTLAG() • Súlyozott számtani átlag • n db fajlagos adat (yi) • Súly (fi): a fajlagos mutató nevezőjében szereplő adat • Mértani átlag • Az eredeti számok helyébe helyettesítve azok szorzata változatlan • n db adat (xi)
Helyzeti középértékek • Medián • Az az érték, aminél kisebb és nagyobb adatok száma egyenlő (felező pont) • Extrém adatokat tartalmazó adatsorok esetében érdemes használni • Kvantilisek: kvartilis (negyedelő), kvintilis (ötödölő), decilis (tizedelő), percentilis (századoló) • Medián/átlag: egyenlőtlenségi mutató (minél kisebb, annál nagyobb az egyenlőtlenség) • Excel fx= MEDIÁN() • Módusz („divatos érték”) • A legtöbbször előforduló érték • Lehet többmóduszú (többcsúcsú) adatsor is • Excel fx= MÓDUSZ()
A szélső értékek és a terjedelem típusú egyenlőtlenségi mutatók • Maximum • Az adatsor legnagyobb értéke (xmax) • Excel fx= MAX() • Minimum • Az adatsor legkisebb értéke (xmin) • Excel fx= MIN() • Alapja a terjedelem típusú egyenlőtlenségi mutatóknak • Range (szóródás terjedelme) • Range-arány (adatsor terjedelme) • Relatív range
Súlyozatlan relatív terjedelem kiszámításának lépései (abszolút mutatóknál) • Ki kell számítani az adatsor maximumát (függvényvarázsló: max) • Ki kell számítani az adatsor minimumát (függvényvarázsló: min) • Ki kell vonni a maximális értékből a minimálist (ez a terjedelem) • Ki kell számítani az adatsor (sima) átlagát (függvényvarázsló: átlag) • El kell osztani a terjedelmet az átlaggal
Súlyozott relatív terjedelem kiszámításának lépései (fajlagos mutatóknál) • Ki kell számítani az adatsor maximumát (függvényvarázsló: max) • Ki kell számítani az adatsor minimumát (függvényvarázsló: min) • Ki kell vonni a maximális értékből a minimálist (ez a terjedelem) • Ki kell számítani az adatsor súlyozott átlagát • El kell osztani a terjedelmet a súlyozott átlaggal