Predn ka
Download
1 / 14

PREDNÁŠKA - PowerPoint PPT Presentation


  • 101 Views
  • Uploaded on

PREDNÁŠKA. RNDr. Ľudmila Grešová. Korelačná a regresná analýza Rozoznávame 2 typy závislosti medzi premennými 1. funkčnú závislosť – poznáme konkrétny predpis y = f(x), kde každej hodnote x odpovedá jedna

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' PREDNÁŠKA' - rogan-sharp


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Predn ka

PREDNÁŠKA

RNDr. Ľudmila Grešová


Korelačná a regresná analýza

Rozoznávame 2 typy závislosti medzi premennými

1. funkčnú závislosť – poznáme konkrétny predpis y = f(x),

kde každej hodnote x odpovedá jedna

hodnota y

2. stochastickú (náhodnú) závislosť – každému x môže

odpovedať viac hodnôt y


Ak náhodné premenné sú nezávislé, potom k(X,Y) = 0 a teda aj ρ(X,Y) = 0.

Ak ρ(X,Y) = 0 → X,Y sú nekorelované

ρ(X,Y) ≠ 0 → X,Y sú korelované

Koeficient korelácie nás informuje o sile štatistickej závislosti (hovoríme tomu aj tesnosť väzby) medzi X a Y.

Korelačná analýza – časť MŠ, ktorá sa zaoberá štúdiom miery závislosti

Regresná analýza – študuje tvar (typ) závislosti náhodných premenných


Koeficient korelácie je mierou lineárnej korelácie. Platí

Ak 0,3 ≤ ρ< 0,5 → mierna tesnosť,

0,5 ≤ ρ< 0,7 → výrazná tesnosť,

0,7 ≤ ρ< 0,9 → vysoká tesnosť,

0,9 ≤ ρ → veľmi vysoká tesnosť.


V úlohách korelačného počtu budeme pre koeficient korelácie používať vzorec

Ak |ρ|= 1 → lineárna funkčná závislosť


Najjednoduchšou korelácie používať vzorecformou korelácie medzi dvoma kvantitatívnymi znakmi je jednoduchá lineárna korelácia, ktorú je možné popísať lineárnou regresnou priamkou.

Jej rovnica je

– vyjadruje závislosť znaku y na x

alebo

– vyjadruje regresiu x na y.

Konštanty

nazývame koeficienty alebo parametre regresie.


Metóda najmenších štvorcov korelácie používať vzorec

Je daný štatistický súbor, ktorý má n dvojíc ,

i = 1, 2,...,n.

Z rôznych možností, ktorými možno preložiť priamku cez body v korelačnom diagrame je najvhodnejšia tá alternatíva, pri ktorej sa súčet odchýlok empirických (skutočných) hodnôt od teoretických bude rovnať nule, to znamená


Pre použitie vo všeobecnosti sa táto podmienka upravila korelácie používať vzorec

– súčet štvorcov odchýlok empirických hodnôt od teoretických má byť minimálny

min.

V našom prípade, ak označíme

min.


Po úprave dostaneme sústavu normálnych rovníc a parametre a, b vyriešime Cramerovym pravidlom.

(1)


Podobne koeficienty určíme minimalizovaním súčtu štvorcov vodorovných vzdialenosti každého bodu od priamky .

V rovniciach (1) vymeníme za a naopak.

Dostaneme sústavu rovníc

a nájdeme koeficienty .


Dá sa dokázať, že platí . súčtu štvorcov vodorovných vzdialenosti každého bodu od priamky .

Čím je tento súčin bližší k jednej, tým sú regresné priamky bližšie k sebe a tým viac je oprávnený náš predpoklad o lineárnej závislosti oboch premenných.


Príklad 1. súčtu štvorcov vodorovných vzdialenosti každého bodu od priamky . U deväť náhodne vybraných otcov bola zistená ich výška a výška ich dospelých synov. Údaje sú v tabuľke.

Určte a) odhady regresných koeficientov prvej a druhej regresnej priamky;

b) korelačný koeficient.


Na zistenie spoľahlivosti hodnoty koeficientu korelácie sa používa tzv. stredná chyba koeficientu korelácie

kde n je počet dvojíc hodnôt znakov medzi ktorými meriame závislosť.

Koeficient korelácie je spoľahlivou mierou tesnosti závislosti vtedy, keď je väčší ako trojnásobok teoretickej strednej chyby, teda


Príklad 2 používa tzv. . U desiatich náhodne vybraných študentov bola zistená ich výška a hmotnosť. Vypočítajte koeficient korelácie medzi výškou a hmotnosťou týchto študentov. Údaje sú uvedené v tabuľke


ad