modelul de regresie sisteme de variabile dummy n.
Skip this Video
Loading SlideShow in 5 Seconds..
Modelul de regresie sisteme de variabile dummy PowerPoint Presentation
Download Presentation
Modelul de regresie sisteme de variabile dummy

Loading in 2 Seconds...

  share
play fullscreen
1 / 18
Download Presentation

Modelul de regresie sisteme de variabile dummy - PowerPoint PPT Presentation

atara
102 Views
Download Presentation

Modelul de regresie sisteme de variabile dummy

- - - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

  1. Modelul de regresie sisteme de variabile dummy Bibliografie recomandată • Traiman. D, 2004, • Agresti & Finley norbertpetrovici@yahoo.com cristina_rat@yahoo.com

  2. Ipoteze şi variabile • Ipoteză: magicarizarea credinţelor religioase a unei persoane depinde de tipurile de reţele instituţionale în care este integrat. De exemplu: sistemul şcolar sau biserica din care face parte persoana. • Variabile: (BOP 2000 primăvara) • Credinţelor religioase a unei persoane: • Sistemul şcolar: • Biserica din care face parte.

  3. Metoda statistică şi variabilele • Ipoteza este formulată în termeni cauzali: • Credinţele religioase Sistemul şcolar + Tipul bisericii • Adică, avem o problemă de regresie. • Variabile: sunt calitative. Pentru a formula in termenii unei regresi aceasta problemă trebuie să realizăm o serie de transformări ale variabilelor: • 1. să mărim scara de măsură: să le transformăm în variabile cantitative • 2. să le transformăm în variabile dummy

  4. Transformarea variabilelor: variabila dependentă • Credinţelor religioase a unei persoane sunt înregistrate de opt variabile. Ele se grupează conceptual în două dimensiuni sau seturi de variabile [fapt confirmat şi de analiza factorială şi analiza de reliabilitate]: • Setul 1 - Religiozitate magica: Telepatie (transmiterea gândurilor), Ghicit (cafea, cărţi, etc.), Horoscop, Vrăjitorie. • Setul 2 - Religiozitate creştina: Viata de după moarte, Rai, Judecata de Apoi, Puterea rugăciunii. • Iar acest lucru îl facem recodând variabilele: • 1 Da; 2 Nu  1 Da; 0 Nu • Iar apoi adunăm variabilele din acelaşi set

  5. Transformarea variabilelor: variabila dependentă • Adunând variabilele dihotomice, una câte una, vedem cum noua variabila dependentă se transformă, încet într-o variabilă continuă. Cu cât adunăm mai multe variabile cu atât noua variabilă va tinde spre o variabilă continuă. [măsura în care reuşeşte să atingă acest deziderat: testul de reliabilitate] • Nou indice obţinut se numeşte: indice aditiv/sumativ

  6. Transformarea variabilelor: variabilele independente • Educaţia: Variabila care înregistrează educaţia în barometrul de opinie este măsurată pe o scală ordinală, iar pentru regresie avem nevoie de o variabila cantitativă. • Fiecărei diplome educaţionale îi corespunde un anumit număr de ani • Recodăm variabila: Diplome educaţionale (p0scoa)  Număr de ani de şcoală (educ)

  7. Transformarea variabilelor: variabilele independente • Religia: Variabila care înregistrează religia, este o variabilă categorială, nominală. • Nu putem: • Crea un nou indice (avem doar o singura variabilă) • Echivala cu o variabilă cantitativă • Putem: • Să tratăm această variabilă ca un sistem de variabile dummy • Recodăm religia in următorul fel: R1= 1 dacă este Ortodox şi Greco-Catolic şi = 0 altfel R2= 1 dacă este Romano-Catolic şi 0 = altfel R3= 1 dacă este Protestant şi = 0 altfel R4= 1 dacă este Neo-protestant şi = 0 altfel R5= 1 dacă are Altă Religie, Religie Nedeclarată şi Fără Religie şi = 0 altfel

  8. Transformarea variabilelor: variabilele independente • Să observăm ce se întâmplă dacă facem o regresie cu ajutorul var. dummy: • Religiozitate magică (RM) Religie (R) RM* = a+ b2R2 +b3R3 +b4R4 + b5R5 =a + ΣbiRi • Adică: RM* = 0,765 - 0,139R2 - 0,288R3 -0,522R4 - 0,194R5 • Să rescriem acum ecuaţiile pentru fiecare caz: Pt.Ortotocşi: RM*= a+ b2*0+b3*0+b4*0+ b5*0 =a =0,765 Pt.Catolici: RM*= a+ b2*1+b3*0+b4*0+ b5*0 =a - b2=0,765 - 0,139 = 0,626 Pt.Protestanţi: RM*= a+ b2*0+b3*1+b4*0+ b5*0 =a - b3=0,765 - 0,288 = 0,477 Pt.Neo-protestanţi: RM*= a+ b2*0+b3*0+b4*1+ b5*0 =a - b4=0,765 -0,522 = 0,243 Pt.Alţii: RM*= a+ b2*0+b3*0+b4*0+ b5*1 =a - b5=0,765 -0,194 = 0,57 =0,765- 0.626

  9. Modelul de regresie • Var. dummy par a fi un mod complicat de a estima mediile, însă ele devin cu adevărat puternice atunci când sunt combinate cu alte variabile cantitative. • Ipoteza noastră poate fi formulată având în vedere variabilele noastre în cel putin trei moduri diferite şi pertinente teoretic: • RM  Educaţie (E): RM* = a + bE • RM  Educaţie + Religie (R):RM* = a + bE + ΣciRi • RM  Educaţie + Religie + Religie*Educaţie (R*E):RM* = a + bE + ΣciRi + ΣdiRiE • Variabila de interacţiune Ri*E: • Presupunem că între religie şi educaţie există o anumită interacţiune în ceea ce priveşte credinţele magice • Adică, credem că grupurile religioase diferă în ceea ce priveşte modul în care educaţia influenţează credinţele magice • Scopul nostru este să selectăm model este mai bun din acestea trei.

  10. Credinţe magice diferenţiate în funcţie de religie: Selecţia modelului

  11. Logica modelelor • Să observăm ce se întâmplă dacă facem o regresie cu ajutorul var. dummy: • Religiozitate magică (RM) Religie (R) Model 1: RM* = ,102 +,065*E Model 2: RM* = ,144 + ,004*E – ,142*R2 – ,295*R3 – .390*R4 – .271*R5 Model 3: RM* = ,120+ ,066*E– ,257R2 – ,207*R3+ ,309*R4–,386*R5 + + ,012*R2*E–,009*R3*E–,090*R4*E + ,012R5*E • Să rescriem pt. Modelul 2 ecuaţiile pentru Ortodocşi, Catolici şi Protestanţi • Să rescriem pt. Modelul 3 ecuaţiile pentru Ortodocşi, Catolici şi Protestanţi

  12. Logica modelelor • Diferenţa dintre Modelul 2 şi Modelul 3 este că • În Modelul 1diferă doar interceptul modului în care variază credinţele magice în funcţie de educaţie. • În Modelul 2 diferă şi interceptul şi panta în care variază credinţele magice în funcţie de educaţie Modelul 3 Modelul 2 Numări de ani de şcoală Numări de ani de şcoală

  13. Credinţe magice diferenţiate în funcţie de religie: Selecţia modelului Ne indică cele trei modelele pe care ni le-am propus. Metoda Enter înseamnă că în analiză intră toate variabilele specificate Ne indică Proporţia din varianţă variabilei dependente explicată de fiecare model: Model 1: 0,062; Model 2: 0,070; Model 3: 0,074. Acesta este tabelul de Analiză de varianţă, care indica raportul dintre varianţe punctelor în jurul drepte de regresie şi varianţa punctelor de pe dereapta de regresie în jurul mediei. Ne indică în ce măsruă poate fi generalizat modelul de regresie la populaţie

  14. Credinţe magice diferenţiate în funcţie de religie: Selecţia modelului • b, reprezintă coeficienţii de regresie nestandardizaţi ai modelului, care indică efectul net al fiecărei variabile, în unităţile de măură a variabilei dependente. • St. Error sunt erorile standard, care trebuie sa fie de două ori mai mici decât b pentru ca acestea să fie semnificative, pentru P=95%. • Beta, reprezintă coeficienţii standardizaţi care ne arată efectul net pe care îl are fiecare variabilă, în abateri standard • t, este valoarea testului t prin care testăm ipoteza nulă că un coeficient de regresie nu este diferit de 0, dacă generalizăm la populaţie. • Sig. nivelul de probabilitate, daca este mai mic decât 0,05 respingem ipoteza nulă a testului t si acceptăm ipoteza alternativă, ca coeficientul este diferit de 0 si poate fi generalizat la populaţie Observăm că tabelul are trei secţiuni care indică cele trei Modele estimate. Care model este însă mai bun?

  15. Credinţe magice diferenţiate în funcţie de religie: Selecţia modelului • Noi vrem să estimăm care model este mai puternic. Principiile sunt: • cel al simplităţii: mai puţine variabile introduse în model • cel al adecvării: varianţă mai mare explicată • Cele trei modele pe care le-am construit se numesc modele încorporate(nested)pentru că adaugă termeni succesivi de la o ecuaţie la alta, păstrându-i pe cei adăugaţi deja la pasul anterior. Pentru aceste modele există o metodă specifică de comparaţie: • Unde, F este testul F RB2este R2 mai mare RA2este R2 mai mic m diferenţa de variabile între cele două modele N numărul de cazuri k numărul de variabile independete în modelul cu mai multe variabile • Modelul 2 vs. Modelul 1: F(5,1784)=3.836 Fcritic(5,1784)=2.21 [semnificativ p=0.05] • Modelul 3 vs. Modelul 1: F(8,1780)=2.883 Fcritic(8,1780)=1.94 [semnificativ p=0.05] • Modelul 3 vs. Modelul 2: F(4,1780)=1.922 Fcritic (4,1780)=2.37 [nesemnificativ p=0.05]

  16. Credinţe creştine diferenţiate în funcţie de religie: Selecţia modelului

  17. Credinţe creştine diferenţiate în funcţie de religie: Selecţia modelului

  18. Credinţe creştine diferenţiate în funcţie de religie: Selecţia modelului