Relaci entre dues variables qualitatives amb dues o m s categories
Download
1 / 43

Relació entre dues variables qualitatives amb dues o més categories. - PowerPoint PPT Presentation


  • 151 Views
  • Uploaded on

Relació entre dues variables qualitatives amb dues o més categories. Prova de Chi quadrat (  2 ). Relació entre dues variables qualitatives amb dues categories. Distribució de freqüències:

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Relació entre dues variables qualitatives amb dues o més categories. ' - isha


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Relaci entre dues variables qualitatives amb dues o m s categories

Relació entre dues variables qualitatives amb dues o més categories.

Prova de Chi quadrat (2)

URV Curs 2012-13


Relació entre dues variables qualitatives amb dues categories

Distribució de freqüències:

  • una variable qualitativa amb dues categories (binaria) es descriu completament amb el percentatge o la freqüència de una de las categories i el número total de individus.

URV Curs 2012-13


Descripció de la informació de variables qualitatives amb dues categories

Sexe: home/dona

  • 30% o 57 homes i n = 190.

  • 70% o 133 dones.

    Obesitat: si/no

  • 16% o 180 obesos i n = 1125.

  • 84% o 945 no obesos.

    Ingesta energètica insuficient: si/no

  • 12% o 521 ingesta insuficient i n = 4342.

  • 88% o 3821 ingesta no insuficient.

Sexe: home/dona

  • 30% o 57 homes i n = 190.

    Obesitat: si/no

  • 16% o 180 obesos i n = 1125.

    Ingesta energètica insuficient: si/no

  • 12% o 521 ingesta insuficient i n = 4342.

URV Curs 2012-13


Relació entre dues variables qualitatives amb més de dues categories.

Distribució de freqüències:

  • una variable qualitativa amb k (més de dues) categories es descriu completament amb el percentatge o la freqüència de k-1 de les categories i el nombre total d’individus.

URV Curs 2012-13


Descripció de la informació de variables qualitatives categories. amb més de dues categories

Nivell socioeconòmic: Baix/Mig baix/ Mig alt/Alt

  • 11’9% o 30 Baix o n =253

  • 35’2% o 89 Mig baix

  • 40’3% o 102 Mig alt

  • 12’6% o 32 Alt

URV Curs 2012-13


Chi quadrat ( categories. 2) per la comparació de vàries distribucions observades.

  • S’utilitza en estudis comparatius i en aquest cas la distribució teòrica de les categories de la variable d’interès (dependent) és desconeguda. No obstant, suposem que las mostres que desitgem comparar procedeixen de poblacions no diferents (Ho) i per tant aquesta distribució teòrica es pot estimar a partir de la suma de les mostres.

URV Curs 2012-13


Els càlculs es basen en la següent taula tipus: categories.

La taula té f files i c columnesofc = freqüències observades; efc = freqüències esperades

URV Curs 2012-13


Freqüència esperada (e categories. fc):

Condicions d’aplicació: efc  5

Graus de llibertat: (c - 1)(f - 1) c = columnes; f = files

URV Curs 2012-13


Es calcula l’estadístic de contrast categories. 2, mitjançant la fórmula:

URV Curs 2012-13


Formulació de les hipòtesis categories. Ho i H1

  • Ho: Les distribucions de les categories de la variable dependent NO SÓN DIFERENTS entre les diferents categories de la variable independent.

  • H1: Les distribucions de les categories de la variable dependent SÓN DIFERENTS entre les diferents categories de la variable independent.

A LA POBLACIÓ!!!!!!!!!!!!!!!

URV Curs 2012-13


Exemple 1 comparaci de tres distribucions observades
Exemple 1: Comparació de tres distribucions observades categories.

  • En un període de 18 anys d’estudi, dels 2594 homes de l’estudi de Framingham (Massachusetts) en van morir 465. D’aquestos, 81 no havien fumat mai, 51 havien deixat de fumar (exfumadors) i 333 eren fumadors.

  • Ens preguntem si existeix una associació entre l’hàbit de fumar i el risc de morir, és a dir, si a la POBLACIÓ les distribucions de mortalitat (morts/no morts) SÓN DIFERENTS entre les tres categories de fumadors.

URV Curs 2012-13


Hip tesis h o i h 1
Hipòtesis H categories. o i H1

  • Hipòtesis nul·la: les distribucions de la mortalitat NO SÓN DIFERENTS entre les tres categories de fumadors.

A LA POBLACIÓ!!!!!!!!!!!!!!!

  • Hipòtesis alternativa: les distribucions de la mortalitat SÓN DIFERENTS entre les tres categories de fumadors.

URV Curs 2012-13


Freqüències observades a la mostra categories.

URV Curs 2012-13


Freqüències observades/esperades a la mostra categories.

gll = (c -1)(f – 1) =

(3-1)(2-1) = 2

URV Curs 2012-13


Percentatge esperat de morts i vius categories. en no fumadors, ex fumadors i fumadors

URV Curs 2012-13


Percentatge esperat de no fumadors, ex fumadors i fumadors categories. en morts y vius:

URV Curs 2012-13


Grau de significació de la prova Chi quadrat ( categories. 2)

El nostre resultat 2 = 10’443 correspon a un grau de significació p<0’01 (exactament 0’005), per tant refusem Ho i concloem que la distribució de la mortalitat és diferent entre les tres categories de fumadors.

URV Curs 2012-13


Mida de la mostra per comparar dues proporcions observades

Mida de la mostra categories. per comparar dues proporcions observades

Nombre d’individus necessaris per identificar com a significativa una comparació de dues proporcions observades

URV Curs 2012-13


Mida de la mostra per comparar dues proporcions observades categories.

  • n = nombre d’individus necessaris a cada grup

  • z  = valor de z corresponent al risc  fixat

  • z  = valor de z corresponent al risc  fixat

  • pA = valor de la proporció esperada al grup A

  • pB = valor de la proporció esperada al grup B

  • pA-pB = valor mínim de la diferencia que es vol detectar

  • p = mitjana ponderada de les proporcions pA i pB

URV Curs 2012-13


Valors Z categories. α i Zβ

URV Curs 2012-13


Exemple 1: categories.

Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potència del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 40% i l’altre del 50%?

URV Curs 2012-13


Exemple 2 categories.

Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potència del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 5% i l’altre del 20%?

URV Curs 2012-13


Mida de la mostra per comparar dues proporcions observades categories.

Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral; pA i pB = proporcions esperades als grups A i B

URV Curs 2012-13


Prova d hip tesi de comparaci de dues reparticions observades utilitzant la prova de 2

Prova d’hipòtesi de comparació de dues reparticions observades utilitzant la prova de 2

Exercici

Bioestadística FMCS Reus

URV Curs 2012-2013

24


Utilitzant les dades de l’exemple “Efecte de hàbit de fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.

Bioestadística FMCS Reus

25

URV Curs 2012-2013


Els càlculs es basen en la següent taula tipus: fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.

La taula té l línies i c columnesolc = freqüències observades; elc = freqüències esperades

Bioestadística FMCS Reus

26

URV Curs 2012-2013


La taula te 2 línies i 2 columnes fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.freqüència observada

Bioestadística FMCS Reus

27

URV Curs 2012-2013


La taula te 2 línies i 2 columnes fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.freqüència observada

Bioestadística FMCS Reus

28

URV Curs 2012-2013


La taula te 2 línies i 2 columnes fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.freqüència observada

Bioestadística FMCS Reus

29

URV Curs 2012-2013


Freqüència esperada (e fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.lc):

Condicions d’aplicació: elc  5

Graus de llibertat: (c - 1)(l - 1) c = columnes; l = línies

Bioestadística FMCS Reus

30

URV Curs 2012-2013


Freqüència esperada (e fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.lc):

Graus de llibertat: (2-1)(2-1)= 1

Condicions d’aplicació: elc 5

Bioestadística FMCS Reus

31

URV Curs 2012-2013


La taula te 2 línies i 2 columnes fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.freqüència observada/freqüència esperada

Bioestadística FMCS Reus

32

URV Curs 2012-2013


Es calcula l’estadístic de contrast fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.2, mitjançant la fórmula:

Bioestadística FMCS Reus

33

URV Curs 2012-2013


Es calcula l’estadístic de contrast fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.2

Graus de llibertad: (2-1)*(2-1) = 1

Bioestadística FMCS Reus

34

URV Curs 2012-2013


Càlcul de la p fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.

El nostre resultat 2 = 3’636 correspon a un grau de significació p>0.05 (exactament 0’056), per tant no refusem la Ho i concloem que la freqüència de retard mental no és diferent entre els nascuts de parts eutòcics i distòcics

Bioestadística FMCS Reus

35

URV Curs 2012-2013


Càlcul del nombre d’individus necessaris (mida de la mostra) per la comparació de dues proporcions observades

Exercici

Bioestadística FMCS Reus

URV Curs 2012-2013

36


Quants individus necessitarem incloure en una mostra per estimar (per identificar com a significativa) amb una prova d’hipòtesi bilateral, una confiança del 95% (risc = 0’05) i una potencia del 80% ( = 0’20),

a) dues proporcions que esperem que siguin una del 15% i l’altre del 35%?

b) dues proporcions que esperem que siguin del 40% i 45% respectivament?

c) dues proporcions que esperem que siguin 55% i 80% respectivament?

Bioestadística FMCS Reus

37

URV Curs 2012-2013


Mantenint constants (com en l’enunciat) la resta de criteris:

Calcula el nombre d’individus necessaris però en el cas d’una prova d’hipòtesi unilateral.

Calcula el nombre d’individus necessaris però per una prova amb una potencia del 90% ( = 0’10)

Bioestadística FMCS Reus

38

URV Curs 2012-2013


Mida de la mostra per comparar dues proporcions observades criteris:

  • n = nombre d’individus necessaris a cada grup

  • z  = valor de z corresponent al risc  fixat

  • z  = valor de z corresponent al risc  fixat

  • pA = valor de la proporció esperada al grup A

  • pB = valor de la proporció esperada al grup B

  • pA-pB = valor mínim de la diferencia que es vol detectar

  • p = mitjana ponderada de les proporcions pA i pB

Bioestadística FMCS Reus

39

URV Curs 2012-2013


Valors Z criteris:α i Zβ

Bioestadística FMCS Reus

40

URV Curs 2012-2013


Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potencia del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 15% i l’altre del 35%?

Bioestadística FMCS Reus

41

URV Curs 2012-2013


Mida de la mostra (N) per comparar dos grups amb dues proporcions observades pA i pB

Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral

Bioestadística FMCS Reus

42

URV Curs 2012-2013


Mida de la mostra (N) per comparar dos grups amb dues proporcions observades pA i pB

Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral

Bioestadística FMCS Reus

43

URV Curs 2012-2013


ad