7 comparando dos grupos l.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
7. Comparando Dos Grupos PowerPoint Presentation
Download Presentation
7. Comparando Dos Grupos

Loading in 2 Seconds...

play fullscreen
1 / 41

7. Comparando Dos Grupos - PowerPoint PPT Presentation


  • 137 Views
  • Uploaded on

7. Comparando Dos Grupos. Objetivo : Usar IC y/o prueba de significancia para comparar medias (variable cuantitativas ) o comparar proporciones (variable categórica ) Grupo 1 Grupo 2 Estimación Media poblacional Proporción poblacional

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about '7. Comparando Dos Grupos' - livia


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
7 comparando dos grupos
7. Comparando Dos Grupos
  • Objetivo: Usar IC y/o prueba de significanciaparacomparar medias (variable cuantitativas) o compararproporciones (variable categórica)

Grupo 1 Grupo 2 Estimación

Media poblacional

Proporciónpoblacional

  • Realizamosinferenciasobre la diferencia entre medias o diferencia entre proporciones (el orden no importa).
el uso del celular mientras manejamos disminuye tiempos de reacci n
El uso del celularmientrasmanejamosdisminuyetiempos de reacción?
  • Un artículo en Psych. Science (2001, p. 462) describe un experimentoqueasignaaleatoriamente 64 estudiantes de la Univ. de Utah al grupo de teléfonoscelulares o al grupo control (32 cadauno). Unamáquinasimuladora de manejopresentóunaluzroja o verde a periodosirregulares. Instrucciones: Presionar el pedal del freno tan pronto como sea posiblecuando se detecta la luzroja.

Verhttp://www.psych.utah.edu/AppliedCognitionLab/

  • Grupo de teléfonocelular: Mantuvounaconversaciónsobretemaspolíticos con alguien en otrocuarto.
  • Grupo control: Escuchó el radio
slide3

Resultadomedido: media del tiempo de respuestapara un sujetosobre un númerogrande de ensayos

  • Propósito del estudio: Analizarsi la media de respuesta de la población (conceptual) difieresignificativamente entre los dos grupos, y siesasí, porcuánto.
  • Datos:

Grupo de celulares: = 585.2 milisegundos, s1 = 89.6

Grupo control: = 533.7, s2= 65.3.

tipos de variables y muestras
Tipos de variables y muestras
  • La variable resultado, de la que se hacencomparaciones, es la variable respuesta.
  • La variable que define los grupos a ser comparadoses la variable explicativa.
  • Ejemplo: Tiempo de reacciónes la variable respuesta

Grupo experimental es la variable explicativa

(var. categórica con categoríascelular, control)

  • O, se puedeexpresar el grupo experimental como “uso de celular” con categorías (sí, no)
slide6

Se utilizandiferentesmétodosparamuestrasdependientes(parejasnaturales entre un sujeto en unamuestra y un sujeto en otramuestra, tales como “estudioslongitudinales”, donde se observansujetosrepetidamente a través del tiempo) y muestrasindependientes(muestras, no hay parejas, como en un “estudio transversal”).

  • Ejemplo: Másadelanteconsideramosexperimentosseparados en donde el mismosujetoformó parte del grupo control en un momento y al grupo de celular en otromomento.
slide7

Ejemplo: Estudio de anorexia, estudiando el cambio en el peso para 3 grupos (terapia de comportamiento, terapia familiar, control)

  • Cuálsería un ejemplo de
    • muestrasindependientes?
    • muestrasdependientes?
se para diferencia entre dos estimaciones muestras independientes
se paradiferencia entre dos estimaciones(muestrasindependientes)
  • La distribuciónmuestral de la diferencia entre dos estimacionesesaproximadamente normal (n1 y n2grandes)y tiene error estándarestimado
  • Ejemplo: Datos en “Tiempos de respuesta” tiene

32 usandocelular con media 585.2, s = 89.6

32 en grupo control con media 533.7, s = 65.3

  • Cuáles el error estándarse paraunadiferencia entre medias de

585.2 – 533.7 = 51.4?

slide9

(Nota queesmásgrandequecadase porseparado. Porqué?)

  • Entonces, la difernciaestimada de 51.4 tiene un margen de error de 1.96(19.6) = 38.4

95% IC es 51.4 ± 38.4, ó (13, 90).

  • Interpretación: Tenemosunaconfianza del 95% de que la media poblacionalpara el celulares de entre 13 milisegundosmásalta y 90 milisegundosmásaltaque la media poblacional del grupo control.

(En la práctica, esunabuena idea volver a hacer el análisisomitiendo el outlier, paraverificarsuinfluencia. Quépiensasquepasaría?)

ic comparando dos proporciones
IC comparando dos proporciones
  • Recuerdaque el se paraunaproporciónmuestralusado en un IC es
  • Entonces, el se para la diferencia entre proporcionespara dos muestrasindependienteses
  • Un IC para la diferencia entre proporcionespoblacionaleses
  • Como de costumbre, z depende del nivel de confianza, 1.96 paraunaconfianza de 95%
slide11

Ejemplo: Un estudio de alcohol en la universidadfuerealizadopor la Escuela de SaludPúblicade Harvard (http://www.hsph.harvard.edu/cas/)

  • Tendencias en el tiempo en el porcentaje de consumo excesivo de alcohol (consumo de 5 o más bebidas continuas en hombres y de 4 o más para las mujeres, al menos una vez en la últimas dos semanas) o la las actividades que influencian
  • “Have you engaged in unplanned sexual activities because of drinking alcohol?”

1993: 19.2% sí de n = 12,708

2001: 21.3% sí de n = 8,783

Cuáles el IC del 95% CI para el cambio en la respuesta “sí”?

slide12

Cambioestimado en la propociónque dice “sí” es 0.213 – 0.192 = 0.021.

  • IC del 95% para el cambio en la proporciónpoblacionales

0.021 ± 1.96(0.0056) = 0.021 ± 0.011,

ó (0.01, 0.03)

  • Tenemosunaconfianza del 95% que la proporciónpoblacionalque dice “sí” es entre 0.01 másgrande y 0.03 másgrande en 2001 que en 1993.
comentarios sobre ics para la diferencia entre dos proporciones poblacionales
Comentariossobre ICs para la diferencia entre dos proporcionespoblacionales
  • Si el IC del 95% paraes (0.01, 0.03), entonces el IC del 95% CI paraes (-0.03, -0.01). Es arbitrario lo que llamamos el Grupo 1 y Grupo 2 y cuál es el orden para comparar las proporciones
  • Cuando 0 no está en el IC, podemos concluir que una proporción de la población es más alta que la otra.

(p.ej., si todos los valores son positivos cuando calculamos Grupo 2 - Grupo 1, entonces concluimos que la proporción poblacional es más alta en el grupo 2 que en el Grupo 1)

slide14

Cuando 0 está en el IC, es plausible que la proporcionespoblacionalesseanidénticas.

  • Ejemplo: Asumeque el IC del 95% para el cambio en la proporciónpoblacional (2001 – 1993) es (-0.01, 0.03)

“Tenemosunaconfianza del 95% que la proporciónpoblacionalque dice “sí” fue entre 0.01 máspequeña y 0.03 másgrande en 2001 que en 1993.”

  • Hay unaprueba de significancia de H0: 1 = 2quelasproporcionespoblacionales son idénticas

(esdecir, la diferencia1 - 2 = 0), usando la estadística de prueba

z = (diferencia entre proporcionesmuestrales)/se

  • Para sexo no planeado en 1993 y 2001,

z = diferencia/se = 0.021/0.0056 = 3.75

valor-p de dos-lados = 0.0002

  • Estoparece ser estadísticamentesignificativopero sin significanciapráctica!
slide15

Detallessobre la prueba en pp. 189-190 del libro de texto; usase0que junta los datosparaobtenerunamejorestimaciónbajo H0

(Estudiamosestapruebacomo un caso especial de la “pruebaji-cuadrada” en el próximocapítulo, quetrata con posiblementemuchosgrupos, muchascategorías de respuesta)

  • La teoríadetrás del IC usa el hechoquelasproporcionesmuestrales (y susdiferencias) tienenunadistribuciónmuestralaprox. normal paran’sgrandes, por el Teorema Central del Límite, asumiendoaleatorización)
  • En la práctica, la fórmulafunciona ok si hay al menos 10 resultados de cadatipoparacadamuestra

(Nota: No usamos la dist. t parainferenciasobrepropociones; sin embargo, hay métodosespecializadosparamuestras-pequeñas, p.ej., usando la distribución binomial)

respuestas cuantitativas comparando medias
RespuestasCuantitativas: Comparando Medias
  • Parámetro: m2 - m1
  • Estimador:
  • Error estándarestimado:
    • Dist. muestral: Aprox. normal (n’sgrandes, por TCL)
    • IC paramuestrasalreatoriasindependientes de dos distribucionespoblacionalesnormalestiene la forma
    • Fórmulapara los df (grados de libertad) para el valor-t escomplejo (másadelante). Si ambos tamaños de muestra son al menos 30, podemosusar el valor-z
ejemplo datos de gss sobre n m de amigos cercanos
Ejemplo: Datos de GSS sobre “núm. de amigos cercanos”
  • Usargénerocomo la variable explicativa:

486 mujeres con media 8.3, s = 15.6

354 hombres con media 8.9, s = 15.5

  • Diferenciaestimada de 8.9 – 8.3 = 0.6 tiene un margen de error de 1.96(1.09) = 2.1, y un IC del 95% es

0.6 ± 2.1, ó (-1.5, 2.7).

slide18

Podemostenerunaconfianza del 95% que la media poblacional del número de amigos cercanos de los hombres es entre 1.5 menos y 2.7 más amigos que la media poblacional del número de amigos cercanos de lasmujeres.

  • El ordenesarbitrario. IC del 95% comparando medias de mujeres – hombres es (-2.7, 1.5)
  • Cuando el IC contiene 0, es plausible que la diferencia sea 0 en la población (esdecir, la medias poblacionales son iguales)
  • Aquí, el supuesto de población normal esclaramenteviolado. Para n’sgrandes, no hay problemadebido al TCL, y paran’spequeñas el métodoesrobusto. (Pero, las medias pueden no ser relevantesparadatosmuyasimétricos.)
  • Alternativamentepodemosprobarsignificanciaparaencontrarfuerza de la evidenciasobresilas medias difieren.
pruebas de significancia para m 2 m 1
Pruebas de significanciaparam2 - m1
  • Típicamentedeseamosprobarsi dos medias poblacionalesdifieren

(siendohipótesisnula null no diferencia, “no efecto”).

  • H0: m2 - m1 = 0 (m1 = m2)

Ha: m2 - m1  0 (m1 m2)

  • Pruebaestadística:
slide20

Pruebaestadísticatienetiene la forma de costumbre

(estimación del parámetro – valor hipóthesisnula)/error estándar

  • Valor-p: probabilidad de dos-colas de la dist. t
  • Para unaprueba 1-lado (talcomoHa: m2 - m1 > 0), valor-p = probabilidad de 1-cola de dist. t (pero, no robusta)
  • Interpretación del valor-p y conclusiónusandonivel- como en los métodos de unamuestra

(p.ej., asume valor-p = 0.58. Entonces, bajo el supuesto de que la hipótesisnulaesverdadera,probabilidad = 0.58 de obtenerdatoscomo los observados o inclusoaún “másextremos”, donde “másextremo” esdeterminadoporHa)

slide21

Ejemplo: Comparando medias de número de amigos cercanos entre mujeres y hombres, H0: m1 = m2 Ha: m1m2

  • Diferencia entre medias muestrales = 8.9 – 8.3 = 0.6

se = 1.09 (como en el cálculo de IC)

Pruebaestadísticat = 0.6/1.09 = 0.55

valor-p = 2(0.29) = 0.58

  • Si la hipótesisnulaesverdaderaque la medias poblacionalesseaniguales, no seríainusualmuestrascomolasobservadas.
  • Para  = 0.05, no hay suficienteevidenciapararechazar la nula.
  • Es plausible quelas medias poblacionalesseanidénticas.

Para Ha: m1 < m2, valor-p = 0.29

ParaHa: m1 > m2 valor-p = 1 – 0.29 = 0.71

equivalencia de ic y pruebas de significancia
Equivalencia de IC y pruebas de significancia
  • “H0: m1 = m2 rechazada (no rechazada) a un nivel- a favor deHa: m1m2”, equivalente a

“100(1 - )% IC param1 - m2 no incluye 0 (incluye 0)”

  • Ejemplopara = 0.05: valor-p = 0.58, entonces

“no rechazamos H0quelas medias poblacionalesseaniguales”

IC del 95% de (-1.5, 2.7) contiene el 0

slide23

Inferenciaalternativacomparando medias asumedesviacionesestándarpoblacionalesiguales.

  • No consideraremosfórmulasparaesteenfoqueaquí (en Sección 7.5 del libro de texto), yaquees un caso especial de los métodos de “análisis de varianza” que se estudian en el Capítulo 12.

Este IC y pruebausan la distribuciónt con

df = n1 + n2 - 2

  • Vamos a ver cómo el software muestra este enfoque y el que hemos usado que no asume la igualdad de las desviaciones estándar de la población.
slide24

Ejemplo: Ejercicio 7.30, p. 213. Resultados de mejorapara

terapia A: 10, 20, 30

terapia B: 30, 45, 45

A: media = 20, s1 = 10

B: media = 40, s2 = 8.66

Archivo de datos, el cuál se importa en SPSS y analiza

SujetoTerapiaMejora

1 A 10

2 A 20

3 A 30

4 B 30

5 B 45

6 B 45

prueba de h 0 m 1 m 2 h a m 1 m 2
Prueba de H0: m1 = m2 Ha: m1m2
  • Pruebaestadísticat = (40 – 20)/7.64 = 2.62

When df = 4, P-value = 2(0.0294) = 0.059.

  • For one-sided Ha: m1< m2 (i.e., predict before study that therapy B is better), P-value = 0.029
  • With  = 0.05, insufficient evidence to reject null for two-sided Ha, but can reject null for one-sided Ha and conclude therapy B better.

(but remember, must choose Ha ahead of time!)

c mo obtiene el software los df para el m todos de varianzas desiguales
Cómoobtiene el software los dfpara el métodos de “varianzasdesiguales”?
  • Cuandopermitimoss12 s22recuerdaque
  • Los grados de libertad “ajustados” para la distribuciónt es (aproximación Welch-Satterthwaite) :
algunos comentarios sobre comparaci n de medias
Algunoscomentariossobrecomparación de medias
  • Pruebas-t de un-lado no son robustas contra violacionesseveras del supuesto de normalidad, cuandon esrelativamentepequeña. (Es mejorusarmétodos “no-paramétricos” (que no asumeuna forma particular de la distribución de población) parainferencia de un-ladocuando el supuesto de población normal esseveramenteviolado, invalidandoinferenciast inferences; verlibro de textoSección 7.7)
  • IC muestrasi los valoresplausiblesestáncerca o lejos de H0 en términosprácticos.
slide29

Cuando los grupostienenvariación similar, unamedidaresumen del efecto de tamaño (effect size) si

  • Ejemplo: Las terapiastienen medias muestrales de 20 para A y 40 para B y desviacionesestándar de 10 y 8.66. Si la desviaciónestándar en cadagrupoes 9 (digamos), entonces

effect size = (20 – 40)/9 = -2.2

  • Media paraterapia B se estimaqueestá a dos desv. est. másque la media para la terapia A, un efectogrande.
comparando medias con muestras dependientes
Comparando medias con muestrasdependientes
  • Situación: Cadamuestratiene los mismossujetos (como en estudioslongitudinales o transversales) o parejas de sujetos (datospareados)
  • Entonces, noesverdadqueparacomparar dos estadísticas,
  • Debemospermitir “correlación” entre estimaciones (Porqué?)
  • Datos: yi = diferencia en medicionesparasujetos (par) i
  • Tratar los datoscomouna sola muestra de diferencia de mediciones, con una media muestral y desviaciónestándarmuestralsdy parámetromd = media poblacional de diferencia de mediciones.
  • De hecho, md= m2– m1
slide32

Ejemplo: Estudio de celulartambiénexperimentó con los mismossujetos en cadagrupo (datos en p. 194 de libro de texto)

Para estos “datospareados”, el archivo de datostiene la forma

SujetoCelular_noCelular_sí

1 604 636

2 556 623

3 540 615

… (para 32 sujetos)

Medias muestrales son:

534.6 milisegundos sin celular

585.2 milisegundos, usandocelular

slide33

Reducimoslas 32 observaciones a 32 diferencias de mediciones,

636 – 604 = 32

623 – 556 = 67

615 – 540 = 75

….

  • Y analizamos con métodosestándarparauna sola muestra

= 50.6 = 585.2 – 534.6, sd= 52.5 = std dev of 32, 67, 75 …

  • Para un IC del 95% CI, df= n – 1 = 31, valor-t = 2.04

Obtenemos 50.6 ± 2.04(9.28), ó (31.7, 69.5)

slide34

Tenemosunaconfianza del 95% que la media poblacionalusa el celular entre 31.7 y 69.5 milisegundosmásque sin celular.

  • Para probar H0 : µd = 0 contra Ha : µd  0, la estadística de pruebaes

t = ( - 0)/se = 50.6/9.28 = 5.5, df = 31,

  • Valor-p de dos-lados = 0.000005, entonces hay fuerteevidencia contra la hipótesisnulaque no nay diferencia entre medias poblacionales.
con spss
Con SPSS
  • Realizatanálisis de muestrasdependientes
  • Dibujacelular_sí contra celular_no y observaunafuertecorrelaciónpositiva (0.814), la quemuestracómo un análisisqueignora la dependencia entre observaciones no seríaapropiada.
  • Nota que un sujeto (número 28) es un outlier (inusualmentegrande) en ambas variables
  • Habiendoborrado el outlier , SPSS nos dice quet = 5.26, df = 30 para la comparación de medias (valor-p = 0.00001), IC del 95% de (29.1, 66.0). Los resultadosanteriores no se influenciaron mucho por el outlier.
resultados de spss
Resultados de SPSS
  • Análisist de muestrasdependientes (incluyendo el outlier)
algunos comentarios
Algunoscomentarios
  • Muestrasdependientestienenventajas
    • (1) controlarfuentes de sesgospotenciales (p.ej., balancearmuestras en variables que no afectan la respuesta),
    • (2) tener un error estándar (se) menorparalasdiferencias de medias, cuandolasrespuestaspareadastienenunaaltacorrelaciónpositiva (en cuyocaso, la diferencia de medicionesmuestramenosvariaciónque la variación de medias separadas)
  • Con muestrasdependientes, porqué no podemosusar la fórmula del error estándar (se) paramuestrasindependientes?
ejemplo artificial pero muestra el punto
Ejemplo: (artificial, peromuestra el punto)
  • Pesos antes y después de la terapiapara anorexia

Sujeto Antes DespuésDiferencia

1 115 122 7

2 91 98 7

3 100 107 7

4 132 139 7

  • Muchavariabilidadparacadagrupo de observaciones, perono hay variabilidadpara la diferencia de mediciones
  • Si graficamosx = peso antes contra y = peso después, quéobservamos?
slide39

La pruebaMcNemar(pp. 201-203) comparaproporciones con muestrasdependientes

  • Prueba exacta de Fisher (pp. 203-204) comparaproporcionesparamuestrasindependientes
  • Algunasvecesesmásútilcomparargruposusandococientes en lugar de diferencia de parámetros
slide40

Ejemplo: El departamento de justicia de EU reportaque la proporción de adultos en prisiónesalrededor de

900/100,000 para hombres, 60/100,000 paramujeres

  • Diferencia: 900/100,000 – 60/100,000

= 840/100,000 = 0.0084

Cociente: [900/100,000]/[60/100,000] = 900/60 = 15.0

  • En aplicacionesdonde la proporción se refiere a un resultado no deseable (p.ej., mayoría de estudiosmédicos), el cociente se llama riesgorelativo
algunas preguntas resumen
Algunaspreguntasresumen
  • Da un ejemplo de (a) muestrasindependientes, (b) muestrasdependientes
  • Da un ejemplo de (a) var. respuesta, (b) var. explicativacategórica, e identificasi la respuestaescuantitativa o categórica y especifica el análisisapropiado.
  • Asumeque un IC del 95% para la diferencia entre Massachusetts y Texas de la proporciónpoblacionalqueapoya el matrimonio legal entre personas del mismosexoes (0.15, 0.22).
    • Proporciónpoblacional de apoyoes mayor en Texas
    • Yaque 0.15 y 0.22 < 0.50, menos de la mitad de la poblaciónapoya el matrimonio legal entre personas del mismosexo.
    • El IC del 99% podría ser (0.17, 0.20)
    • Es plausible quelasproporcionespoblacionalesseaniguales.
    • Valor-p paraprobarproporcionespoblacionalesiguales contra la alternativa de dos-ladospodría ser 0.40.
    • Podemostenerunaconfianza del 95% que la proporciónmuestralqueapoya en MA es entre .15 y .22 másaltaque en TX.