150 likes | 286 Views
Curso-Taller Datos multivariados: Análisis Clásicos y Nuevas Tecnologías. Tema 4: Inferencia. Inferencia análisis de varianza multivariado. ¿Qué pregunta podemos contestar con un MANOVA (MANCOVA)?. ¿Hay diferencias significativas entre los vectores promedio de los tratamientos ?.
E N D
Curso-Taller Datos multivariados: Análisis Clásicos y Nuevas Tecnologías Tema 4: Inferencia
Inferencia análisis de varianzamultivariado ¿Qué pregunta podemos contestar con un MANOVA (MANCOVA)? ¿Hay diferencias significativas entre los vectores promedio de los tratamientos? ¿Se requieren supuestos para que los resultados de un MANOVA sean válidos?
Inferencia análisis de varianzamultivariado Caso univariado • El objetivo del ANOVA de efectos fijos es contrastar la hipótesis de que los efectos de tratamientos son nulos versus que al menos uno no lo es. En términos estadísticos: • H0: 1=...=a= 0 • H1: Al menos un tratamiento tiene efecto no nulo • Es equivalente a contrastar la hipótesis de que las medias de los tratamientos que se comparan son idénticas vs. que no lo son Caso multivariado Similar al univariado, pero en lugar de tener una media (o un efecto) por tratamiento, tenemos vectores medios
Inferencia análisis de varianzamultivariado • ANOVA:H0: µ1= µ2 = ,…, = µt µ1 es la media de la variable en el tratamiento 1, …. • MANOVA: H0: µ1= µ2 = ,…, = µa µ1 es el vector de medias de las variables en el tratamiento 1 • Los estadísticos de prueba más usados para contrastar esta hipótesis multivariada son los de Wilks, Pillai, Lawley-Hotelling y Roy • Todos se basan en propiedades de la matriz inv(E)H y cuantifican la relación entre la variabilidad entre y dentro de grupos en sentido multivariado, por lo que su distribución aproximada es la distribución F
Inferencia análisis de varianzamultivariado Ejemplo MANOVA 456 Análisis de la varianza multivariado Cuadro de Análisis de la Varianza (Wilks) F.V. Estadístico F gl(num) gl(den) p SEIS 0.01 19.88 35 398 <0.0001 Cuadro de Análisis de la Varianza (Pillai) F.V. Estadístico F gl(num) gl(den) p SEIS 2.43 13.25 35 490 <0.0001 Cuadro de Análisis de la Varianza (Lawley-Hotelling) F.V. Estadístico F gl(num) gl(den) p SEIS 9.12 24.08 35 462 <0.0001 Cuadro de Análisis de la Varianza (Roy) F.V. Estadístico F gl(num) gl(den) p SEIS 4.13 57.86 7 98 <0.0001
Inferencia análisis de varianzamultivariado PruebaHotelling Alfa=0.05 Error: Matriz de covarianzas común gl: 100 SEIS afafecfmsftdm p n p 4 16329.10 10.95 385.96 0.77 0.52 1.05 21.32 33 A 5 16210.71 15.85 340.71 0.77 0.52 1.53 27.27 23 B 6 216170.34 11.90 431.41 1.01 0.36 1.27 24.64 6 C 1 11449.16 8.96 536.89 0.98 0.58 1.04 19.86 21 D 2 33112.14 15.12 349.44 0.56 0.29 2.25 35.25 7 E 3 16593.80 12.76 502.43 0.73 0.39 1.51 30.99 16 F Medias con una letra común no son significativamente diferentes(p<= 0.05)
Inferencia análisis de varianzamultivariado Resultados de la prueba de comparación de vectores medios DGCmultivariada
análisis de varianzamultivariado • listo
Inferencia Regresión por mínimos cuadrados parciales (PLS) Si tenemos: Y (nx 1) vector de variable respuestaY(n x 1) X(nxp) matriz de predictorasX (n x p) En la aplicación del Análisis de Regresión, se puedenpresentar dos problemas : 1)n < p El número de observacionesesmenorque el númerode predictoras 2)Multicolinealidad : relación lineal entre predictoras ¿ Cómo se solucionaestosproblemas ? Respuesta:aplicarAnálisis de Regresión PLS
Inferencia Regresión por mínimos cuadrados parciales (PLS) • OBJETIVO • Hallarcomponentes (variables latentes) no correlacionadas • Reducciónde la dimensionalidad • Mejorar la estimación CombinaAnálisis de ComponentesPrincipalesy Análisis de Regresión
Inferencia análisis de correlacionescanónicas Objetivo del Análisis El análisis de correlaciones canónicas (ACC) permite estudiar la asociación entre dos conjuntos de variables. Conjunto uno: variables que caracterizan el tipo de hojas de especies vegetales Conjunto dos: variables que caracterizan la arquitectura de la especie (dos conjuntos de variables)
Inferencia análisis de correlacionescanónicas ¿Cómo se alcanza el objetivo utilizando este análisis? El ACC se basa en la correlación entre una combinación lineal de las variables en un conjunto (en el ejemplo, una combinación lineal de las variables que miden el tipo de hojas) con una combinación lineal de las variables en el otro conjunto (combinación de variables que describen la arquitectura de la planta)
Inferencia análisis de correlacionescanónicas Pasos en el ACC • En un primer paso del análisis, se pretende determinar el par de combinaciones lineales con máxima correlación • En un segundo paso, el par con máxima correlación entre todos los pares no correlacionados con el par de combinaciones seleccionadas en el primer paso y así sucesivamente • Las combinaciones lineales de un par son llamadas variables canónicas y la correlación entre ellas, es llamada correlación canónica, para diferenciarla de la correlación ordinaria entre dos variables
Fernando Casanoves: casanoves@catie.ac.cr Sergio Vilchez: svilchez@catie.ac.cr GRACIAS