550 likes | 774 Views
بسم الله الرحمن الرحيم. Correlación y regresión. Dr. Moataza Mahmoud Abdel Wahab Conferencista sobre Bioestadística Instituto Superior de Salud Pública Universidad de Alejandría. Correlación. Es la relación entre dos variables cuantitativas sin ser capaz de inferir relaciones causales.
E N D
Correlación y regresión Dr. Moataza Mahmoud Abdel Wahab Conferencista sobre Bioestadística Instituto Superior de Salud Pública Universidad de Alejandría
Correlación Es la relación entre dos variables cuantitativas sin ser capaz de inferir relaciones causales. Correlación es una técnica estadística utilizada para determinar el grado en el que dos variables están relacionadas
Diagrama de dispersión de puntos • Dos variables cuantitativas • Una variable es llamada independiente (X) y la otra dependiente (Y) • Los puntos no se unen • No es tabla de frecuencias
TAS (mm HG) Dispersión de puntos de peso y presión arterial sistólica Peso (Kg)
TAS (mm HG) Peso (Kg) Diagrama de puntos dispersos de peso y tensión arterial sistólica
Dispersión de puntos El modelo de los datos es indicativo del tipo de relación entre las dos variables: • Relación positiva • Relación negativa • No hay relación
Relación positiva Calificación final del curso Número de horas para estudio
Estatura en cm Edad en semanas
Relación negativa Confiabilidad Edad del Auto
Sin relación Peso (libras) Tasa de pulso (latidos/minuto)
Coeficiente de correlación Estadístico que muestra el grado de relación entre las dos variables
Coeficiente de correlación simple (r) • También llamado correlación de Pearson • Mide la naturaleza y fuerza entre dos variables cuantitativas.
El signo de r denota la naturaleza de la asociación • Mientras que el valor de r denota la fuerza de asociación.
Si el signo es positivo, significa que la relación es directa (un incremento en una variable está asociado con el incremento de la otra variable; una disminución de una variable está asociado con la disminución de la otra variable). • Si el signo es negativo, significa una relación inversa o indirecta (significando que el incremento en una variable está asociado con una disminución de la otra variable).
El valor de r está entre ( -1) y ( +1) • El valor de r denota la fuerza de la asociación como se ilustra en el siguiente diagrama. fuerte intermedio débil débil intermedio fuerte -1 -0.75 -0.25 0 0.25 0.75 1 indirecta Directa Correlación perfecta correlación perfecta sin relación
Si r = cero significa que no hay asociación o correlación entre las dos variables. • Si 0 < r < 0.25 = débil correlación. • Si 0.25 ≤ r < 0.75 = intermedia correlación. • Si 0.75 ≤ r < 1 = fuerte correlación. • Si r = l = perfecta correlación.
Una muestra de 6 niños fue seleccionada, datos de su edad en años y peso en kilogramos fue registrada como se muestra en la siguiente tabla. Se requiere encontrar la correlación entre edad y peso. Ejemplo:
Las dos variables son de tipo cuantitativo, una variable (edad) es llamada independiente y la otra (peso) es llamada dependiente y con notación de variable Y, para encontrar la relación entre edad y peso, calcule el coeficiente de correlación simple, usando la siguiente fórmula:
r = 0.759 Fuerte correlación directa
Calculando el coeficiente de correlación r = - 0.94 Fuerte correlación indirecta
Coeficiente de correlación de Rankings de Spearman (rs) • No es una prueba no paramétrica de correlación. • Este procedimiento usa los dos rankings que puede asignarse a los valores de la muestra en x y en y. • Coeficiente de correlación de rankings de Spearman puede calcularse en los siguientes casos: • Ambas variables son cuantitativas. • Ambas variables son cualitativas ordinales. • Una variable es cuantitativa y la otra es cualitativa ordinal.
Procedimiento: • Ranquee los valores de X de primero a n donde n es el número de pares de valores de x y y en la muestra. • Ranquee el valor de y de primero a n. • Calcule el valor de di para cada par de observaciones restando el ranking de yi del ranking de xi. • Eleve al cuadrado cada di y ∑di2 lo cual es la suma de valores al cuadrado.
Aplique la siguiente fórmula: • El valor de rs denota la magnitud y naturaleza de la asociación dando la misma interpretación el r simple.
En un estudio de la relación entre el nivel de educación e ingreso, se obtuvieron los siguientes datos. Encuentre la relación entre ellos y comente. Ejemplo
Respuesta: ∑ di2=64
Comentario: Hay una correlación débil indirecta entre el nivel de educación y el ingreso.
Análisis de regresión • Regresión: técnica enfocada a la predicción de algunas variables conociendo a otras. • El proceso de predecir la variable Y usando la variable X.
Regresión • Usa la variable (x) para predecir el valor de la variable resultado (y) • Nos dice cuanto es el valor de cambio de y en función del cambio en los valores de x.
Correlación y regresión • Correlación describe la fuerza de una relación lineal entre dos variables • Lineal significa “línea recta” • Regresión nos dice como trazar la línea recta descrita en la correlación.
Regresión • Calcule la línea que de “el mejor trazo” para un grupo de datos La línea de regresión hace la suma de cuadrados de los residuales, menores a cualquier otra línea Regresión minimiza los residuales TAS(mmHg) Peso Kg
Usando el método de los cuadrados mínimos (un procedimiento que minimiza las desviaciones verticales de puntos trazados alrededor de la línea recta) somos capaces de construir el mejor trazado de la línea recta en la gráfica de puntos dispersos y luego formular la ecuación de regresión en la forma de: b
Ecuación de regresión TAS (mmHg) • La ecuación de regresión describe la línea de regresión matemáticamente • Intersección • Pendiente Peso (Kg)
Ecuación lineal Cambio en Y b= pendiente Cambio en X a = intersección
Regresión de calificaciones sobre horas de estudio Regresión lineal Calificación final en el curso= 59.95 + 3.17 * horas de estudio R2=0.88 Calificación final en el curso Número de horas empleadas en estudio Calificación final predicha en clase = 59.95 + 3.17*(número de horas de estudio por semana)
Calificación final en clases predicha= 59.95 + 3.17*(horas de estudio) Prediga la calificación final de … • Alguien quien estudia 12 horas • Calificación final = 59.95 + (3.17*12) • Calificación final = 97.99 • Alguine quien estudia 1 hora: • Calificación final = 59.95 + (3.17*1) • Calificación final = 63.12
Una muestra de 6 personas fue seleccionada el valor de su edad (variable x) y su peso, mostrados en la siguiente tabla. Encuentre la ecuación de regresión y que se predice del peso cuando la edad es 8.5 años. Ejercicio
Peso (en Kg) Edad (en años) Creamos una lñínea de regresión trazando dos valores estimados para y contra su componente de x, y luego extendiendo la línea a la derecha y a la izquierda.
Ejercicio 2 Los siguientes son las edades en años y la presión arterial (PA) de 20 adultos aparentemente sanos.
Encuentre la correlación entre edad y presión arterial usando el coeficiente de correlación de Spearman y comente. • Encuentre la ecuación de regresión • ¿Cual es la presión arterial predecible para un hombre de 25 años?