La recta de regresi n
This presentation is the property of its rightful owner.
Sponsored Links
1 / 17

LA RECTA DE REGRESIÓN PowerPoint PPT Presentation


  • 61 Views
  • Uploaded on
  • Presentation posted in: General

LA RECTA DE REGRESIÓN. CONTENIDOS: Dependencia funcional y dependencia estadística Concepto de regresión ¿Es buena la aproximación? Error cuadrático medio, varianza residual coeficiente de determinación lineal. Independencia - Dependencia.

Download Presentation

LA RECTA DE REGRESIÓN

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


La recta de regresi n

LA RECTA DE REGRESIÓN

  • CONTENIDOS:

  • Dependencia funcional y dependencia estadística

  • Concepto de regresión

  • ¿Es buena la aproximación?

    • Error cuadrático medio, varianza residual

    • coeficiente de determinación lineal


Independencia dependencia

Independencia - Dependencia

Al estudiar dos características simultáneamente de una muestra:

  • ¿están relacionadas? ¿interdependencia? ¿cómo lo hacen?

  • altura vs peso. horas de estudio vs calificación en un examen.

    El objetivo principal es determinar el modo en que se relacionan.

    Dos variables pueden considerarse:

  • Independientes  ninguna explica el comportamiento de la otra

  • Dependencia funcional (exacta)  Y=f(x)

  • Dependencia estadística  está entre las dos anteriores

  • Dependencia estadística

    Dependencia funcional

    Independencia estadística

    -

    +

    Grado de asociación entre dos variables


    Estudio conjunto de dos variables

    Estudio conjunto de dos variables

    • A la derecha tenemos los datos obtenido observando dos variables estadísticas en varios individuos de una muestra.

      • En cada fila tenemos los datos de un individuo

      • Cada columna contiene los valores que toma una variable sobre los individuos.

      • Las individuos no se muestran en ningún orden particular.

    • Podemos representar las observaciones en un diagrama de dispersión (‘scatterplot’). En él, cada individuo es un punto cuyas coordenadas son los valores de las variables.

    • En primera instancia, pretendemos reconocer a partir del diagrama si hay relación entre las variables, de qué tipo y, si es posible predecir el valor de una de ellas en función de la otra.


    Diagramas de dispersi n o nube de puntos

    Diagramas de dispersión o nube de puntos

    Altura y peso de 30 individuos.

    Pesa 76 kg.

    Pesa 50 kg.

    Mide 187 cm.

    Mide 161 cm.


    Relaci n entre variables

    Relación entre variables.

    Altura y peso

    de 30 individuos.

    Parece que el peso aumenta con la altura


    Relaci n entre variables1

    Relación entre variables.

    Altura y peso

    de 30 individuos.

    Parece que el peso aumenta con la altura


    Relaci n entre variables2

    Relación entre variables.

    • ¿Qué recta explica mejor la relación peso-altura?

    • mejor...¿en qué sentido?

    Altura y peso

    de 30 individuos.

    Parece que el peso aumenta con la altura


    La recta de regresi n

    RECTA DE REGRESIÓN

    Pendiente

    yi

    Ordenada

    en el origen

    Error: residuo


    La recta de regresi n

    RECTA DE REGRESIÓN

    Llamemos a “u” residuo, perturbación o error: es la diferencia que hay entre el valor observado de la variable “y” y el valor que tendría (valor estimado) si la relación fuera lineal, es decir, través de la recta de regresión

    IDEA: hacer MÍNIMA la suma de los CUADRADOS de los residuos.


    La recta de regresi n

    EQUIVALE a buscar los coeficientes de la recta hace MÍNIMA la suma de los CUADRADOS de los residuos.

    La recta de regresión de y sobre x es

    Es decir, los valores de los coeficientes son

    Covarianza


    La recta de regresi n

    ¿Es la recta de regresión una buena aproximación de la nube de puntos?

    Coeficiente de determinación:

    Diferencia entre el valor estimado y la media observada

    Diferencia entre lo observado y la media observada

    Varianza residual ó error cuadrático medio: Ayuda a medir la dependencia.

    VR =

    Coeficiente de correlación lineal de Pearson r:


    Covarianza de dos variables x e y

    Covarianza de dos variables X e Y

    • La pendiente de la recta de regresión es Sxy/ S2X

    • El signo de la covarianza indica si la posible relación entre dos variables es directa o inversa.

      • Directa: Sxy >0

      • Inversa: Sxy <0

      • Incorreladas: Sxy =0

    • La covarianza no dice nada sobre el grado de relación entre las variables.


    Coef de correlaci n lineal de pearson

    Coef. de correlación lineal de Pearson

    • La coeficiente de correlación lineal de Pearson de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales).

    • tiene el mismo signo que Sxy por tanto de su signo obtenemos el que la posible relación sea directa o inversa.

    • r es útil para determinar si hay relación lineal entre dos variables


    Propiedades de r

    Propiedades de r

    • Es adimensional

    • Sólo toma valores en [-1,1]

    • Las variables son incorreladas  r=0

    • Relación lineal perfecta entre dos variables  r=+1 o r=-1

      • Excluimos los casos de puntos alineados horiz. o verticalmente.

    • Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal.

      • Siempre que no existan observaciones anómalas.

    Relación inversa perfecta

    Relación directa casi perfecta

    Variables incorreladas

    -1

    +1

    0


    Coeficiente de determinaci n

    Coeficiente de determinación

    • No mide la validez del modelo de regresión propuesto.

    • Sí mide cuanto de la variabilidad se explica por la ecuación de regresión estimada.


    La recta de regresi n

    Hemos usado materiales de:

    • Julián de la Horra Navarro.

      Estadística aplicada, 3ª edición. Díaz de Santos.

    • G.C. Canavós.

      Estadística y probabilidad. Métodos y aplicaciones. McGrawHill

    • Francisco Javier Barón

      http://www.bioestadistica.uma.es/baron/apuntes

    • Sara Mateo

      http://www.dea.uib.es/webpersonal/williamnilsson/archivos/Capitulo7.ppt


    La recta de regresi n

    ¿DE DÓNDE SALEN LOS COEFICIENTES DE LA RECTA DE REGRESIÓN?

    ¿Qué “a” y “b” minimizan la suma de los cuadrados de los errores cometidos?

    MINIMIZAR

    El valor que hemos aproximado para “y” con la recta de regresión 

    Errores cometidos al aproximar por una recta


  • Login