1 / 62

Clases 1 Conceptos, Estadística Descriptiva, Pruebas de Hipótesis

Clases 1 Conceptos, Estadística Descriptiva, Pruebas de Hipótesis. Curso de Metodología de la Investigación Profesor Manuel Lobos González Año 2011. Tema 1: Conceptos.

Download Presentation

Clases 1 Conceptos, Estadística Descriptiva, Pruebas de Hipótesis

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Clases 1 Conceptos, Estadística Descriptiva, Pruebas de Hipótesis Curso de Metodología de la Investigación Profesor Manuel Lobos González Año 2011

  2. Tema 1: Conceptos

  3. LA BASE Y PUNTO DE PARTIDA DEL CIENTIFICO ES UNA REALIDAD DETERMINADA, QUE MEDIANTE LA INVESTIGACION LE PERMITE LLEGAR A LA CIENCIA CIENCIA INVESTIGACION REALIDAD METODO CIENTIFICO

  4. PRINCIPIO DE LA INVESTIGACIÓN VER EN LA REALIDAD LO QUE OTROS NO HAN VISTO

  5. CUERPO DE CONOCIMIENTOS REALIDAD EL PROCESO DE INVESTIGACIÓN (Erika Himmel)

  6. FASEV FASEI CUERPO DE CONOCIMIENTOS TEORÍAS MODELOS EVALUA- COMUNICACIÓN PROBLEMA HIPÓTESIS INFERENCIA CIÓN ANÁLISIS DE DATOS DISEÑO REALIDAD HECHOS FENÓMENOS DATOS EXPERIENCIA FASE III FASE IV FASEII

  7. Método científico y estadística

  8. Definición de Estadística Es un conjunto de teorías y métodos que han sido desarrollados para tratar la recopilación, organización, presentación, análisis, interpretación y descripciones de datos muestrales con el fin de extraer conclusiones útiles de ellos.

  9. Tema 2: Estadígrafos Básicos Adaptado de Curso de Bioestadística Universidad de Málaga

  10. Un brevísimo resumen sobre estadísticos • Centralización o Tendencia central o promedios • Indican valores con respecto a los que los datos parecen agruparse. • Media, mediana y moda • Posición • Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. • Cuantiles, percentiles, cuartiles, deciles, quintiles... • Forma • Asimetría • Apuntamiento o curtosis • Dispersión o Variabilidad • Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. • Desviación típica, coeficiente de variación, rango, varianza

  11. La media como punto de equilibrio

  12. La media aritmética [=promedio(rango)] La media aritmética de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante las expresiones, según el caso: Para TDNA TF TI xirepresenta el valor de la variable; ci representa la marca de clase.

  13. La mediana [=mediana(rango)] La mediana de un conjunto de números ordenados en magnitud es o el valor central o la media de los dos valores centrales.

  14. La moda [=moda(rango)] La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo. Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. En cuyo caso tendremos una distribución bimodal o polimodal según el caso.

  15. La moda

  16. Se define el cuantilde orden a como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada a. Casos particulares son los percentiles, cuartiles, deciles, quintiles,... Estadígrafos de Posición

  17. Cuantil de orden α [=percentil(rango;k)] Los cuantiles son generalizaciones de la mediana. Los cuartiles dividen a los datos en cuatro partes iguales, los deciles en diez, los quintiles en cinco, los percentiles en cien.

  18. Cuartiles (Q): Dividen a la muestra en 4 grupos con frecuencias similares. Primer cuartil = Percentil 25 = Cuantil 0,25 Segundo cuartil = Percentil 50 = Cuantil 0,50 = mediana Tercer cuartil = Percentil 75 = Cuantil 0,75 Quintiles (K): Dividen a la muestra en 5 grupos con frecuencias similares. Primer quintil = Percentil 20 = Cuantil 0,20 Segundo quintil = Percentil 40 = Cuantil 0,40 Tercer quintil = Percentil 60 = Cuantil 0,60 Cuarto quintil = Percentil 80 = Cuantil 0,80 Deciles (D): Dividen a la muestra en 10 grupos con frecuencias similares. Tercer decil = Percentil 30 = Cuantil 0,30 Quinto decil = Percentil 50 = Cuantil 0,50 = mediana Séptimo decil = Percentil 70 = Cuantil 0,70 Percentiles (P) : Dividen a la muestra en 100 grupos con frecuencias similares. La mediana es el percentil 50 El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%

  19. Medidas de variabilidadRango, Rango Intercuartílico, Desviación Media, Varianza, Desviación Estándar y Coeficiente de Variación Algunos datos han sido adaptados de Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas UPR Río Piedras

  20. Estadígrafos deVariabilidad o dispersión • Los estudiantes de Metodología de la Investigación obtienen diferentes calificaciones en la asignatura (variabilidad). ¿A qué puede deberse? • Diferencias individuales en el conocimiento de la materia. • ¿Podría haber otras razones (fuentes de variabilidad)? • Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de conocimiento. ¿Las notas serían las mismas en todos? Seguramente No. • Dormir poco el día de la prueba, el café estaba con somnífero... • Diferencias individuales en la habilidadpara hacer un examen. • El examen no es una medida perfecta del conocimiento. • Variabilidad por error de medida. • En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige la mala • Variabilidad por azar, aleatoriedad.

  21. Medidas de dispersión Miden el grado de dispersión (variabilidad) de losdatos, independientemente de su causa. • Amplitud o Rango[=max(rango)-min(rango)] • La diferencia entre las observaciones extremas. • 2,1,4,3,8,4. El rango es 8-1=7 • Es muy sensible a los valores extremos. • Rango intercuartílico • [=CUARTIL(rango;3)-CUARTIL(rango;1)] • Es la distancia entre el primer y tercer cuartil. • Rango intercuartílico = Q3 – Q1 = P75 - P25 = C0.75 – C0,25 • Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores. • No es tan sensible a valores extremos. 25% 25% 25% 25%

  22. Muestra de edades de cinco niños • En una muestra de cinco niños se observa que éstos tienen las siguientes edades: • 1, 1, 4, 8 y 9 . • En promedio tienen 4.6 años. • ¿Cuánta variabilidad hay en las edades de los niños? • ¿A qué distancia quedan las edades observadas de la media muestral 4.6 años?

  23. -3.6 4.4 -3.6 3.4 -.6 Diferencias de valores observados a la media muestral

  24. 3.6x3.6 4.4x4.4 .6x.6 3.4x3.4 3.6x3.6 Otra medida: Varianza Media Muestral

  25. Varianza[=var(rango)] • -3.6 + -3.6 + -.6 + 3.4 + 4.4 = 0 • 3.6(3.6) + 3.6(3.6) + .6(.6) + 3.4(3.4) + 4.4(4.4) = 57.2 • área promedio = 57.2 / 4 = 14.3 • En general:

  26. Grados de libertad • ¿Por qué calculamos la varianza dividiendo por n - 1, en lugar de dividir por n? • Como la suma de las desviaciones es 0, la última desviación es una combinación lineal de las n - 1 desviaciones restantes. • Por lo tanto, no estamos calculando el promedio de n números independientes (los desvíos). Solo n -1 de las desviaciones al cuadrado pueden variar libremente y por ello, promediamos la suma de los desvíos al cuadrado dividiendo por n -1. • Al numero n -1 se lo denomina grados de libertad de la varianza o de la desviación típica.

  27. Desviación estándar[=desvest(rango)] Así s = 3.78

  28. Desviación estándar S2=14.3 años2 S S=3.78 años

  29. Tema 3: Introducción a Pruebas de Hipótesis

  30. Contrastes Paramétricos • Las pruebas de hipótesis hacen inferencias respecto a los parámetros de la población, como la media. • Las pruebas paramétricas utilizan la estadística paramétrica de muestras que provinieron de la población que se está probando. • Para formular estas pruebas, se hacen suposiciones restrictivas sobre las poblaciones de las que se extraen las muestras, por ejemplo, que las muestras son grandes o que provienen de poblaciones normalmente distribuidas. Pero las poblaciones no siempre son normales.

  31. Contrastes No Paramétricos • Pero las poblaciones no siempre son normales. • Se han desarrollado técnicas útiles que no hacen suposiciones restrictivas respecto a la forma de las distribuciones de las poblaciones. Éstas se conocen como pruebas sin distribución, o pruebas no paramétricas.

  32. Elementos que conforman un Contraste Hipótesis • DESDE LA HIPÓTESIS DE TRABAJO • RELACIÓN MATEMÁTICA • SE RELACIONA CON HIPÓTESIS ESTADÍSTICA _______________ • SE ESPERA ENTONCES _____________ LA HIPÓTESIS NULA • LA REGIÓN DE RECHAZO ES______________ (VER HIPÓTESIS ALTERNA) • LA PROBABILIDAD ESPERADA ES ENTONCES (VER 3) • DECISIÓN SOBRE LA HIPÓTESIS NULA A PARTIR DE EVIDENCIA (SE ACEPTA O RECHAZA) • DECISIÓN SOBRE HIPÓTESIS DE TRABAJO (SI 3=6 SE SUSTENTA….. O NO SE SUSTENTA)

  33. Se definen: medida de discrepancia con una distribución de probabilidad conocida  Regla de decisión(nivel de significación a)  Valor crítico o tabulado HIPÓTESIS DE TRABAJO HIPÓTESIS ESTADÍSTICAS datos de la muestra Se calcula una medidade discrepanciaValor calculado Se comparan los valores calculado con tabulado ¿se rechaza Ho? H1 SI NO Se extraen conclusiones

  34. 1 2 se Hipótesis se estima Hipótesis de El o los formulan estadísticas parámetros trabajo se infiere 3 8 se selecciona Un modelo 7 matemático estadístico se decide 4 se determina 6 5 se se La magnitud Reglas decisionales de los errores calcula formulan Prueba de significación DIAGRAMA DE LAS ETAPAS EN LA CONTRASTACION DE LA HIPOTESIS ESTADISTICA Y SU RELACION CON LAS HIPOTESIS DE TRABAJO. (Erika Himmel)

  35. Hipótesis nula Ho La que contrastamos Los datos pueden refutarla No debería ser rechazada sin una buena razón. Hipótesis Alternativa H1 Niega a H0 Los datos pueden mostrar evidencia a favor No debería ser aceptada sin una gran evidencia a favor. Identificación de hipótesis

  36. Región crítica Valores ‘improbables’ si... Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0 Nivel de significación: a Número pequeño: 1% , 5% Fijado de antemano por el investigador Es la probabilidad de rechazar H0 cuando es cierta Reg. Crit. Reg. Crit. No rechazo H0 a/2=2.5% a/2=2.5% Región crítica y nivel de significación a=5%

  37. Contrastes: unilateral y bilateral La posición de la región crítica depende de la hipótesis alternativa Bilateral Unilateral Unilateral

  38. tc: 2.086 tc: 2.086 tc: 1.725 tc: 1.725 Contrastes: unilateral y bilateral Un ejemplo para la prueba t para una a:0.05 y gl:20 Bilateral Unilateral Unilateral

  39. Ladistribución normal

  40. La distribución de probabilidad normal y la curva normal que la acompaña tienen las siguientes características: • La curva normal tiene forma de campana y una sola cima en el centro de la distribución. • La media aritmética, la mediana y la moda de la distribución son iguales y se ubican en el centro. • La mitad del área bajo la curva se encuentra a la derecha de este punto central y la otra mitad está a la izquierda de dicho punto. • Es simétrica en torno a su promedio. Si se corta Ia curva normal de manera vertical por el valor central, las dos mitades serán como imágenes en un espejo. • La curva normal desciende suavemente en ambas direcciones a partir del valor central. • Es asintótica, Ia curva se acerca cada vez más al eje de X pero jamás llega a tocarlo. Es decir, las “colas” de Ia curva se extienden de manera indefinida en ambas direcciones.

  41. La distribución normal se usa en:  Psicología  Biología  Educación  Astronomía  Economía  Ciencias sociales y administrativas

  42. PUNTUACIONES ESTÁNDAR Un esfuerzo para interpretar y comparar el desempeño de un individuo en dos o más variables es difícil cuando las distribuciones de los datos tienen medias y desviaciones estándar diferentes. Este problema se puede evitar transformando los datos de modo que todas las variables tengan medias idénticas y las mismas desviaciones estándar, es decir, "estandarizando" los parámetros de las distribuciones (transformando valores brutos en valores estándar).

  43. PUNTUACIONES ESTÁNDAR Las distribuciones de puntuaciones estándar tienen valores para la media y la desviación estándar que son fijos, conocidos y nunca varían. Como los parámetros son siempre los mismos, las interpretaciones y comparaciones entre puntuaciones estándar se hacen más fácilmente.

  44. PUNTUACIONES ESTÁNDAR: PUNTAJE Z La puntuación estándar más elemental y útil es la z. Cuando las observaciones se expresan en unidades de desviaciones estándar de la media son calificaciones z. La distribución de calificaciones z tiene parámetros fijos: m = 0 y s = 1. Se define una variable

  45. PUNTUACIONES ESTÁNDAR: PUNTAJE Z Si Diego obtiene una nota de 6,2 significa poco, a menos que conozca la media del grupo y la desviación estándar. Una calificación z, sin embargo, puede interpretarse fácilmente en relación con toda la distribución, ya que sus parámetros siempre se conocen y nunca varían. Si sabemos que la calificación z de Diego es 1.5, sabemos que calificó 1.5 desviaciones estándar arriba de la media, y que, en consecuencia, su calificación es completamente alta en relación con los otros de la distribución.

  46. EJEMPLO DE COMPARACIÓN PUNTAJE Z Paula obtiene las siguientes notas en las distintas asignaturas: MATEMATICA : 5.8 LENGUAJE : 6.1 CIENCIAS : 5.6 En términos absolutos, Paula obtiene mejor nota en Lenguaje, luego en Matemática y finalmente en Ciencias.

  47. Ciencias 5.6 Matemática 5.8 Lenguaje 6.1

  48. EJEMPLO DE COMPARACIÓN PUNTAJE Z ¿Qué sucede si además de conocer la nota, sabemos cómo se comportó todo el curso de Paula en esas asignaturas? MATEMATICA : 5.8 y el curso tuvo una media de 5.7 y una desviación estándar de 0.5 LENGUAJE : 6.1 y el curso tuvo una media de 6.2 y una desviación estándar de 0.7 CIENCIAS : 5.6 y el curso tuvo una media de 5.0 y una desviación estándar de 1.1

  49. EJEMPLO DE COMPARACIÓN PUNTAJE Z Ahora podemos comparar las notas en términos de puntuaciones estándar Z, asumiendo que las medias = 0 y las desviaciones estándar = 1, utilizando la fórmula: MATEMÁTICA : x= 5.8 ; media= 5.7 y ds= 0.5 Puntaje Z5.8= 0.2 LENGUAJE : x= 6.1 ; media= 6.2 y ds= 0.7 Puntaje Z6.1= -0.14 CIENCIAS : x= 5.6 ; media= 5.0 y ds= 1.1 Puntaje Z5.6= 0.54

More Related