1 / 50

TEMA 1 Estadística Descriptiva

TEMA 1 Estadística Descriptiva. Introducción Comparativos gráficos Medidas de tendencia central Medidas de dispersión. ¿Haz escuchado el término de estadística?. A diario recibimos muchos datos ó información … en conversaciones, libros y televisión, acerca de estadísticas.

amie
Download Presentation

TEMA 1 Estadística Descriptiva

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. TEMA 1Estadística Descriptiva Introducción Comparativos gráficos Medidas de tendencia central Medidas de dispersión

  2. ¿Haz escuchado el término de estadística? • A diario recibimos muchos datos ó información… en conversaciones, libros y televisión, acerca de estadísticas. • Casi cualquier estudio científico usa la estadística como herramienta para reportar resultados.

  3. Importancia de la Estadística La estadísticaesunaherramientamuyútilquenosayuda a tomardecisiones en un ambiente de incertidumbre, esdecir, dóndeestapresente la variabilidad. Ejemplos: En Planeación de la producción, saber cuántovoy a comprar de materiales de acuerdo a lo que se esperaseanlasventas (pronósticoestadístico). En la naturaleza hay variabilidad. Un animador digital es capaz de “imitar” la variabilidad de la naturaleza en sus diseños.

  4. Población Muestra Población y Muestra

  5. ¿Qué tienen en común estos objetivos? El valor de la característica de interés cambia de individuo a individuo (la inflación, el número de glóbulos rojos, la puntuación en matemáticas, la evaluación a los profesores de cursos en el área de las matemáticas, el clima organizacional, el nivel de desempeño laboral). A estas características les llamaremos variables. Se representan con letras mayúsculas, y los valores que toma con letras minúsculas X = Número de estudiantes que llegan tarde x=0, 1, 2,…, 15 El individuo puede ser una persona, un país, un producto de la línea de producción, etc. Dato: Es el valor de la variable observado en un individuo Ejemplo de variable: temperatura en Monterrey en un día de Enero 0°C, 17°C representan dos datos diferentes. 5

  6. Ramas de la Estadística Estadística descriptiva Estadística inferencial (se apoya en la probabilidad) La estadística es la rama de la investigación científica que proporciona métodos para organizar y resumir información y usar ésta para obtener diversas conclusiones

  7. Estadística Descriptiva EstadísticaDescriptiva Distribuciones de frecuencias (tabulación de datos) Representacionesgráficas Medidasdescriptivas Tendencia central Histograma Dispersión Diagrama de pastel Diagrama de barras

  8. ¿Cuál es la finalidad de un gráfico? Por medio de un gráfico se puede visualizar el comportamiento de un conjunto de datos. Un gráfico habla más que mil palabras. Dependiendo si la variable es cualitativa ó cuantitativa, se selecciona el tipo de gráfico.

  9. Resúmenes gráficosReflexión Observa la escala en cada gráfica.

  10. ¿Qué información brinda una tabla de frecuencias? ¿Para qué tipos de variables, cualitativas ó cuantitativas, se puede usar una tabla de frecuencias? ¿Qué es frecuencia absoluta?, ¿Qué es frecuencia relativa? ¿Qué es frecuencia Acumulada? Para la siguiente tabla, distingue qué tipo de variable es el nivel educativo. ¿Qué proporción de individuos tiene al menos estudios de preparatoria?

  11. Histograma El objetivo de un histogramaesresumir la información de una variable cuantitativa. Pasos: Se secciona la información en clases ó intervalos Se cuenta el número de datos en cadaclase. Esta se llama frecuencia Se puedecalcular la frecuenciarelativa Se grafica un histograma, teniendocomoeje “x” lasclases, comoeje “y” lasfrecuencias ó frecuenciasrelativas. En cadaclase se dibuja un rectánguloquetienecomoalturasufrecuencia ó frecuenciarelativa. Sesgo a la derecha 11

  12. ¿Cómoconstruir un histograma? Ordenar los datos Obtener el Rango: Max-Min Definer el número de clases. Definir la amplitud de clase Generar la tabla de Frecuencia Dibujar el histograma 12

  13. Distribución de Frecuencias • Paso 1. Determine la cantidad de datos (n) n=20

  14. Distribución de Frecuencias • Paso 2. Ordene los datos de menor a mayor

  15. Distribución de Frecuencias • Paso 3. Identifique el Valor Mayor (VM) y el Valor menor (Vm) VM =18.5 Vm = 6.2

  16. Distribución de Frecuencias • Representación Gráfica • Se establecen los límites entre los que se encuentran todos los datos de la muestra. 6.2 VM= 18.5 Vm=

  17. Distribución de Frecuencias • Paso 4. Obtenga el Rango (R) R = VM - Vm R = 18.5 - 6.2 R = 12.3

  18. Distribución de Frecuencias • Representación Gráfica • Se obtiene la distancia que hay entre el límite inferior y el límite superior. 6.2 VM= 18.5 Vm= R= VM – Vm R= 18.5 - 6.2 R= 12.3

  19. Distribución de Frecuencias • Paso 5. Obtenga el número aproximado de intervalos (k) k = sqrt(n) Tenemos que n=20 por lo tanto k = sqrt(20) k = 4.47 Redondeando k ≈5

  20. Distribución de Frecuencias • Representación Gráfica • Se divide la sección que tenemos entre el número de grupos (clases) que se obtuvo con la fórmula (5 grupos) 1 2 3 4 5 6.2 18.5 R = 12.3

  21. Distribución de Frecuencias • Paso 5. Obtenga la longitud de cada intervalo (W) Dado que R = 12.3 y k ≈5

  22. Distribución de Frecuencias • Representación Gráfica • Se calcula el ancho que debe tener cada grupo (clase). 2.46 2.46 2.46 2.46 2.46 1 2 3 4 5 6.2 18.5 R=12.3

  23. Distribución de Frecuencias • Paso 6. Construya los 5 intervalos con una longitud de 2.46. • Corchetes [ ]: Se incluye el valor en el Intervalo • Paréntesis (): No se Incluye el valor en el Intervalo

  24. Distribución de Frecuencias • Representación Gráfica • Se establecen los valores que separan • un grupo (clase) de otro. 2.46 2.46 2.46 2.46 2.46 8.66 11.12 13.58 16.04 6.2 18.5 R=12.3

  25. Distribución de Frecuencias • Paso 7. Identifique y cuente los datos que caen dentro de cada Intervalo. fi: Frecuencia Absoluta

  26. Distribución de Frecuencias • De esta manera se obtiene la distribución de Frecuencia Absolutas fi: Frecuencia Absoluta

  27. Distribución de Frecuencias • Representación Gráfica • A esta gráfica se le conoce como histograma de frecuencias absolutas. 7 6 5 Frecuencia 4 3 2 1 6.2 8.66 11.12 13.58 16.04 18.5 Niveles de Hemoglobina en la Sangre (gr/cm3)

  28. Distribución de Frecuencias • Para obtener las frecuencia relativas (hi) divida cada frecuencia absoluta entre el Total fi: Frecuencia Absoluta

  29. Distribución de Frecuencias • Representación Gráfica • Cuando se grafican las frecuencias relativas se conoce como histograma de frecuencias relativas y se representan en porcentajes. 35 30 25 Frecuencia Relativa (%) 20 15 10 5 6.2 8.66 11.12 13.58 16.04 18.5 Niveles de Hemoglobina en la Sangre (gr/cm3)

  30. Distribución de Frecuencias • La frecuencia absoluta acumulada (fai) y la frecuencia relativa acumulada (hai) es la suma de las frecuencias anteriores

  31. Distribución de Frecuencias • Representación Gráfica 20 Cuando se grafican las frecuencias absolutas acumuladas se conoce como histograma de frecuencias absolutas acumuladas 19 18 17 16 15 14 13 12 11 Frecuencia Absoluta Acumulada 10 9 8 7 6 5 4 3 2 1 8.66 11.12 13.58 16.04 18.5 6.2 Niveles de Hemoglobina en la Sangre (gr/cm3)

  32. Completa los espacios en blanco en la siguiente tabla de frecuencias. La variable de estudios son los años de escolaridad de los adultos de cierta colonia.

  33. Solución:

  34. Media aritmética Moda Mediana Medidas de centralización Asociadas a ideas como: valor esperado, representante de los datos, punto de equilibrio. También llamadas medidas de localización.

  35. Media aritmética Se representa por x y se calcula sumando todos los datos y dividiéndolos entre el total de ellos. Ejemplo, 2,2, 3, 3, 4, 5, 5, 7 su media es 31/8 = 3.875 El Vaticano tiene un promedio de dos Papas por kilómetro cuadrado.

  36. Mediana Valor de los datos que ocupa la posición central cuando los datos se ordenan según su tamaño. Ejemplos, 2,2, 3, 3, 4, 5, 5, 7 su mediana es 3 ó 4, o bien 3.5 si tiene sentido, según el tipo de datos. A, A, A, A, B, B, B, C, C, C, C, D, D, D, F Su mediana es C 7 datos 7 datos Mediana

  37. Mediana Muestral: se obtiene al ordenar primeramente las n observaciones de menor a mayor, (incluyendo valores repetidos). Entonces: • Si n es impar = (n + 1)/2 valor ordenado • Si n es par = promedio de (n/2)ésimo y (n/2 + 1)ésimo valores ordenados • Ejemplo salarios en dolares • 30.70 34.1 33.8 32.50 32.90 34.5 36.0 • Moda: Es el valor que más serepite en conjunto de datos

  38. Moda Ejemplo, 2, 2, 2, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 7 en este caso es bimodal (hay dos modas) y son 3 y 5. A, A, A, A, A, B, B, B, C, C, C, C, D, D, D, F La moda es A

  39. ¿Qué es una distribución simétrica? Una distribución simétrica es la que se puede dividir en dos partes iguales. En estas distribuciones el valor de la media, mediana y moda son iguales.

  40. Distribución Normal • Características: • Simetría alrededor de  • Forma de campana • La mayoría de los datos se encuentran a una distancia de tres desviaciones estándar de la media.

  41. ¿Cómo es una distribución sesgada hacia la derecha ó con sesgo positivo? En este caso, la media es mayor que la mediana. La mediana divide a un conjunto de datos en dos. Pero en este caso, el 50% de los datos menores a la mediana están más concentrados y el 50% de los datos mayor a ella, están más alejados entre sí.

  42. ¿Cómo es una distribución sesgada hacia la izquierda ó con sesgo negativo? En este caso, la media es menor que la mediana. La mediana divide a un conjunto de datos en dos. Pero en este caso, el 50% de los datos menores a la mediana están más alejados entre sí y el 50% de los datos mayor a ella, están más concentrados.

  43. Rango Varianza Desviación estándar Medidas de dispersión Asociadas a ideas como: variación, dispersión entre los datos, distancia de los datos respecto a una medida de centralización, …

  44. 0 1 2 3 4 5 6 7 8 9 10 11 Medidas de Dispersión También se conocen como medidas de variabilidad. Las medidas de tendencia central pueden no ser suficientes para describir totalmente un conjunto de datos. Estas 3 muestras son idénticas en su media y su mediana, 1: • ¿Cuál es la diferencia? • ¿Qué se puede hacer para describir mejor cada muestra? 2: 3:

  45. Rango Es la diferencia entre el mayor y el menor de los datos. Rango R = Max – Min Ejemplo De los datos 2, 2, 2, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 7 El rango es R=7 – 2 = 5

  46. = varianza x = dato = media aritmética de la población n = tamaño de la población s2 = varianza x = dato = media aritmética de la muestra n = tamaño de la muestra Varianza muestra Población

  47. = desv. estándar x = dato = media aritmética de la población n = tamaño de la población s = desv. Estándar x = dato = media aritmética de la muestra n = tamaño de la muestra Desviación estándar muestra Población

  48. Ejercicio: 1. Determina el rango, la varianza y la desviación estándar para los siguientes datos: 2 4 3 5 2 2 0 1 R = Rango 5; Varianza 2.5536 y Desviación Estándar 1.5980 2. Determina el rango, la varianza y la desviación estándar para los siguientes datos: -2 -4 -3 -5 -2 -2 0 -1 R = Rango 5; Varianza 2.5536 y Desviación Estándar 1.5980 3. Determina el rango, la varianza y la desviación estándar para los siguientes datos: 6 12 9 15 6 6 0 3 R = Rango 15; Varianza 22.9821 y Desviación Estándar 4.7940

  49. Indica si las siguientes expresiones son siempre verdaderas (V) o no necesariamente verdaderas (F): La mitad de los datos están por debajo de la media. Cuando hay dos valores que se repiten más que los demás se dice que la moda no existe. La mediana es el dato que se presenta en un 50% de las veces. Al comparar dos grupos de datos del mismo tipo de medición, el grupo que tiene menor varianza es el que tiene una mayor concentración de datos cerca de su media. En un tabla de frecuencias, la suma de las frecuencias relativas es 1.0. La media y la mediana son medidas de tendencia central e indican la ubicación (locación) central de los datos.

  50. Indica si las siguientes expresiones son siempre verdaderas (V) o no necesariamente verdaderas (F): Si la media aritmética de un grupo de n datos es positiva, entonces los n datos son no-negativos. La varianza de cualquier base de datos debe ser no negativa. La desviación estándar entre los datos: 8, 8, 8, 8, 8, 8, 8, es mayor a cero. (Sin realizar cálculos). El rango no puede tomar valores negativos.

More Related