Prueba de Hipótesis - PowerPoint PPT Presentation

prueba de hip tesis n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Prueba de Hipótesis PowerPoint Presentation
Download Presentation
Prueba de Hipótesis

play fullscreen
1 / 75
Prueba de Hipótesis
941 Views
Download Presentation
mercer
Download Presentation

Prueba de Hipótesis

- - - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

  1. Prueba de Hipótesis Tema 3

  2. Prueba de Hipótesis • Hipótesis estadística: afirmación acerca de una característica desconocida de una población Basado en la información que proporciona la muestra

  3. Prueba de Hipótesis • Una compañía que tiene actualmente el 10% del mercado lanza una campaña de mercadeo. Al final de la campaña, realiza una encuesta para evaluar si su participación en el mercado se ha incrementado. • Una máquina de embotellado está fijada para llenar automáticamente cada botella con 355 ml. de refresco. Para revisar si la máquina necesita ser reajustada, un inspector de control de calidad examina una muestra aleatoria de botellas recién llenadas. Definición del Parámetro Establecimiento de hipótesis

  4. Prueba de Hipótesis Para poder concluir si nuestra afirmación es cierta o no, debemos realizar una prueba de hipótesis y así decidir, a partir de una muestra aleatoria, si existe suficiente evidencia experimental que apoye la hipótesis.

  5. Componentes de una prueba de hipótesis • Parámetro de interés • Hipótesis nula y la alternativa • Errores tipo I y tipo II • Nivel de significancia de la prueba • Región de rechazo • Estadístico de prueba - Valor P • Conclusión

  6. Identificación del parámetro de interés Los tests de hipótesis pueden hacerse sobre parámetros de la distribución normal (media, varianza) y también proporciones. Campaña de mercadeo La proporción de clientes que comprarían el producto de la compañía luego que finalice la campaña Embotelladora El volumen promedio (en ml.) por botella.

  7. Establecimiento de la hipótesis nula y la alternativa Ho : La hipótesis que no deseamos abandonar salvo que exista suficiente evidencia en su contra Ha : También es llamada hipótesis de estudio. Es normalmente la hipótesis que se desea probar con base en la información contenida en la muestra. Campaña de mercadeo Embotelladora Ho: p= 0.1 Ha: p> 0.1 Ho: μ=355 Ha: μ≠355 Test Bilateral (de dos colas) Test Unilateral (de una cola)

  8. ¿Cómo decidir? • Se le pregunta a N personas sobre el producto o se llenan N botellas • Se compara la proporción o la media de las botellas con el límite L preestablecido. Región de aceptación Región de rechazo L parámetro

  9. Error tipo I y tipo II Error Tipo I El rechazo de la hipótesis nula Ho cuando ésta es verdadera Error Tipo II La aceptación de la hipótesis nula cuando ésta es falsa

  10. Error tipo I y tipo II Se rechaza H0 siendo verdadera H0 Se acepta H0, cuando es verdadera Ha

  11. Embotelladora Campaña de mercadeo Ho: p= 0.1 Ha: p> 0.1 Ho: μ=355 Ha: μ≠355

  12. Error de Primer Tipo • Es el más importante de los errores involucrados • Es el error que no se desea cometer y se controla asignándole una probabilidad baja, α • No es una decisión estadística • Ho es rechazada si y solo si el riesgo de cometer un error de tipo I no es más que α Nivel de significación = error de tipo I = α

  13. ¿Cómo decidir?

  14. ¿Culpable o Inocente?

  15. Error tipo I y tipo II

  16. ¿Culpable o inocente?

  17. Nivel de significancia Ho: μ=355 Ha: μ≠355 Embotelladora Supongamos el nivel de significancia es de un 5% ¿Qué significa esto? Que no estamos dispuestos a tomar un riesgo mayor al 5% de concluir que la máquina no está operando correctamente (rechazar Ho) cuando en realidad sí lo está haciendo (Ho es cierta).

  18. Errores sobre las distribuciones Ho → μ = μo m a L μo m Ha→ μ = μa > μo β potencia L μa

  19. La compañía JABOLUX está desarrollando un nuevo champú, y está interesada en la altura de la espuma (en mm). La altura de la espuma tiene una distribución aproximadamente normal, con una desviación estándar de 20 mm. La compañía desea probar Ho: µ = 175 mm contra H1: µ > 175 mm, utilizando los resultados obtenidos con 10 muestras. a.- Encuentre α la probabilidad del error tipo I si la región crítica es m > 185 (m ≡ media muestral)

  20. α=0.057

  21. β = 0.0294 b- ¿Cuál es la probabilidad de error tipo II si la verdadera altura promedio de la espuma es 197 mm?

  22. ¿Ud cree que β aumentará o disminuirá? ¿Qué ocurre con β a medida que el verdadero valor de la media se acerca a μ0? c- ¿Cuál es la probabilidad de error tipo II si la verdadera altura promedio de la espuma es 190 mm? β = 0.215

  23. d- ¿Cuál es la probabilidad de error tipo II si la verdadera altura promedio de la espuma es 180 mm? β = 0.785

  24. Con n=10 Con n=20 α = 0.0127 e- encuentre ahora la probabilidad de error tipo I si la muestra aumenta a 20.

  25. β = 0.0036 f- ¿Cuál es ahora la probabilidad de error tipo II si la verdadera altura promedio de la espuma es 197 mm?

  26. ¿Cómo se construye la decisión? • Se toma la curva de la media muestral de la hipótesis nula Ho a/2 a/2 m0 L2 L1 Región de rechazo No se rechaza H0 si L1≤ m ≤ L2

  27. ¿Cómo se construye la decisión? Estadístico de prueba (para la media) Test Bilateral a/2 a/2 zα/2 -zα/2 No se rechaza H0 si -zα/2≤ z0 ≤ zα/2 Región de rechazo (región crítica)

  28. a ¿Cómo se construye la decisión? Test Unilateral Cola Inferior. Ej: μ <10 Cola Superior. Ej: μ >10 Se rechaza H0 si z0 ≤ -zα Se rechaza H0 si z0 ≥ zα a -zα zα Región de rechazo (región crítica) Región de rechazo (región crítica)

  29. Ejemplo de Prueba de hipótesis relativa a la media de una población (varianza conocida). • Antes de tomar un curso de lectura rápida, a María le tomaba en promedio 85 segundos leer la página de un libro. Para medir la efectividad del curso, María decide tomarse el tiempo que tarda leyendo. Suponga que tarde 13 minutos y 40 segundos leer 10 páginas de un libro. • Defina el parámetro de interés • Establezca Ho y Ha • En el contexto de este problema, ¿qué significa cometer un error tipo I? ¿y tipo II? • Asumiendo que las 10 páginas son representativas del • material de lectura de María, y la desviación estándar • del tiempo que le toma a María leer una página es 14 • segundos, puede concluir de esto que el curso ha • incrementado su velocidad de lectura? Considere un • 5% de nivel de significancia.

  30. Ejemplo de Prueba de hipótesis relativa a la media de una población (varianza conocida). El departamento de infraestructura de la Gobernación del Estado Zulia piensa reparar 25 kilómetros de la Circunvalación 1, utilizando para ello un material más eficiente que el actual. Una consideración importante es el volumen de carga pesado sobre la autopista. Las estaciones de control de peso del estado informan que el número medio de camiones pesados que viajan por un tramo de 25 kilómetros es de 72 por hora. Sin embargo, como la sección de la autopista por reparar se encuentra cerca de varias fábricas, la división de ingeniería piensa que el volumen de tráfico de carga es mayor que el valor medio informado para toda la autopista. A fin de comprobar la validez de su teoría, el departamento vigila la autopista durante 50 periodos de una hora seleccionados aleatoriamente durante todo el mes. Suponga que la media del tráfico de carga pesado fue de 74.1 y la desviación estándar (real) es 13.3. ¿Apoyan estos datos la teoría del departamento? Utilice α=0.10

  31. Ejemplo de Prueba de hipótesis relativa a la media de una población (varianza conocida). Si el número medio μ de camiones de carga que viajan por el tramo de 25 kilómetros en cuestión es en realidad de 78 por hora, ¿qué probabilidad hay de que el procedimiento de prueba no detecte esto? Es decir ¿qué probabilidad β hay de que no rechacemos H0:μ=72 si en realidad μ es igual a 78?

  32. Ejemplo de Prueba de hipótesis relativa a la media de una población (varianza conocida). El peso medio de una muestra aleatoria de 81 personas de La Concepción es de 63,6 kg. Se sabe que la desviación típica poblacional es de 6 kg. Con un nivel de significación del 0,05% ¿hay suficiente evidencia para rechazar la afirmación de que el peso medio poblacional es de 65 kg?

  33. Valor p • El mínimo nivel de significación para el cual los datos observados indican que se tendría que rechazar la hipótesis nula • Si el valor-p es “suficientemente pequeño” es decir menor que el nivel de significación rechazamos la hipótesis nula • Es el valor que reportan los paquetes estadísticos

  34. Valor p Si rechazamos Ho con una muestra como la obtenida, la probabilidad de cometer un error de tipo I es exactamente igual al valor p. a es el máximo riesgo que estamos dispuestos a tomar de cometer un error tipo I. Si el riesgo actual (valor p) es menor que a, entonces tomamos el riesgo de rechazar Ho.

  35. Valor p También puede verse como el nivel de significación que tendría el test si el límite de decisión coincidiera con el estadístico de decisión (la media muestral, por ejemplo)

  36. Valor p Nos dice cuán factible es observar una muestra como la actual si Ho es cierto. La muestra observada es bastante compatible con Ho. Valor grande de p Es poco probable que la muestra observada venga de una población donde Ho se cumple. Valor pequeño de p

  37. Valor p a m0 m L Región de rechazo Esta media está tan alejada de la m0, que solo el 2% de las veces se produce un desvío tan grande como éste.

  38. Valor p a m m0 L Región de rechazo El 10% de las veces ocurre que la media sea m.

  39. Valor p • Para una prueba de cola superior (donde Ha está expresada usando el signo >), mientras más grande z0, más fuerte es la evidencia contra H0. Valor p = P(Z>z0) • Para una prueba de cola inferior (donde Ha está expresada usando el signo <), mientras más pequeño z0, más fuerte es la evidencia contra H0. Valor p = P(Z<-z0) • Para una prueba de dos colas (donde Ha está expresada usando el signo ≠), mientras más alejado está z0 del 0, más fuerte es la evidencia contra H0. Valor p = 2P(Z>|z0|)

  40. Prueba de hipótesis relativa a la media de una población (varianza conocida). El Ministerio de la Juventud de Argentina maneja el dato de que la edad a la que los hijos se independizan de sus padres es una variable normal con media 29 años y desviación típica 3 años. Aunque la desviación típica no plantea dudas, sí se sospecha que la media ha descendido, sobre todo por la política de ayuda al empleo que ha llevado a cabo el Gobierno. Así, de un estudio reciente sobre 100 jóvenes que se acaban de independizar, se ha obtenido una media de 28,1 años de edad. a.- Con un nivel de significación del 1%, ¿ puede defenderse que la edad media no ha disminuido, frente a que sí lo ha hecho como parecen indicar los datos? Plantea el contraste o test de hipótesis y resuélvelo. b.- ¿Cuál es el valor p de esta prueba? c.- ¿Cuáles serían los resultados si la media muestral hubiese sido 28,5 años?

  41. Prueba de hipótesis relativa a la media de una población (varianza conocida). En un esfuerzo por reducir el congestionamiento de tráfico, las autoridades regionales han promovido campañas en las cuales se anima a las personas a que usen un solo vehiculo en las horas pico (la idea de “car pools”). Para medir la efectividad de la campaña, se midió la velocidad de 40 vehículos, en la av. Libertador durante las horas pico. El promedio fue de 15 km/h con una desviación estándar de 7 km/h. Puede concluirse que la velocidad se ha incrementado luego de las campañas? Hace 10 meses, antes de que se comenzara con estas campañas, la velocidad promedio de los vehículos en la av. Libertador durante las horas pico era de 12 km/h. (Para realizar la prueba utilice a=5%)

  42. Error tipo II y selección del tamaño de la muestra. Curvas características de operación Los sistemas de escape de emergencia para tripulaciones de aeronaves son impulsados por un combustible sólido. Una de las características importantes de este producto es la rapidez de combustión. Las especificaciones requieren que la rapidez promedio de combustión sea 50 cm/s. Se sabe que la desviación estándar de esta rapidez es σ=2 cm/s. El experimentador decide especificar la probabilidad para el error tipo I en 0,05 y toma una muestra de n=25. Supóngase que se está interesado en la probabilidad de error tipo II si la verdadera rapidez promedio de combustión es 51 cm/s.

  43. Curvas características de operación

  44. Curvas características de operación

  45. Error tipo II y selección del tamaño de la muestra. Curvas características de operación Supóngase que se quiere diseñar la prueba de tal manera que, si el verdadero valor de la rapidez promedio de combustión difiere tanto como 1 cm/s del valor de 50 cm/s, la prueba detecte este hecho con una probabilidad de 0.90.

  46. Error tipo II y selección del tamaño de la muestra Test de una cola Test de dos colas

  47. Test sobre la media Desviación estándar desconocida

  48. Prueba de hipótesis relativa a la media de una población (varianza desconocida). Se hizo un estudio de una muestra de 25 expedientes de enfermos crónicos atendidos como pacientes externos. El número medio de consultas por paciente fue de 4.8 y la desviación estándar de la muestra fue de 2. ¿Es posible concluir a partir de estos datos que la media de la población es mayor que cuatro visitas por paciente? Suponga que la probabilidad de cometer un error de tipo I es de 0.05.

  49. Prueba de hipótesis de proporciones

  50. Ejemplo de Prueba de hipótesis de proporciones • Hace dos años, una de cada cinco personas que compraban en AMAZON vía internet eran compradores que utilizaban por primera vez este medio. En un estudio reciente, de 250 ventas, 39 fueron realizadas por personas que por primera vez compraban vía internet. ¿Es diferente el porcentaje de personas que compran por primera vez vía internet, al porcentaje que representaban hace dos años? Realice una prueba de hipótesis con un α = 10%. • Defina el parámetro de interés • Establezca H0 y Ha • En el contexto de este problema, ¿qué significa cometer un error tipo I? ¿y tipo II? • Diga su conclusión