590 likes | 1.39k Views
Regresión logística. Ejemplos comunes. Lanzamiento de una moneda (sol/ águila ) Resultado de un juego ( ganar / ñerder ) Estado del tiempo ( lluvia / seco ) Llegar al trabajo (a tiempo / tarde ) Presentar un examen ( pasar / reprobar ). Probabilidad y esperanza.
E N D
Ejemplos comunes • Lanzamiento de unamoneda (sol/águila) • Resultado de un juego (ganar/ñerder) • Estado del tiempo (lluvia/seco) • Llegar al trabajo (a tiempo/tarde) • Presentar un examen (pasar/reprobar)
Probabilidad y esperanza • Para describir la posibilidad de que ocurra un evento se utiliza el término probabilidad y esperanza. • Probabilidad (P)= resultados deseados/resultados posibles • Para un dado, la probabilidad P(6) = 1/6 • Esperanza (O) = resultados deseados / resultados Indeseados • Para un dado, la esperanza O(6) = 1/5 = 0.2
Probabilidad Para el caso de dos dados, si el resultado esperado es 7 se tiene P(7) = 6/36 = 1/6
Esperanza Para el caso de dos dados, si el resultado esperado es 7 se tiene O(7) = 6/30
Probabilidad y Esperanza Esperanza (O) = P/(1-P) Probabilidad (P) = O/(O+1) Para el ejemplo de un dado,P = 6/36 = 0.1667O = 6:30 = 0.2000 P = O/(O+1) = 0.2 / (0.2 + 1) = 0.1667 O = P/(1-P) = 0.1667 / (1 – 0.1667) = 0.2000
Ejemplo: Introducción de un nuevo producto en función del tiempo
Regresión lineal Al sustituir valores en X de -5 y +6 da probabilidades ilógicas de -0.051 y 1.118 También los residuos tienen un cierto patrón
Ejemplo: Cálculo de la Esperanza = p / (1-P) y su logaritmo natural e
Regresión logística Es una herramienta de modelado usado para calcular una ecuación de predicción (o función de transferencia) cuando se tiene Y binaria y X continuas Es decir tiene la función de determinar cuales variables predictoras son significativas y determinar el nivel de influencia para la respuesta
Regresión logística – paso a paso • Organizar los datos “y” en resultados binarios (0,1, pasa, no pasa, etc.) • Graficar los datos • Correr el modelo de regresión logística • Buscar: • Curva “S” • Valores P • Tasa de esperanzas • Ecuación de predicción o función de transferencia
Regresión logística – paso a paso File Open worksheetExh-Regr Stat > Regression > Binary Logistic Regression. En Response, ponerRestingPulse. En Model,ponerSmokes Weight. En Factors (optional), ponerSmokes. Click Graphs.Sel. Delta chi-square vs probability y Delta chi-square vs leverage. Click OK. Click Results. Choose In addition, list of factor level values, tests for terms with more than 1 degree of freedom, and 2 additional goodness-of-fit tests. Click OKen cadacaja de diálogo. StorageseleccionarEvent Probability NOTA: El valor 1 o superior representa el valor éxito
Regresión logística – paso a paso Si P value esmenor a alfa (.05), se puededecirque no es un buenmodelo. Un valor cercano a 1 indica un ajusteexcelente. Como reglautilizar el estadístico de Hosmer-Lemeshow. LogisticRegressionTableOdds 95% CI PredictorCoef SE Coef Z P Ratio LowerUpper Constant -1.98717 1.67930 -1.18 0.237 Smokes Yes -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90 Weight 0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05 Log-Likelihood= -46.820 Test that all slopes are zero: G = 7.574, DF = 2, P-Value = 0.023 Goodness-of-FitTests MethodChi-Square DF P Pearson 40.8477 47 0.724 Deviance 51.2008 47 0.312 Hosmer-Lemeshow 4.7451 8 0.784
Regresión logística – paso a paso La tasa de esperanza de PulsoBajodel peso de (1.03) indicaque un incremento en peso de 10 libras, incrementa la esperanzaqueel pulsobajose incremente 1.28 veces. Para fumar, con el mismo peso, la tasa de esperanza de PulsoBajode los sujetosquefumanes de un 30% de los que no fuman. Un valor de 1.0 indicaque no hay efecto en el resultado LogisticRegressionTable Odds 95% CI PredictorCoef SE Coef Z P Ratio LowerUpper Constant -1.98717 1.67930 -1.18 0.237 Smokes Yes -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90 Weight 0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05
Regresión logística – paso a paso En la prueba de HosmerLemeshow, los valores mayores a 3.84 son valores atípicos, desajustan el modelo
Regresión logística – paso a paso En la prueba de HosmerLemeshow, los valores mayores a 3.84 son valores atípicos
Regresión logística – paso a paso La ecuación de regresiónes: RestingPulse = -1.987 – 1.193*Fuma +0.025*Weight LogisticRegressionTable Odds 95% CI PredictorCoef SE Coef Z P Ratio LowerUpper Constant -1.98717 1.67930 -1.18 0.237 Smokes Yes -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90 Weight 0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05
Regresión logística – paso a paso BLRcalcula el logaritmo natural de la Esperanza (odds) de un evento y Odds = expo (Log odds), y Probabilidad= Odds / (1 + Odds) En nuestrocaso, a 150 lbs de peso para SI fuma: Log Odds =-1.987+0.025*Weight = 1.763 Odds = exp(1.763) = 5.83 Probability = 5.83/6.83= 0.853 or a 85.3% de probabilidad de éxito La ecuación de regresiónes: RestingPulse = -1.987 – 1.193*Fuma +0.025*Weight
Regresión logística – paso a paso La probabilidad de pulsobajoes mayor para los no fumadoresvs los fumadores y en ambos aumentaconformeaumenta el peso. La gráfica de probabilidades vs peso es: