190 likes | 426 Views
ANTECEDENTES PARA CREDITO BANCARIO. Una empresa bancaria desea analizar los antecedentes de un grupo de clientes a quienes les ha otorgado un crédito en el pasado, con el objeto de elaborar una regla que permita discriminar a los futuros solicitantes de crédito en tres grupos:
E N D
ANTECEDENTES PARA CREDITO BANCARIO Una empresa bancaria desea analizar los antecedentes de un grupo de clientes a quienes les ha otorgado un crédito en el pasado, con el objeto de elaborar una regla que permita discriminar a los futuros solicitantes de crédito en tres grupos: 1 – de bajo riesgo 2 – de riesgo medio 3 – de alto riesgo Jorge Galbiati
Las variables que se midieron son las siguientes: Fam – tamaño de la familia Ing – ingreso total anual His – historia crediticia Ant – antecedentes comerciales Cre – créditos anteriores del mismo banco Sit – situación de deudas Viv – vivienda propia Ban – antecedentes bancarios Jorge Galbiati
Todas las variables se encuentran estandarizadas, en una escala de 0 a 100. Se dispone de una muestra de aprendizaje de 40 clientes, que han sido clasif¡cados en alguno de los tres grupos. Jorge Galbiati
Los objetivos de este estudio son: 1 - Construir una regla discriminante, en base a la muestra de aprendizaje, que permita clasificar automáticamente a los futuros solicitantes. 2 - Usando esta regla, se desea clasificar a cuatro nuevos solicitantes de crédito. Jorge Galbiati
Los datos de la muestra de aprindizaje se muestran a continuación. Primero el grupo 1, bajo riesgo: Jorge Galbiati
Grupos 2 y 3, riesgo medio y alto: Jorge Galbiati
Se aplicará un análisis discriminante, método de máxima verosimilitud, o clásico. Para esto es necesario hacer el supuesto de normalidad de los puntajes, aún cuando los valores están expresados en escala de u 1 a 100, pero puede pensarse en que provienen de distribuciones aproximadamente normales. Para verificar esto haremos pruebas no-paramétricas de Kolmogorov-Smirnovde normalidad para cada variable, mediante S-plus. Jorge Galbiati
Test de Kolmogorov-Smirnov para Normalidad: Variable Estadístico p-valor Fam0.1285309 0.4838869 Ing0.0986946 0.7947281 His0.1198947 0.5720338 Ant0.0844057 0.9152212 Cre0.0628346 0.9945343 Sit0.1032208 0.7490746 Viv0.0919720 0.8569070 Ban0.0849887 0.9112551 Jorge Galbiati
Observando los p-valores, se puede concluir que no hay evidencia para rechazar ninguna de las hipótesis de normalidad, para cada variable individual. Esto no es concluyente para el vector de observaciones, pero nos sirve como una referencia de que no seguramente no se aparta tanto de la normalidad. Jorge Galbiati
Luego se deberá determinar si hay homosedasticidad, es decir, si las matrices de varianzas-covarianzas son iguales. Para eso aplicamos un test de Box de homogeneidad de matrices de varianzas-covarianzas, usando S-plus. El estadístico de prueba de Box es 175.2051, con un p-valor de 0.000000. Esto significa que se rechaza la hipótes¡s de homosedasticidad, luego las matrices se deben considerar como distintas. Jorge Galbiati
Ahora estamos en condición de aplicar la técnica de análisis discriminante clásico, (o de máxima verosimilitud) caso heterosedástico, utilizando el software Minitab. Se mostrará: La tabla de clasificación, con los aciertos y desaciertos. Los promedios por grupo de cada variable. Jorge Galbiati
Ahora estamos en condición de aplicar la técnica de análisis discriminante clásico, caso heterosedástico, utilizando Minitab. Resumen de la clasificación: Clasificado Grupo verdadero en el grupo 1 2 3 1 19 1 0 2 0 10 0 3 0 0 10 Total 19 11 10 Bien clasificados 19 10 10 Proporción 1.000 0.909 1.000 N = 40 Aciertos = 39 Proporción aciertos = 0.975 Jorge Galbiati
La observación 24 quedó mal clasificada. Quedó en el grupo 1, pero pertenece al grupo 2. Sus valores son fam = 35 ing = 33 his = 76 ant = 7 cre = 58 sit = 49 viv = 34 y ban = 26 Se dan media de los grupos y se comparan comparan con los valores de la observación 24. Se ve que en algunas variables se acerca al grupo 1, y en otras al grupo 2. Jorge Galbiati
Las medias de las variables, por grupos, son las siguientes Media Grupo Media Cliente Variable 1 2 3 global 24 fam 27.789 29.364 24.500 27.400 35 ing 37.842 32.273 31.500 34.725 33 his 80.579 75.545 65.300 75.375 76 ant 62.684 70.091 74.200 67.600 71 cre 65.000 68.818 73.700 68.225 58 sit 42.211 62.273 78.000 56.675 49 viv 46.789 30.818 41.600 41.100 34 ban 31.175 27.526 34.636 34.300 26 Jorge Galbiati
Las distancias generalizadas al cuadrado, o distancias de Mahalanobis, de la observación a los centroides de los tres grupos son, respectivamente, 34.60, 34.72 y 160.43. Por ser tan parecidas las distancias a los centros de los grupos 1 y 2, se clasificó erróneamente. Jorge Galbiati
Ahora se desea clasificar tres nuevos clientes, que solicitan crédito. Sus valores de las variables observadas son: Se obtienen los siguientes resultados: Jorge Galbiati
distancia de Cliente grupo Mahalanobis Probabilidad 41 1 36.481 0.372 2 35.432 0.628 3 117.147 0.000 42 1 91.532 0.000 2 62.128 0.000 3 40.978 1.000 43 1 38.547 0.999 2 52.211 0.001 3 310.909 0.000 44 1 30.214 1.000 2 63.104 0.000 3 642.280 0.000 Jorge Galbiati
En consecuencia el cliente 41 se asigna al grupo de riesgo medio, el cliente 42 queda en el grupo de alto riesgo, los clientes 43 y 44 quedan en el grupo de bajo riesgo. Los clientes 42, 43 y 44 quedan muy bien clasificados. En cambio el cliente 41 se clasifica en el grupo 2 con una probabilidad de 0.628, contra una probabilidad de 0.372 de estar en el grupo 1. Por lo tanto, sería conveniente considerar otros antecedentes antes de tomar una decisión. Jorge Galbiati
FIN Jorge Galbiati