190 likes | 492 Views
论文题目:. 数据挖掘技术在信用卡风险管理中的应用. 专 业:软件工程信息系统开发 答辩人:江圣祺 导 师:姚天昉 副教授. 答辩提纲. 课题背景及任务 数据挖掘定义 数据挖掘系统总体设计 信用评分关键技术的实现 信用评分模型实现 系统测试实验 总结 致谢. 课题背景. 研究背景: 中国信用卡行业数据挖掘现状:中国信用卡行业迅速发展,数据量巨大但知识缺乏。 银行数据挖掘缺陷: 数据源不统一。 数据零散,不能统一起来为银行所用,数据无法整合。 缺乏足够的历史数据。 缺乏行之有效的数据挖掘能力和信用分类聚类能力。 论文目的和任务:
E N D
论文题目: 数据挖掘技术在信用卡风险管理中的应用 专 业:软件工程信息系统开发 答辩人:江圣祺 导 师:姚天昉 副教授
答辩提纲 • 课题背景及任务 • 数据挖掘定义 • 数据挖掘系统总体设计 • 信用评分关键技术的实现 • 信用评分模型实现 • 系统测试实验 • 总结 • 致谢
课题背景 研究背景: • 中国信用卡行业数据挖掘现状:中国信用卡行业迅速发展,数据量巨大但知识缺乏。 银行数据挖掘缺陷: • 数据源不统一。 • 数据零散,不能统一起来为银行所用,数据无法整合。 • 缺乏足够的历史数据。 • 缺乏行之有效的数据挖掘能力和信用分类聚类能力。 论文目的和任务: • 体现数据挖掘技术应用在信用卡审核系统中的价值和意义 。 • 客户数据信息深层挖掘。 • 降低银行客户信用风险,提高银行风险管理能力。
数据挖掘定义 数据挖掘定义: • 数据挖掘是指从大量数据中提和挖掘“知识”。 数据挖掘流程:
数据挖掘系统总体设计 客户信用评分审核系统流程: • 纸质申请书扫描 • 电子影像建档 • 上传主机和系统分件 • 回传主机,主机存档
数据挖掘系统总体设计 PACES体系架构: • 平安信用卡外围管理系统(PACES)作为平安银行信用卡审核的主要系统和多个系统都通过接口进行互联,其中包括(中国人民银行资信系统,平安寿险系统,平安车险系统,平安银行管理系统,主机系统,平安信用卡数据挖掘分析系统)
数据挖掘系统总体设计 系统集成的体系架构: • 系统集成的体系架构主要观念在于,将平安信用卡数据挖掘系统中的相关模型分析结果,以API函数调用的方式将其映射到平安信用卡外围管理系统,并在两个系统中建立接口,可以将数据进行调用和映射。
信用评分关键技术的实现 基于决策树改进的SLIQ算法介绍和特点: • 先对属性值进行预排序,保证了运行速度。 • 低代价的MDL剪枝算法 • 使用训练集中的所有数据,不做抽样操作,确保完整性和精确度。 • 目标树结构小,避免冗余,且检索速度快。更有效率 • 有效的处理磁盘中的训练集,对于处理海量数据(金融行业数据)更为有效。
信用评分关键技术的实现 SLIQ算法的改进: • 设置了某些数据属性的优先级,并创建了一个优先级标识:算法通过计算每一个数据的Gini指数来进行判定。客户信用类别评判是根据人行资信报告来判定的,人行资信报告又存在一定的特殊性,所以对所有属性进行Gini计算是不合理,也是没有必要的。 • 属性字段会分为数值型和离散性两种类型,需对当前属性值进行判断。
信用评分关键技术的实现 最终决策树的实现和总结: • 广度优先 :SLIQ算法采用了广度优先的处理方法 • 一次排序 :算法开始之前所有属性已经全部排序,大的属性一定是靠后的。 • 判定属性的优先级:设置了属性的优先级,首先判定分裂优先级高的两个属性(信用卡状态属性优先级高于贷款状态) • 属性实时装入 :当判定一个属性的最佳分裂点时,只计算当前属性。
信用评分关键技术的实现 实验分析 : 实验目的: • 通过大量数据测试,验证算法的可靠性和稳定性。 • 将SLIQ算法与改进SLIQ算法的性能进行比较。 实验过程: 实验结果:
信用评分模型实现 信用评分模型的意义: • 信用评分模型用于平安银行信用审核系统的核心模型,该模型对客户的信用进行决策分类。在数据仓库的基础上,利用数据挖掘技术,帮助信用卡中心了解客户消费习惯,预测客户消费行为,从而帮助银行信用卡中心进行管理和决策。 信用评分模块体系结构:
信用评分模型实现 设备环境: • 实验工具与环境 • 开发工具:CMS 5.0 (平安大型主机系统) • 数据分析工具:Oracle 9i,SAS 8.0(Super Score Buileder模块) • 设备:PC • CPU:P4 2.0 • 内存:2G • 硬盘:160G
信用评分模型实现 信用评分模型的实现: • 模型表创建:选取参数,创建模型表。 • 模型处理:利用改进型SLIQ算法处理模型。 • 模型解释:专业建模人员利用模型结果设置信用评分标准。 • 模型转换:将模型结果转换成ORACLE数据库中的模型表。 • 模型导入:将模型表导入相关数据挖掘系统。
信用评分模型实现 信用评分模型实现总结: 模型优点和成功之处: • 模型结果比较精确,符合原先预计的结果,可以投入到实际业务的应用中去。 • 模型运行效率较高,由于运用了改进型的SLIQ算法,在模型处理过程中处理速度较快. • 模型评分标准设置简便,由于模型结果全部都是以参数的形式显现,分析人员设置信用评分标准比较简便。 模型缺陷和不足之处: • SAS调用ORACLE数据库速度不理想,由于使用ODBC方式调用ORACLE,在速率方面比较不理想,需要以后该进。 • CMS和信用模型结果耦合性不高,由于在SAS中产生的模型结果不能直接导入到CMS模型仓库中。
系统测试实验 • 系统测试流程: • 系统测试结果:
总结 • 经过一年多的努力,平安银行信用卡风险管理系统信用评分模型已经全部完成,并通过了测试,在系统的开发过程中,我不仅对软件工程有了更深刻的认识。同时,也对数据挖掘和数据模型的相关知识有了深刻的了解,对以后的学习和工作产生了深远的影响。
致谢 • 这篇论文是在姚天昉导师的精心指导之下完成的,从可行性研究到最后的测试,付出了大量的汗水和心血。学生在此深深的感谢您。同时也感谢我的同学和同事,在整个软件的开发过程中,给了我很大的帮助。 • 在此谨向所有给予我指导、帮助和鼓励的老师和同学,同事表示诚挚的谢意!