1 / 45

养老保险 联网数据应用 分析框架

养老保险 联网数据应用 分析框架. 劳动保障部社保中心 刘睦平 2005.5. 联网数据应用. 联网数据应用. 综合查询. 公众服务. 业务支持. 测算支持. 模型数据 支持. 联网数据分析. 联网数据分析. 分类. 归纳. 比较. 关联. 预测. 数 据 仓 库 技 术. 数据分析. 数据统计. 数据挖掘. 深层次的数据分析,找出数据中潜在的规律和趋势,常用于决策分析系统(如精算领域中模型的建立和应用). 对数据进行有效的组织(排列组合)、整理及特征提取,常用于用户查询,交互性强. 一、联网数据指标结构. 期别类.

Download Presentation

养老保险 联网数据应用 分析框架

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 养老保险联网数据应用分析框架 劳动保障部社保中心 刘睦平 2005.5

  2. 联网数据应用 联网数据应用 综合查询 公众服务 业务支持 测算支持 模型数据 支持

  3. 联网数据分析 联网数据分析 分类 归纳 比较 关联 预测

  4. 据 仓 库 技 术 数据分析 数据统计 数据挖掘 深层次的数据分析,找出数据中潜在的规律和趋势,常用于决策分析系统(如精算领域中模型的建立和应用) 对数据进行有效的组织(排列组合)、整理及特征提取,常用于用户查询,交互性强

  5. 一、联网数据指标结构

  6. 期别类 地区代码类 交换库指标 单位信息类 职工信息类 离退休人员信息类 一、联网数据指标结构

  7. 一、联网数据指标结构 单位自然属性 单位社会属性 单位信息类 单位参保属性 单位基金属性

  8. 一、联网数据指标结构 单位自然属性 第3项:单位编号 第4项:单位名称 单位社会属性 第5项:单位类型 第6项:组织机构代码 第7项:经济类型 第8项:隶属关系 第9项:所属行业

  9. 一、联网数据指标结构 单位参保属性 第10项:征缴方式 第11项:单位参保缴费状态 第12项:参保日期 第13项:单位缴费基数

  10. 一、联网数据指标结构 单位基金属性 第14项:本月应缴金额合计 第15项:本月单位应缴金额 第16项:本月个人应缴金额合计 第17项:本月实缴金额合计 第18项:本月单位实缴金额 第19项:本月个人实缴金额合计 第20项:本月补缴金额合计 第21项:本月单位补缴金额 第22项:本月个人补缴金额合计 第23项:本月补缴滞纳金 第24项:本月补缴利息 第25项:累计欠缴金额合计 第26项:单位累计欠缴金额 第27项:个人累计欠缴金额合计

  11. 一、联网数据指标结构 在职职工自然属性 在职职工社会属性 职工信息类 在职职工参保属性 在职职工基金属性

  12. 一、联网数据指标结构 在职职工自然属性 第32项:姓名 第33项:性别 第34项:公民身份号码 第35项:民族 第36项:出生日期 在职职工社会属性 第30项:所在单位编号 第31项:个人编号 第37项:户口性质 第38项:个人身份 第39项:从事特殊工种月数 第40项:参加工作日期

  13. 一、联网数据指标结构 在职职工参保属性 第41项:建立个人帐户日期 第42项:个人缴费状态 第43项:中断或终止缴费原因 第44项:个人缴费基数 第52项:累计缴费月数 在职职工基金属性 第45项:本月个人应缴金额 第46项:个人身份参保职工本月个人应缴统筹金额 第47项:本月单位缴费应划入个人帐户金额 第48项:本月个人实际缴费金额 第49项:本月单位缴费实际划入个人帐户金额 第50项:个人帐户中个人缴费部分累计本息 第51项:个人帐户中单位划入部分累计本息

  14. 一、联网数据指标结构 离退休人员自然属性 离退休人员社会属性 离退休人员信息类 离退休人员参保属性 离退休人员基金属性

  15. 一、联网数据指标结构 离退休人员自然属性 第57项:姓名 第58项:性别 第59项:公民身份号码 第60项:民族 第61项:出生日期 离退休人员社会属性 第55项:原单位编号 第62项:个人编号 第63项:参加工作日期 第64项:离退休日期 第65项:退休前个人身份 第66项:原单位类型 第67项:离退休类别

  16. 一、联网数据指标结构 离退休人员参保属性 第68项:社会化管理形式 第69项:停发养老金原因 第70项:本人长期生活地 离退休人员基金属性 第71项:本月应发养老金合计 第72项:本月应发基础养老金 第73项:本月应发过渡性养老金 第74项:本月应发个人帐户养老金 第75项:本月应发补贴金额合计 第76项:本月应发基本离退休退职费 第77项:本月实发养老金合计 第78项:本月实际补发当年待遇调整养老金 第79项:本月实发其他养老保险待遇金额合计 第80项:本月末个人帐户余额

  17. 二、联网数据统计表功能 固定表:16大类40张表 第0类(4):汇总本月缴费、补欠、个人帐户、发放情况 第1类(3):分单位类型、隶属关系、经济类型的单位个数 第2类(4):分单位类型、隶属关系、经济类型的分性别的参 保人数、缴费人数、中断人数、终止人数以及分中断终 止原因的分性别的参保人数 第3类(5):分经济类型的、分退休前个人身份的、分离退休 类别的、分社管形式的、分长期生活地的离退休人数 第4类(1):参保职工年龄分组 第5类(1):离退休人员年龄分组 第6类(1):离退休时间分组 第7类(1):分停发养老金原因人数

  18. 二、联网数据统计表功能 固定表:16大类40张表 第8类(3):分单位类型、隶属关系、经济类型的应缴实缴 第9类(3):分单位类型、隶属关系、经济类型的欠费情况 第10类(3):分单位类型、隶属关系、经济类型的补缴情况 第11类(1):职工个人平均缴费基数 第12类(4):分单位类型的、分退休前个人身份的、分退休类 别的、分性别的人均养老金 第13类(1):职工个人帐户平均储存额 第14类(4):离退休人员个人帐户平均储存额、终止领取养老 金人员按性别年龄分组、按应发养老金水平分类、按 年龄分组的平均养老金水平 第15类(1):按中断缴费原因分类人数和平均年龄情况

  19. 二、联网数据统计表功能 临时表:手工操作 • 当期停止领取养老金人员年龄分组 • 新增退休人员应发养老金水平 • 终止领取养老金人员年龄情况 • 分性别和单位类型参保职工实际缴费年限分组

  20. 二、联网数据统计表功能 统计表上报情况: • 不全面 • 不及时 • 不连续 • 不对应 严重影响: • 数据应用 • 数据分析

  21. 三、联网数据应用框架

  22. 四、联网数据分析框架 数据分析 数据分布 单位缴费 情况 在职职工 情况 离退休人员 情况 对比分析

  23. 四、联网数据分析框架 数据分布 数量 性别分析 负担水平 参保单位 在职职工 离退休人员

  24. 四、联网数据分析框架 单位缴费情况 缴费状态 缴费情况 补缴情况 补欠情况

  25. 四、联网数据分析框架 在职职工情况 缴费状态 缴费情况 缴费基数 个人帐户 中断缴费 情况

  26. 四、联网数据分析框架 离退休人员情况 人员类别 分析 停发待遇 原因 年龄、性别 分析 养老金水平 个人帐户

  27. 四、联网数据分析框架 停发待遇原因 年龄分组 平均余命

  28. 四、联网数据分析框架 离退休人员年龄、性别分析 年龄分组 提前退休 人员 平均余命

  29. 四、联网数据分析框架 养老金水平 新增人员 全部人员 提前退休 人员

  30. 四、联网数据分析框架 对比分析 当期收支比较 缴费水平和养老金水平比较

  31. 五、联网数据应用演示 数据范围一:联网省份部分数据 1.分析中断缴费人员的流失,分地区、分企业经济类型(国有、集体、外资、其他企业)、分性别、分年龄段参保人员中断缴费人员数量 2.分析参保人员中未来3年的预测退休人数(女50男60,不包括提前退休)

  32. 五、联网数据应用演示 3.当期停止领取养老金人员年龄分组,从中可算出平均余命 4.分地区分性别分析离退休人员退休时平均年龄,分正常退休和提前退休 5.分地区、分单位类型(企业和机关事业)分性别、养老金水平差异

  33. 五、联网数据应用演示 数据范围二:地方运用联网数据开展分析应用的实例

  34. 六、联网数据质量评价 目标 建立质量评价体系 数据质量的评价:三个方面(一个指标) 一是数据格式正确 二是数据内容准确 三是与相关指标逻辑关系对应

  35. 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 通过指标项数据错误率进行判定 空项缺项 错误率 准确程度 逻辑对应

  36. 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 数据可用率计算方法及公式: 第一步:计算数据错误率 第二步:根据指标的数据错误率分类,确定指标的类别和可用度 第三步:根据分类计算数据的可用率

  37. 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 数据可用率计算方法及公式: 第一步:计算数据错误率 数据错误率 =空项缺项率or准确率or逻辑对应正确率 (or指或运算)

  38. 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 数据可用率计算方法及公式: 第二步:根据指标的数据错误率分类,确定指标的类别和可用度 第一类:指数据错误率在1%以下, 可用度=1 第二类:指数据错误率在1-20%之间, 可用度=2 第三类:指数据错误率在20-50%之间, 可用度=3

  39. 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 数据可用率计算方法及公式: 第三步:根据分类计算数据的可用率 每类指标的数据可用率 =[该类指标的数据总量÷全部数据总量] ×100% 数据总量 =[单位库数据量×单位库指标总量]+ [在职库数据量×在职库指标总量]+ [离退休库数据量×离退休库指标总量]

  40. 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 对北京、天津、河北、辽宁、吉林、上海、福建、陕西8省的数据质量进行了评价。 1.可用程度较高的是上海、北京、天津。 2.离退休库的指标可用度最高。

  41. 六、联网数据质量评价 联网指标的可用程度排名(第一类)

  42. 六、联网数据质量评价 联网指标的可用程度综合排名(第二类)

  43. 六、联网数据质量评价 联网指标的可用程度综合排名(第三类)

  44. 规范整理数据 建设优质数据环境 是支持事业发展的当务之急!

  45. 谢谢!

More Related