注册 会员中心付费方式入会指南

保险专业资源下载网站

0755-21659566
上传资料 在线充值

当前位置:首页 > 风险管理 > 风险分析及研究 > 正文

决策树在保险客户风险分析中的应用(2页).pdf

摘要:本文利用决策树算法对保险业务数据进行了客户风险分析,并以重大疾病险种的索赔业务数据为基础,详细介绍了数据预处理过程,针对年龄地域收入因素,给出了基于算法的客户风险分析建模过程
关键词:客户风险分析;保险;决策树;数据预处理
近年来国内诸多保险公司根据自身情况,从不同程度上进行了客户关系管理尝试但是,客户关系管理水平仍然有限,运用数据挖掘等技术对企业客户数据进行深层次的处理,为企业决策提供支持的客户关系管理系统的理论和应用仍然不足本文利用决策树技术,挖掘客户信息,生成客户信息模型方面进行了有益探索
一决策树算法
决策树算法是一种归纳分类算法,能很好地与超大型数据库结合其主要优点如下[1]
:能够生成可以理解的规则,形成挖掘模型;计算量相对较小,大大缩短了计算时间,从而提高了系统效率;可以处理连续和离散数据;可以清晰地显示出属性的重要程度国际上最早具有影响力的决策树算法是1986年由JR..Quinlan提出的ID3算法该算法以最高信息增益的属性作为节点划分标准,但只能处理离散型的描述性属性C4.5算法在此基础上加以改进,可以处理连续型属性,选取节点的标准是具有最大信息增益率使用C4.5算法[2]
构造分析决策树,信息增益率计算方法如下:
Gain-Ratio(A)=Gain(A)/E(A)(1)
其中,Gain(A)为按照属性A进行节点划分后的信息增益E(A)为节点划分前的信息总熵计算每个属性的信息增益率Gain-Ratio(A)选择信息增益率最大的属性,作为当前属性节点,得到决策树的根节点对于取值连续的属性做如下处理:
(1)根据原始数据,找到该连续型属性的最小取值a0,最大值an+1;
(2)在区间[a,b]内插入n个数值等分为n+1个小区间;
(3)分别以ai,,i=1,2,,n为分段点,将区间[a0,an+1]划分
为两个子区间:[a0,ai],(ai,an+1)分别计算以ai(i=1,1,,n)为分割点对应分类的信息率,选择最大信息增益率对应的ai计算该属性分类的分割点如以年龄收入等属性作为决策树节点时,常在预处理时作分段处理
二保险客户风险分析模型建立过程
本节以某保险公司2007年度重大疾病类终身险种的索赔数据为基础,实例介绍基于年龄地域收入因素的客户风险分析建模过程
(一)数据准备根据险种特点,可以得知客户的年龄地域和收入,是决定客户风险的重要因素因此,需要从客户数据库中提取客户基本信息表索赔单据信息表
(二)数据预处理分析进行客户风险分析,投保人是否索赔是关键信息,将索赔金额属性,转换为是否索赔属性再将出生日期转换为年龄属性,并将年龄收入属性泛化,创建新类别,对应年龄分布收入分布为统一分析,将地区编号字段改名为地域分布最终,将前述两个数据表连接,去除与客户风险分析不相关属性,保留年龄分布收入分布地域分布是否索赔字段,形成某月客户风险分

你可能正需要这些

立即下载 收藏

如何才能下载资料?

资料信息

  • 更新时间:2010-08-31
  • 资料性质:授权资料
  • 文件大小:112KB
  • 下载次数:0
  • 文件格式:PDF
  • 所需圈币:110
  • 收藏次数:0次
分享到:
新手入门
入会指南 付费方式 新手帮助
关于我们
公司简介 法律申明 网站地图
关注我们
官方微信 官方微博 意见反馈
联系我们
联系QQ:564358161 微信咨询:13049846002 客服热线:13049846002

圈中人客服电话

0755-21659566

周一至周五(9:00-18:00)

Copyright © 2009-2026 深圳市圈中人电子商务有限公司 粤ICP备05047908号网站建设:自己人

您是否真的需要安全退出?

确认退出

意见反馈