一种保险投保单的风险评估方法以及系统技术方案

技术编号:32645647 阅读:21 留言:0更新日期:2022-03-12 18:27
本发明专利技术提供了一种保险投保单的风险评估方法以及系统,所述风险评估方法包括:对内外部数据进行标准化处理,标准化处理之后的数据根据不同类型进行分别处理,半结构化的数据采用深度学习NLP方向中的TextCNN模型进行处理,结构化的数据采用沟通SQL进行数据库表关联获取,形成基础特征;然后结合半结构化数据、结构化数据获取到的所述基础特征,进行深度特征加工;进行深度加工后的数据送入LightGBM的主模型进行训练,主模型为以分类或回归树为基础分类器的提升树模型GBDT变种。本发明专利技术的风险评估方法实现了保单实时性的风险监测,降低了人工的工作量,制定了统一的核保标准,数据汇总方便及时。便及时。便及时。

【技术实现步骤摘要】
一种保险投保单的风险评估方法以及系统


[0001]本专利技术涉及保险领域,具体而言,涉及一种保险投保单的风险评估方法以及系统。

技术介绍

[0002]目前保险行业中对于投保单的核保普遍依靠的是传统规则与人工校验核对的方法。这种传统模式需要耗费大量的人力物力,不同能力的业务老师的知识储备会得出不同的核保结果,很难形成规范化的核保定式,另外传统规则筛查系统的维护成本也存在偏高的弊病,现有技术中的方法存在如下风险:
[0003]1)投保、核保传统规则的相关阈值调整周期长,维护成本高,实时性的风险监测不及时
[0004]2)投保、核保传统规则的相关阈值固定,造成大量的误预警,增加人工工作量,降低工作效率与客户体验
[0005]3)投保、核保传统规则输出的仅为提示性描述话术,并不能规范业务老师在核保过程中的核保标准,造成千人千面的核保结论
[0006]4)业务人员在人工核保过程中查看客户各个维度的数据时,需要多次跳转页面进行查询,缺少数据汇总的工具,造成冗余工作量
[0007]在大数据、智能化时代的洪流下,如何采用创新型的技术来提升传统保险行业的工作效率、提升客户体验感、降低误报率、标准化核保等需求已然成为目前的迫切任务,那么结合这样的场景需求,采用深度学习与机器学习相结合的形式构建一套智能化打分机制是能够满足当前场景需求的一种方式。
[0008]有鉴于此,特提出本专利技术。

技术实现思路

[0009]有鉴于此,本专利技术公开了一种采用深度学习与机器学习相结合的方式来针对保险投保单的风险评估方法构建一套智能化完整的打分机制,通过该风险评估方法,该方法实现了保单实时性的风险监测,降低了人工的工作量,制定了统一的核保标准,数据汇总方便及时。
[0010]具体地,本专利技术是通过以下技术方案实现的:
[0011]第一方面,本专利技术公开了一种保险投保单的风险评估方法,所述方法包括:
[0012]对内外部数据进行标准化处理,标准化处理之后的数据根据不同类型进行分别处理,半结构化的数据采用深度学习NLP方向中的TextCNN模型进行处理,结构化的数据采用沟通SQL进行数据库表关联获取,形成基础特征;
[0013]然后结合半结构化数据、结构化数据获取到的所述基础特征,进行深度特征加工;
[0014]进行深度加工后的数据送入LightGBM的主模型进行训练,主模型为以分类或回归树为基础分类器的提升树模型GBDT变种。
[0015]第二方面,本专利技术公开了一种保险投保单的风险评估系统,包括:
[0016]预处理模块:用于对内外部数据进行标准化处理,标准化处理之后的数据根据不同类型进行分别处理,半结构化的数据采用深度学习NLP方向中的TextCNN模型进行处理,结构化的数据采用沟通SQL进行数据库表关联获取,形成基础特征;
[0017]深度加工模块:用于结合半结构化数据、结构化数据获取到的所述基础特征,进行深度特征加工;
[0018]主加工模块:用于深度加工后的数据送入LightGBM的主模型进行训练,主模型为以分类或回归树为基础分类器的提升树模型GBDT变种。
[0019]第三方面,本专利技术公开了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述保险投保单的风险评估的方法的步骤。
[0020]第四方面,本专利技术公开了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述保险投保单的风险评估系统的步骤。
[0021]本专利技术采用了深度学习与机器学习相结合的方式来针对保险投保单的风险评估方法构建一套智能化完整的打分机制,通过该风险评估方法,该方法实现了保单实时性的风险监测,降低了人工的工作量,制定了统一的核保标准,数据汇总方便及时。
附图说明
[0022]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0023]图1为本专利技术实施例提供的保险投保单的风险评估方法的应用架构图;
[0024]图2为本专利技术实施例提供的保险投保单的风险评估方法的工作流程图;
[0025]图3为本专利技术实施例提供的保险投保单的风险评估方法的建模流程图;
[0026]图4为本专利技术实施例提供的TextCNN模型的原理图;
[0027]图5为本专利技术实施例提供的LightGBM模型的原理图;
[0028]图6为本专利技术实施例提供的保险投保单的风险评估系统的结构示意图;
[0029]图7为本专利技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0030]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0031]在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0032]应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离
本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0033]本专利技术公开了一种保险投保单的风险评估方法,所述方法包括:
[0034]对内外部数据进行标准化处理,标准化处理之后的数据根据不同类型进行分别处理,半结构化的数据采用深度学习NLP方向中的TextCNN模型进行处理,结构化的数据采用沟通SQL进行数据库表关联获取,形成基础特征;
[0035]然后结合半结构化数据、结构化数据获取到的所述基础特征,进行深度特征加工;
[0036]进行深度加工后的数据送入LightGBM的主模型进行训练,主模型为以分类或回归树为基础分类器的提升树模型GBDT变种。
[0037]图1

3为本专利技术实施例公开的保险投保单的风险评估方法的具体工作流程图以及配套的建模流程图以及数据应用层面的框架图。
[0038]从图1的数据的应用架构图中,可以知晓本专利技术方案的模型框架主要包括:数据源层、数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种保险投保单的风险评估方法,其特征在于,包括如下步骤:对内外部数据进行标准化处理,标准化处理之后的数据根据不同类型进行分别处理,半结构化的数据采用深度学习NLP方向中的TextCNN模型进行处理,结构化的数据采用沟通SQL进行数据库表关联获取,形成基础特征;然后结合半结构化数据、结构化数据获取到的所述基础特征,进行深度特征加工;进行深度加工后的数据送入LightGBM的主模型进行训练,主模型为以分类或回归树为基础分类器的提升树模型GBDT变种。2.根据权利要求1所述的保险投保单的风险评估方法,其特征在于,所述标准化处理的方法包括:对于数据缺省、码值不统一、配置表统一整合的内容进行ETL处理。3.根据权利要求1所述的保险投保单的风险评估方法,其特征在于,半结构化数据的处理方法包括:将话术做为输入,历史核保结论为输出,通过向量化的输入序列求出与其输出目标函数最小化的概率,以实现经过TextCNN模型的输出为一段描述性文本在某个保单产品场景下的风险概率。4.根据权利要求1所述的保险投保单的风险评估方法,其特征在于,所述深度特征加工的方法包括:基于数理的加、减、乘、除、指数变换、woe计算、类型性数据转换以及KS分箱的方法。5.根据权利要求1所述的保险投保单的风险评估方法,其特征在于,所述主模型的计算方法包括如下步骤:假设K个CART,其中第k个CART记为T
k
(x),前k个CART的预测值记为将前k个CART的预测值表示为一个递归形式:f
k
(x)=f
k
‑1(x)+T
k
(x);在训练第k个CART的时候,最小化成以下的目标函数:目标函数对f
k
‑1的梯度是:沿着这个方向走得到一个新的函数,其相应的损失函数值更小;采用梯度下降法优化模型参数的形式:通过上述算式得到:第k个CART的拟合对象为目标函数的负梯度,假定学习率为1;采用残差平方和作为目标函数:
因此有:以此类推,直到每一个基础模型都训练完毕,假设最后的提升树中有K个CART,那么使用它进行预测的规则就是:6.根据权利要求1

5任一项...

【专利技术属性】
技术研发人员:吕鹏
申请(专利权)人:金科览智科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1