基于NLP技术的核保风险预测方法、装置及相关设备制造方法及图纸

技术编号:27848393 阅读:16 留言:0更新日期:2021-03-30 13:05
本申请涉及数据处理技术,提供一种基于NLP技术的核保风险预测方法、装置、计算机设备与存储介质,包括:解析目标体检数据集,得到目标异常项与核保说明;分词处理核保说明,得到目标核保说明;基于预设word2ves工具包处理目标核保说明,得到目标词向量;调用预设TD

【技术实现步骤摘要】
基于NLP技术的核保风险预测方法、装置及相关设备


[0001]本申请涉及数据处理
,尤其涉及一种基于NLP技术的核保风险预测方法、装置、计算机设备及介质。

技术介绍

[0002]目前,消费者一般通过线下手工填写保单的方式进行投保,而为了实现风控前移,保险公司的核保人员通常需要对保单内容进行审核,以服务正常投保,并规避恶意投保而带来的不必要损失。
[0003]然而,采用人工(即核保人员)核保需要消耗大量的人力资源,效率低下;且受到人工主观性影响(例如,核保人员的医学、财产风险知识储备的影响),核保的准确性得到不到保障。
[0004]有鉴于此,如何提高核保效率以及核保准确性成为亟待解决的问题。

技术实现思路

[0005]鉴于以上内容,有必要提出一种基于NLP技术的核保风险预测方法、基于NLP技术的核保风险预测装置、计算机设备及介质,能够提高核保效率与核保准确性。
[0006]本申请实施例第一方面提供一种基于NLP技术的核保风险预测方法,所述基于NLP技术的核保风险预测方法包括:
[0007]筛选经预处理后的历史体检数据集,得到目标体检数据集;
[0008]解析所述目标体检数据集,得到目标异常项与核保说明;
[0009]分词处理所述核保说明,得到对应所述目标异常项的目标核保说明;
[0010]基于预设word2ves工具包处理所述目标核保说明,得到目标词向量;
[0011]调用预设TD

IDF模型处理所述目标词向量,得到所述目标词向量对应的目标权重,并根据所述目标权重对所述目标词向量进行加权处理,得到目标加权词向量;
[0012]拼接所述目标异常项与所述目标加权词向量,得到目标拼接数据;
[0013]调用预设模型训练所述目标拼接数据,得到核保风险分类模型;
[0014]基于所述核保风险分类模型处理待核保单数据,得到对应所述待核保单数据的风险分类。
[0015]进一步地,在本申请实施例提供的上述基于NLP技术的核保风险预测方法中,预处理所述历史体检数据集包括:
[0016]获取所述历史体检数据集中的目标项数据,其中,所述目标项数据包括保单号、体检项目与检查结果;
[0017]清洗所述目标项数据,去除所述目标项数据中的链接、无效字符与无效语句;
[0018]确定并删除所述目标项数据中的缺失值,得到初始目标体检数据集。
[0019]进一步地,在本申请实施例提供的上述基于NLP技术的核保风险预测方法中,所述筛选经预处理后的历史体检数据集,得到目标体检数据集包括:
[0020]获取所述初始目标体检数据集中每一初始目标体检数据的目标体检项目;
[0021]确定对应所述目标体检项目的实际检查指标与标准健康指标;
[0022]比对所述实际检查指标与所述标准健康指标,得到指标异常结果对应的数据作为目标体检数据。
[0023]进一步地,在本申请实施例提供的上述基于NLP技术的核保风险预测方法中,所述解析所述目标体检数据集,得到目标异常项与核保说明包括:
[0024]获取所述目标体检数据的保单号;
[0025]获取所述目标体检数据中的目标异常项;
[0026]根据所述保单号遍历预先设置的保单号与核保结果信息的映射关系,得到对应所述保单号的目标核保结果信息;
[0027]解析所述目标核保结果信息,得到对应所述目标异常项的核保说明。
[0028]进一步地,在本申请实施例提供的上述基于NLP技术的核保风险预测方法中,所述基于预设word2ves工具包处理所述目标核保说明,得到目标词向量包括:
[0029]调用预设word2ves工具包确定所述目标核保说明中的核保特征;
[0030]计算每一所述核保特征对应分词的词向量;
[0031]组合所述词向量,得到目标词向量。
[0032]进一步地,在本申请实施例提供的上述基于NLP技术的核保风险预测方法中,所述拼接所述目标异常项与所述目标加权词向量,得到目标拼接数据包括:
[0033]获取对应所述目标异常项的异常项词向量与所述目标加权词向量;
[0034]分片处理所有所述异常项词向量与所述目标加权词向量,得到预设数量的分片数据包;
[0035]发送所述分片数据包至数据拼接服务器集群中;
[0036]调用所述数据拼接服务器集群中的每一数据拼接服务器分别对所述分片数据包进行数据拼装,得到目标拼接数据。
[0037]进一步地,在本申请实施例提供的上述基于NLP技术的核保风险预测方法中,在所述基于所述核保风险分类模型处理待核保单数据,得到对应所述待核保单数据的风险分类之后,所述方法还包括:
[0038]处理所述待核保单数据,得到对应所述待核保数据的第一拼接数据;
[0039]利用余弦相似度算法计算所述第一拼接数据与预设数据库中存储的第二拼接数据的距离,得到相似度排名靠前的若干条初始核保数据;
[0040]获取所述初始核保数据的核保结论,并筛选出与所述待核保单数据的风险分类一致的目标核保结论;
[0041]确定所述目标核保结论对应的目标拼接数据作为与所述第一拼接数据的距离最接近的数据。
[0042]本申请实施例第二方面还提供一种基于NLP技术的核保风险预测装置,所述基于NLP技术的核保风险预测装置包括:
[0043]数据筛选模块,用于筛选经预处理后的历史体检数据集,得到目标体检数据集;
[0044]数据解析模块,用于解析所述目标体检数据集,得到目标异常项与核保说明;
[0045]分词处理模块,用于分词处理所述核保说明,得到对应所述目标异常项的目标核
保说明;
[0046]词向量获取模块,用于基于预设word2ves工具包处理所述目标核保说明,得到目标词向量;
[0047]权重获取模块,用于调用预设TD

IDF模型处理所述目标词向量,得到所述目标词向量对应的目标权重,并根据所述目标权重对所述目标词向量进行加权处理,得到目标加权词向量;
[0048]数据拼接模块,用于拼接所述目标异常项与所述目标加权词向量,得到目标拼接数据;
[0049]模型获取模块,用于调用预设模型训练所述目标拼接数据,得到核保风险分类模型;
[0050]风险分类模块,用于基于所述核保风险分类模型处理待核保单数据,得到对应所述待核保单数据的风险分类。
[0051]本申请实施例第三方面还提供一种计算机设备,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任意一项所述基于NLP技术的核保风险预测方法。
[0052]本申请实施例第四方面还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述基于NLP技术的核保风险预测方法。
[0053本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于NLP技术的核保风险预测方法,其特征在于,所述基于NLP技术的核保风险预测方法包括:筛选经预处理后的历史体检数据集,得到目标体检数据集;解析所述目标体检数据集,得到目标异常项与核保说明;分词处理所述核保说明,得到对应所述目标异常项的目标核保说明;基于预设word2ves工具包处理所述目标核保说明,得到目标词向量;调用预设TD

IDF模型处理所述目标词向量,得到所述目标词向量对应的目标权重,并根据所述目标权重对所述目标词向量进行加权处理,得到目标加权词向量;拼接所述目标异常项与所述目标加权词向量,得到目标拼接数据;调用预设模型训练所述目标拼接数据,得到核保风险分类模型;基于所述核保风险分类模型处理待核保单数据,得到对应所述待核保单数据的风险分类。2.根据权利要求1所述的基于NLP技术的核保风险预测方法,其特征在于,预处理所述历史体检数据集包括:获取所述历史体检数据集中的目标项数据,其中,所述目标项数据包括保单号、体检项目与检查结果;清洗所述目标项数据,去除所述目标项数据中的链接、无效字符与无效语句;确定并删除所述目标项数据中的缺失值,得到初始目标体检数据集。3.根据权利要求2所述的基于NLP技术的核保风险预测方法,其特征在于,所述筛选经预处理后的历史体检数据集,得到目标体检数据集包括:获取所述初始目标体检数据集中每一初始目标体检数据的目标体检项目;确定对应所述目标体检项目的实际检查指标与标准健康指标;比对所述实际检查指标与所述标准健康指标,得到指标异常结果对应的数据作为目标体检数据。4.根据权利要求1所述的基于NLP技术的核保风险预测方法,其特征在于,所述解析所述目标体检数据集,得到目标异常项与核保说明包括:获取所述目标体检数据的保单号;获取所述目标体检数据中的目标异常项;根据所述保单号遍历预先设置的保单号与核保结果信息的映射关系,得到对应所述保单号的目标核保结果信息;解析所述目标核保结果信息,得到对应所述目标异常项的核保说明。5.根据权利要求1所述的基于NLP技术的核保风险预测方法,其特征在于,所述基于预设word2ves工具包处理所述目标核保说明,得到目标词向量包括:调用预设word2ves工具包确定所述目标核保说明中的核保特征;计算每一所述核保特征对应分词的词向量;组合所述词向量,得到目标词向量。6.根据权利要求1所述的基于NLP技术的核保风险预测方法,其特征在于,所述拼接所述目标...

【专利技术属性】
技术研发人员:李海翔
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1