【技术实现步骤摘要】
基于NLP技术的核保风险预测方法、装置及相关设备
[0001]本申请涉及数据处理
,尤其涉及一种基于NLP技术的核保风险预测方法、装置、计算机设备及介质。
技术介绍
[0002]目前,消费者一般通过线下手工填写保单的方式进行投保,而为了实现风控前移,保险公司的核保人员通常需要对保单内容进行审核,以服务正常投保,并规避恶意投保而带来的不必要损失。
[0003]然而,采用人工(即核保人员)核保需要消耗大量的人力资源,效率低下;且受到人工主观性影响(例如,核保人员的医学、财产风险知识储备的影响),核保的准确性得到不到保障。
[0004]有鉴于此,如何提高核保效率以及核保准确性成为亟待解决的问题。
技术实现思路
[0005]鉴于以上内容,有必要提出一种基于NLP技术的核保风险预测方法、基于NLP技术的核保风险预测装置、计算机设备及介质,能够提高核保效率与核保准确性。
[0006]本申请实施例第一方面提供一种基于NLP技术的核保风险预测方法,所述基于NLP技术的核保风险预测方法包括:
[0007]筛选经预处理后的历史体检数据集,得到目标体检数据集;
[0008]解析所述目标体检数据集,得到目标异常项与核保说明;
[0009]分词处理所述核保说明,得到对应所述目标异常项的目标核保说明;
[0010]基于预设word2ves工具包处理所述目标核保说明,得到目标词向量;
[0011]调用预设TD
‑
IDF模型处理所述目标词向量,得 ...
【技术保护点】
【技术特征摘要】
1.一种基于NLP技术的核保风险预测方法,其特征在于,所述基于NLP技术的核保风险预测方法包括:筛选经预处理后的历史体检数据集,得到目标体检数据集;解析所述目标体检数据集,得到目标异常项与核保说明;分词处理所述核保说明,得到对应所述目标异常项的目标核保说明;基于预设word2ves工具包处理所述目标核保说明,得到目标词向量;调用预设TD
‑
IDF模型处理所述目标词向量,得到所述目标词向量对应的目标权重,并根据所述目标权重对所述目标词向量进行加权处理,得到目标加权词向量;拼接所述目标异常项与所述目标加权词向量,得到目标拼接数据;调用预设模型训练所述目标拼接数据,得到核保风险分类模型;基于所述核保风险分类模型处理待核保单数据,得到对应所述待核保单数据的风险分类。2.根据权利要求1所述的基于NLP技术的核保风险预测方法,其特征在于,预处理所述历史体检数据集包括:获取所述历史体检数据集中的目标项数据,其中,所述目标项数据包括保单号、体检项目与检查结果;清洗所述目标项数据,去除所述目标项数据中的链接、无效字符与无效语句;确定并删除所述目标项数据中的缺失值,得到初始目标体检数据集。3.根据权利要求2所述的基于NLP技术的核保风险预测方法,其特征在于,所述筛选经预处理后的历史体检数据集,得到目标体检数据集包括:获取所述初始目标体检数据集中每一初始目标体检数据的目标体检项目;确定对应所述目标体检项目的实际检查指标与标准健康指标;比对所述实际检查指标与所述标准健康指标,得到指标异常结果对应的数据作为目标体检数据。4.根据权利要求1所述的基于NLP技术的核保风险预测方法,其特征在于,所述解析所述目标体检数据集,得到目标异常项与核保说明包括:获取所述目标体检数据的保单号;获取所述目标体检数据中的目标异常项;根据所述保单号遍历预先设置的保单号与核保结果信息的映射关系,得到对应所述保单号的目标核保结果信息;解析所述目标核保结果信息,得到对应所述目标异常项的核保说明。5.根据权利要求1所述的基于NLP技术的核保风险预测方法,其特征在于,所述基于预设word2ves工具包处理所述目标核保说明,得到目标词向量包括:调用预设word2ves工具包确定所述目标核保说明中的核保特征;计算每一所述核保特征对应分词的词向量;组合所述词向量,得到目标词向量。6.根据权利要求1所述的基于NLP技术的核保风险预测方法,其特征在于,所述拼接所述目标...
【专利技术属性】
技术研发人员:李海翔,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。