【技术实现步骤摘要】
信息流向识别方法、装置、设备和存储介质
本申请涉及信息处理
,具体而言,涉及一种信息流向识别方法、装置、设备和存储介质。
技术介绍
机动车辆保险即汽车保险(简称车险),是指对机动车辆由于自然灾害或意外事故所造成的人身伤亡或财产损失负赔偿责任的一种商业保险。近年来的车险市场报告显示,车险无论是在增速还是盈利水平上都有明显下降,车险客户的挽留成本大大低于车险客户的开拓成本。另外,车险做为一年期短期保险,在保险行业拥有巨大的客户量,同时保险公司车险续保率整体在50%~60%之间,保险行业大约每年2亿多保单到期量。因此,如何识别出哪些到期的保单即将流失,以便于持续提高续保率成为行业发展的重要问题。
技术实现思路
本申请实施例的目的在于提供一种信息流向识别方法、装置、设备和存储介质,用以实现根据解析出的单据信息的流动特征集合,采用预设的目标识别模型,自动识别出单据信息的流向信息。本申请实施例第一方面提供了一种信息流向识别方法,包括:获取待处理单据信息;根据预设变量,解析所述单据信息,生 ...
【技术保护点】
1.一种信息流向识别方法,其特征在于,包括:/n获取待处理单据信息;/n根据预设变量,解析所述单据信息,生成所述单据信息的流动特征集合;/n将所述流动特征集合输入至目标识别模型,识别出所述单据信息的流向信息。/n
【技术特征摘要】
1.一种信息流向识别方法,其特征在于,包括:
获取待处理单据信息;
根据预设变量,解析所述单据信息,生成所述单据信息的流动特征集合;
将所述流动特征集合输入至目标识别模型,识别出所述单据信息的流向信息。
2.根据权利要求1所述的方法,其特征在于,所述根据预设变量,解析所述单据信息,生成所述单据信息的流动特征集合,还包括:
识别所述单据信息中包含的初始变量集合;
对所述初始变量集合进行无效数据清洗,生成有效变量集合;
从所述有效变量集合中提取对应于所述预设变量的数据集合,作为所述单据信息的流动特征集合。
3.根据权利要求2所述的方法,其特征在于,所述识别所述单据信息中包含的初始变量集合,包括:
根据所述单据信息对应的数据维度,解析所述单据信息,生成多个所述初始变量;
解析出每个所述初始变量在所述单据信息中的实际数据,并根据预设类别规则,对全部所述初始变量进行分类;
根据所述实际数据和分类结果,生成所述初始变量集合。
4.根据权利要求1所述的方法,其特征在于,选取所述预设变量的步骤包括:
获取多个历史单据的数据;
对每个所述历史单据的数据进行无效数据清洗,生成历史变量集合;
从所述历史变量集合中,剔除对所述历史单据的信息流动贡献率小于预设贡献阈值的所述历史变量之后,生成多个所述预设变量。
5.根据权利要求4所述的方法,其特征在于,所述从所述历史变量集合中,剔除对所述历史单据的信息流动贡献率小于预设贡献阈值的所述历史变量之后,生成多个所述预设变量,包括:
获取所述历史单据的实际历史流向信息;
计算每个所述历史变量与所述实际历史流向信息的相关度;
从所述历史变量集合中,剔除所述相关度小于所述预设贡献阈值的所述历史变量之后,生成多个所述预设变量。
6.根据权利要求4所述的方法,其特征在于,预设所述目标识别模型的步骤包括:
根据多个所述预设变量分别训练多种数学算法模型,并生成多个预设识别模型;
基于所述历史单据,分别计算每个所述预设识别模型的真实度;
判断在多个所述预设识别模型中,是否存在多个所述真实度相同且最大的同等预设识别模型;
若在多个所述预设识别模型中,不存在所述同等预设识别模型,选取所述真实度最大的所述预设识别模型作为所述目标识别模型。
7.根据权利要求6所述的方法,其特征在于,还包括:
若在多个所述预设识别模型中存在多个所述同等预设识别模型,则分别计算每个所述同等预设识别模型的混淆矩阵的正确率;
从多个所述同等预设识别模型中,选取所述混淆矩阵的正确率最大的所述同等预设识别模型作为所述目标识别模型。
8.一种信息流向识别装置,其特征在于,包括:
第一获取模块,用于获取待处理单据信息;
解析模块,用于根据预设变量,解析所述单据信息,生成所述单据...
【专利技术属性】
技术研发人员:郭玮,高宇航,张丙松,
申请(专利权)人:北京新致君阳信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。