数据处理方法与装置、存储介质、电子设备制造方法及图纸

技术编号:23401343 阅读:18 留言:0更新日期:2020-02-22 13:28
本公开属于计算机技术领域,涉及一种数据处理方法及装置、计算机可读存储介质、电子设备。该方法包括:利用特征数据训练待训练机器学习模型,以确定训练好的目标机器学习模型;确定并获取目标参数,以得到与目标参数对应的目标特征数据;将目标特征数据输入至目标机器学习模型中,以得到与目标参数对应的评估概率;获取与评估概率对应的阈值,将评估概率大于阈值的对象确定为目标对象。本公开基于训练好的目标机器学习模型,通过目标特征数据确定评估概率,不仅提高了目标对象提取的准确性,平衡了评估效果和时效性要求,还防范了目标对象确定不准确带来的风险,可以更好的进行识别评估。

Data processing methods and devices, storage media, electronic equipment

【技术实现步骤摘要】
数据处理方法与装置、存储介质、电子设备
本公开涉及计算机
,尤其涉及一种数据处理方法与数据处理装置、计算机可读存储介质及电子设备。
技术介绍
目前,对于审核对象的确定主要依赖于审核人员的专业经验判断,人工提取调查名单,尤其是在确定健康险的承保后出险前评估和理赔风险评估的审核对象方面。随着健康险案件量激增,审核工作量和调查工作量也随之迅速增长,人力紧张和工作负荷大的问题逐渐凸显,风控水平亟待提高。考虑到传统的逻辑回归算法不具有特征组合的能力,并需假设特征的各个维度独立,因此只具有线性分界面,主要应用于特征稀疏的数据上。但在健康险的承保后出险前风险评估和理赔风险评估的应用场景中,多数特征之间有相关性,逻辑回归算法无法满足这一要求进行评估。鉴于此,本领域亟需开发一种新的数据处理方法及装置。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种数据处理方法、数据处理装置、计算机可读存储介质及电子设备,进而至少在一定程度上克服由于相关技术的限制而导致的人工提取调查名单工作量大的问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本专利技术实施例的第一个方面,提供一种数据处理方法,所述方法包括:利用特征数据训练待训练机器学习模型,以确定训练好的目标机器学习模型;确定并获取目标参数,以得到与所述目标参数对应的目标特征数据;将所述目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的评估概率;获取与所述评估概率对应的阈值,将所述评估概率大于所述阈值的对象确定为目标对象。在本专利技术的一种示例性实施例中,所述目标特征数据包括第一目标特征数据,所述评估概率包括第一评估概率,所述将所述目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的评估概率,包括:将所述第一目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的第一评估概率。在本专利技术的一种示例性实施例中,所述确定并获取目标参数,包括:在数据库中获取参数,并判断所述参数是否满足预设条件;若所述参数满足所述预设条件,将所述参数确定为目标参数。在本专利技术的一种示例性实施例中,所述目标特征数据包括第二目标特征数据,所述评估概率包括第二评估概率,所述将所述目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的评估概率,包括:将所述第二目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的第二评估概率。在本专利技术的一种示例性实施例中,所述利用特征数据训练待训练机器学习模型,以确定训练好的目标机器学习模型,包括:获取历史参数,并获取与所述历史参数对应的历史数据;对所述历史数据打标签,以确定与所述历史参数对应的标签信息;利用所述标签信息与所述特征数据训练待训练机器学习模型,以确定训练好的目标机器学习模型。在本专利技术的一种示例性实施例中,所述对所述历史数据打标签,以确定与所述历史参数对应的标签信息,包括:基于第一标签规则,对所述历史数据打标签,并确定与所述历史参数对应的第一标签信息;基于第二标签规则,对所述历史数据打标签,并确定与所述历史参数对应的第二标签信息。在本专利技术的一种示例性实施例中,在所述利用特征数据训练待训练机器学习模型之前,所述方法还包括:在数据库中,识别并获取待处理参数,并获取与所述待处理参数对应的待处理特征信息;预处理所述待处理特征信息,以获取所述特征数据。根据本专利技术实施例的第二个方面,提供一种数据处理装置,所述装置包括:模型训练模块,被配置为利用特征数据训练待训练机器学习模型,以确定训练好的目标机器学习模型;数据获取模块,被配置为确定并获取目标参数,以得到与所述目标参数对应的目标特征数据;风险评估模块,被配置为将所述目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的评估概率;对象确定模块,被配置为获取与所述评估概率对应的阈值,将所述评估概率大于所述阈值的对象确定为目标对象。根据本专利技术实施例的第三个方面,提供一种电子设备,包括:处理器和存储器;其中,存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现上述任意示例性实施例的数据处理方法。根据本专利技术实施例的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意示例性实施例中的数据处理方法。由上述技术方案可知,本专利技术示例性实施例中的数据处理方法、数据处理装置、计算机存储介质及电子设备至少具备以下优点和积极效果:在本公开的示例性实施例提供的方法及装置中,基于训练好的目标机器学习模型,通过目标特征数据确定评估概率。不仅提高了目标对象提取的准确性,平衡了评估效果和时效性要求,还防范了目标对象确定不准确带来的风险,可以更好的进行识别评估。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出本公开示例性实施例中一种数据处理方法的流程图;图2示意性示出本公开示例性实施例中确定训练好的机器学习模型的方法的流程示意图;图3示意性示出本公开示例性实施例中确定历史参数对应的标签信息的方法的流程示意图;图4示意性示出本公开示例性实施例中获取特征数据的方法的流程示意图;图5示意性示出本公开示例性实施例中获取目标参数的方法的流程示意图;图6示意性示出本公开示例性实施例中一种数据处理装置的结构示意图;图7示意性示出本公开示例性实施例中一种用于实现数据处理方法的电子设备;图8示意性示出本公开示例性实施例中一种用于实现数据处理方法的计算机可读存储介质。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。本说明书中使用用语“一个”、“一”、“该”和“所述”用以表示存在一个或多个要素/组成部分/等;用语“包括本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n利用特征数据训练待训练机器学习模型,以确定训练好的目标机器学习模型;/n确定并获取目标参数,以得到与所述目标参数对应的目标特征数据;/n将所述目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的评估概率;/n获取与所述评估概率对应的阈值,将所述评估概率大于所述阈值的对象确定为目标对象。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
利用特征数据训练待训练机器学习模型,以确定训练好的目标机器学习模型;
确定并获取目标参数,以得到与所述目标参数对应的目标特征数据;
将所述目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的评估概率;
获取与所述评估概率对应的阈值,将所述评估概率大于所述阈值的对象确定为目标对象。


2.根据权利要求1所述的数据处理方法,其特征在于,所述目标特征数据包括第一目标特征数据,所述评估概率包括第一评估概率,
所述将所述目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的评估概率,包括:
将所述第一目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的第一评估概率。


3.根据权利要求1所述的数据处理方法,其特征在于,所述确定并获取目标参数,包括:
在数据库中获取参数,并判断所述参数是否满足预设条件;
若所述参数满足所述预设条件,将所述参数确定为目标参数。


4.根据权利要求3所述的数据处理方法,其特征在于,所述目标特征数据包括第二目标特征数据,所述评估概率包括第二评估概率,
所述将所述目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的评估概率,包括:
将所述第二目标特征数据输入至所述目标机器学习模型中,以得到与所述目标参数对应的第二评估概率。


5.根据权利要求1所述的数据处理方法,其特征在于,所述利用特征数据训练待训练机器学习模型,以确定训练好的目标机器学习模型,包括:
获取历史参数,并获取与所述历史参数对应的历史数据;
对所述历史数据打标签,以确定与所述历史参数对应的标签信息...

【专利技术属性】
技术研发人员:周景朱建林柴敏李傲梅
申请(专利权)人:泰康保险集团股份有限公司泰康人寿保险有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1