一种数据分级分类方法、装置、设备及存储介质制造方法及图纸

技术编号:32222104 阅读:26 留言:0更新日期:2022-02-09 17:27
本发明专利技术实施例涉及人工智能机器学习模型技术领域,尤其涉及一种数据分级分类方法、装置、设备及存储介质。该方法包括获取金融领域的数据项;将数据项输入至预训练完成的分级分类模型中,根据分级分类模型确定数据项的预分级分类结果;通过页面,向用户推荐数据项的一个或多个候选分级分类结果,候选分级分类结果至少包括预分级分类结果;获取用户从候选分级分类结果中选择确认的目标分级分类结果,并将目标分级分类结果更新至反馈训练集;基于反馈训练集,对分级分类模型进行训练更新。本发明专利技术实施例的技术方案,以实现企业级数据的自动分级分类,起到降本增效的效果。起到降本增效的效果。起到降本增效的效果。

【技术实现步骤摘要】
一种数据分级分类方法、装置、设备及存储介质


[0001]本专利技术实施例涉及人工智能机器学习模型
,尤其涉及一种数据分级分类方法、装置、设备及存储介质。

技术介绍

[0002]现有企业级数据分级分类大都通过业务人员凭借经验进行判断,严重依赖业务人员的专业水平,同时此项工作耗时耗力,并不能起到预期的效果。
[0003]人工标记需要有足够经验的业务人员判断每一个数据项的分级分类情况,首先需要从整个分类体系中寻找适合的分类,再从中判断分级情况,耗时耗力,对于存量数据的分级分类判断需要耗费大量的人力财力才能构建适合本企业的数据分级分类。

技术实现思路

[0004]本专利技术实施例提供了一种数据分级分类方法、装置、设备及存储介质,以实现企业级数据的自动分级分类,起到降本增效的效果。
[0005]第一方面,本专利技术实施例提供一种数据分级分类方法,包括:
[0006]获取金融领域的数据项;
[0007]将所述数据项输入至预训练完成的分级分类模型中,根据所述分级分类模型确定所述数据项的预分级分类结果;...

【技术保护点】

【技术特征摘要】
1.一种数据分级分类方法,其特征在于,包括:获取金融领域的数据项;将所述数据项输入至预训练完成的分级分类模型中,根据所述分级分类模型确定所述数据项的预分级分类结果;通过页面,向用户推荐所述数据项的一个或多个候选分级分类结果,所述候选分级分类结果至少包括所述预分级分类结果;获取用户从所述候选分级分类结果中选择确认的目标分级分类结果,并将所述目标分级分类结果更新至反馈训练集;基于所述反馈训练集,对所述分级分类模型进行训练更新。2.根据权利要求1所述的方法,其特征在于,所述将所述目标分级分类结果更新至反馈训练集包括:判断所述目标分级分类结果是否与预分级分类结果一致;若不一致,则将所述目标分级分类结果更新至反馈训练集。3.根据权利要求1所述的方法,其特征在于,通过页面,向用户推荐所述数据项的一个或多个候选分级分类结果之前,还包括:根据所述预分级分类结果,确定相似的其他分级分类结果,作为所述候选分级分类结果。4.根据权利要求3所述的方法,其特征在于,根据所述预分级分类结果,确定相似的其他分级分类结果,作为所述候选分级分类结果包括:根据所述预分级分类结果,在预设的分级分类体系中,确定在上级和下级的分类结果中,确定其他分级分类结果,作为所述候选分级分类结果。5.根据权利要求1所述的方法,其特征在于,还包括所述分级分类模型的预训练过程,所述预训练过程包括:获取金融领域的数据项集合作为预训练集;采用所述预训练集,对所述分级分类模型进行训练。6.根据权利要求5所述的方法,其特征在于,采用所述预训练集,对所述分级分类模型进行训练之前,还包括:将已获取的数据项进行分词处理,以确定所述数据项的中文名称、英文名称、定义和目的,作为数据项属性;使用数据增强方法,将所述数据项属性进行顺序调整,以形成新的数据项,添加至预训练集中。7.根据权利要求6所述的方法,其特征在于,所述分词处理通...

【专利技术属性】
技术研发人员:黄荣煌陈启达刘碧春傅立霖王超林
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1