模型的训练方法、装置、存储介质、电子装置及计算机程序产品制造方法及图纸

技术编号:42377661 阅读:11 留言:0更新日期:2024-08-16 15:02
本发明专利技术实施例提供了一种模型的训练方法、装置、存储介质、电子装置及计算机程序产品,其中,该方法包括:对获取到的文本数据中包括的每个目标文本按照预定长度进行切分,得到多个目标子文本;对多个目标子文本的嵌入向量进行整合,得到目标文本嵌入向量;在目标文本嵌入向量中包括的正样本数量以及负样本数量失衡的情况下,对目标文本嵌入向量进行失衡纠正,得到纠正文本嵌入向量;基于纠正文本嵌入向量以及纠正文本嵌入向量的标签信息训练初始模型,得到目标模型。通过本发明专利技术,解决了相关技术中存在的深度学习模型识别企业风险不准确的问题,达到提高识别企业风险的准确率的效果。

【技术实现步骤摘要】

本专利技术实施例涉及金融领域,具体而言,涉及一种模型的训练方法、装置、存储介质、电子装置及计算机程序产品


技术介绍

1、随着人工智能技术的发展,对文本数据的人为审核逐渐被淘汰,借助科技的力量优化财务风险识别自动化流程越来越完善。在相关技术中,可以利用深度学习模型对文本数据进行识别,以确定企业是否存在风险。

2、然而,在相关技术中存在深度学习模型识别企业风险不准确的问题。

3、针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。


技术实现思路

1、本专利技术实施例提供了一种模型的训练方法、装置、存储介质、电子装置及计算机程序产品,以至少解决相关技术中存在的深度学习模型识别企业风险不准确的问题。

2、根据本专利技术的一个实施例,提供了一种模型的训练方法,包括:对获取到的文本数据中包括的每个目标文本按照预定长度进行切分,得到多个目标子文本;对多个所述目标子文本的嵌入向量进行整合,得到目标文本嵌入向量;在所述目标文本嵌入向量中包括的正样本数量以及负样本数量失衡的情况下,对所本文档来自技高网...

【技术保护点】

1.一种模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,对获取到的文本数据中包括的每个目标文本按照预定长度进行切分,得到多个目标子文本包括:

3.根据权利要求1所述的方法,其特征在于,对多个所述目标子文本的嵌入向量进行整合,得到目标文本嵌入向量包括:

4.根据权利要求1所述的方法,其特征在于,对所述目标文本嵌入向量进行失衡纠正,得到纠正文本嵌入向量包括:

5.根据权利要求4所述的方法,其特征在于,在所述第二子嵌入向量中添加扰动,得到第三子嵌入向量包括:

6.根据权利要求1所述的方法,其特征在于,基于...

【技术特征摘要】

1.一种模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,对获取到的文本数据中包括的每个目标文本按照预定长度进行切分,得到多个目标子文本包括:

3.根据权利要求1所述的方法,其特征在于,对多个所述目标子文本的嵌入向量进行整合,得到目标文本嵌入向量包括:

4.根据权利要求1所述的方法,其特征在于,对所述目标文本嵌入向量进行失衡纠正,得到纠正文本嵌入向量包括:

5.根据权利要求4所述的方法,其特征在于,在所述第二子嵌入向量中添加扰动,得到第三子嵌入向量包括:

6.根据权利要求1所述的方法,其特征在于,基于所述纠正文本嵌入向量以及所述纠正文本嵌入向量的标签信息训练初始模型,得到目标模型包括:

7.根据权利要求1所述的方法,其特征在于,在基于所述纠正文本嵌入向量以...

【专利技术属性】
技术研发人员:田雨
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1