System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 金融数据样本分类方法、装置、计算机设备及存储介质制造方法及图纸_技高网

金融数据样本分类方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:40282175 阅读:7 留言:0更新日期:2024-02-07 20:36
本申请涉及金融数据分类技术领域,可以从不同角度挖掘出金融数据彼此之间的区别,从而更好的对数据进行分类,具体公开了一种金融数据样本分类方法、装置、设备及存储介质。该方法包括获取第一多语言模型、第二多语言模型、第三多语言模型,其中,第一多语言模型、第二多语言模型、第三多语言模型由不同金融数据训练样本训练得到;获取第一多语言模型、第二多语言模型、第三多语言模型的分类准确率;基于第一多语言模型、第二多语言模型、第三多语言模型的分类准确率,获取第一多语言模型、第二多语言模型、第三多语言模型的权重;将待分类的金融数据样本输入至确定权重后的第一多语言模型、第二多语言模型、第三多语言模型,以输出分类结果。

【技术实现步骤摘要】

本申请涉及金融数据分类或者医疗数据分类,尤其涉及一种金融数据样本分类方法、装置、计算机设备及存储介质


技术介绍

1、随着人工智能技术的发展与兴起,许多保险公司通过投喂大量数据投喂网络模型,使训练后的网络模型可以支持疾病辅助诊断、健康管理等功能。目前互联网上存在海量的金融领域的相关文字数据,例如金融领域的相关文字数据包括了信托证券、贷款、利率等。如果运用这些文字数据进行训练模型时,需要耗费大量的人力去标注样本再进行分类,然后利用这些分类后的样本训练模型,人力成本很高。这就导致开发人员需要开发某种模型时,会耗费大量的时间与精力。


技术实现思路

1、为了解决或者部分解决上述问题,本申请提供了一种金融数据样本分类方法、装置、计算机设备及存储介质,以能够快速对不同的语料样本进行分类。

2、第一方面,本申请提供了一种金融数据样本分类方法,所述方法包括:

3、获取由不同金融数据训练样本训练得到的第一多语言模型、第二多语言模型以及第三多语言模型;

4、获取第一多语言模型的第一分类准确率、第二多语言模型的第二分类准确率、第三多语言模型的第三分类准确率,所述第一分类准确率、第二分类准确率、第三分类准确率分别为对应多语言模型输出结果的准确率;

5、基于所述第一分类准确率、第二分类准确率、第三分类准确率,确定所述第一多语言模型的第一分类权重、所述第二多语言模型的第二分类权重以及所述第三多语言模型的第三分类权重;

6、将金融数据样本输入至确定权重后的第一多语言模型、第二多语言模型以及第三多语言模型,通过确定权重后的第一多语言模型、第二多语言模型以及第三多语言模型根据对应的权重关系,输出分类结果。

7、第二方面,本申请还提供了一种样本分类装置,所述装置包括:

8、获取模块,用于获取由不同金融数据训练样本训练得到的第一多语言模型、第二多语言模型以及第三多语言模型;

9、分类准确率模块,用于获取第一多语言模型的第一分类准确率、第二多语言模型的第二分类准确率、第三多语言模型的第三分类准确率,所述第一分类准确率、第二分类准确率、第三分类准确率分别为对应多语言模型输出结果的准确率;

10、权重模块,用于基于所述第一分类准确率、第二分类准确率、第三分类准确率,获取所述第一多语言模型的第一分类权重、所述第二多语言模型的第二分类权重以及所述第三多语言模型的第三分类权重;

11、输出模块,用于将金融数据样本输入至确定后的第一多语言模型、第二多语言模型以及第三多语言模型,通过确定后的第一多语言模型、第二多语言模型以及第三多语言模型根据对应的权重关系,输出分类结果。

12、第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的金融数据样本分类方法。

13、第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的金融数据样本分类方法。

14、本申请公开了一种金融数据样本分类方法、装置、计算机设备及存储介质,该方法通过不同金融数据样本训练得到第一多语言模型、第二多语言模型、第三多语言模型,然后根据第一多语言模型、第二多语言模型、第三多语言模型的权重,通过确定权重后的所述第一多语言模型、所述第二多语言模型、所述第三多语言模型输出分类结果;因不同金融数据样本训练得到的第一多语言模型、第二多语言模型、第三多语言模型,可以从不同角度挖掘出金融领域相关数据彼此之间的区别,从而能够快速、准确地对金融数据进行分类,并解决了金融数据进行标注分类需要耗费大量人力与精力的问题。

本文档来自技高网...

【技术保护点】

1.一种金融数据样本分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的金融数据样本分类方法,其特征在于,所述获取第一多语言模型的第一分类准确率,包括:

3.根据权利要求1所述的金融数据样本分类方法,其特征在于,在所述获取第二多语言模型的第二分类准确率的步骤之前,还包括:

4.根据权利要求3所述的金融数据样本分类方法,其特征在于,所述获取所述第二分类准确率,包括:

5.根据权利要求1所述的金融数据样本分类方法,其特征在于,在所述获取第三多语言模型的第三分类准确率的步骤之前,还包括:

6.根据权利要求1所述的金融数据样本分类方法,其特征在于,所述获取所述第一多语言模型的第一分类权重、所述第二多语言模型的第二分类权重以及所述第三多语言模型的第三分类权重,包括:

7.根据权利要求6所述的金融数据样本分类方法,其特征在于,所述通过确定权重后的第一多语言模型、第二多语言模型以及第三多语言模型根据对应的权重关系,输出分类结果,包括:

8.一种金融数据样本分类装置,其特征在于,包括:

9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至6中任一项所述的金融数据样本分类方法。

...

【技术特征摘要】

1.一种金融数据样本分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的金融数据样本分类方法,其特征在于,所述获取第一多语言模型的第一分类准确率,包括:

3.根据权利要求1所述的金融数据样本分类方法,其特征在于,在所述获取第二多语言模型的第二分类准确率的步骤之前,还包括:

4.根据权利要求3所述的金融数据样本分类方法,其特征在于,所述获取所述第二分类准确率,包括:

5.根据权利要求1所述的金融数据样本分类方法,其特征在于,在所述获取第三多语言模型的第三分类准确率的步骤之前,还包括:

6.根据权利要求1所述的金融数据样本分类方法,其特征在于,所述获取...

【专利技术属性】
技术研发人员:侯翠琴杜江楠李剑锋
申请(专利权)人:平安创科科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1