System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于深度学习的基金名称概念提取方法、装置及相关介质制造方法及图纸_技高网

基于深度学习的基金名称概念提取方法、装置及相关介质制造方法及图纸

技术编号:41209735 阅读:2 留言:0更新日期:2024-05-09 23:31
本发明专利技术公开了基于深度学习的基金名称概念提取方法、装置及相关介质,该方法包括构建原始基金数据集,标注原始基金数据集中的概念词,得到训练基金数据集;对训练基金数据集进行数据预处理,得到基金预处理数据;构建基金概念提取模型,并利用基金预处理数据对基金概念提取模型进行训练优化,得到训练后的基金概念提取模型;利用训练后的基金概念提取模型对新输入的基金数据进行概念预测,得到模型预测结果;将模型预测结果进行概念词转换,得到基金名称概念提取结果。本发明专利技术通过将新输入的基金数据输入到训练后的基金概念提取模型中进行预测,并利用模型预测结果提取得到基金名称概念提取结果,如此,提高了基金概念提取的准确率,降低维护成本。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,特别涉及基于深度学习的基金名称概念提取方法、装置及相关介质


技术介绍

1、近年来,随着基金行业的迅速发展,基金产品数量和涉及的投资概念不断增多。通过分析基金申报资料中的投资领域信息,可以提取并统计申报基金的概念,从而掌握当前新发基金的热门概念和发展趋势,为基金产品的发行布局提供决策支持。

2、目前,基金概念的提取主要采用词典匹配方法,这种方法涉及收集大量历史基金概念词,需要构建trie词典树,然后通过trie词典树匹配基金名称和概念词。然而,词典匹配方法存在两个缺点:第一个是,词典匹配方法提取基金概念的准确率不高;第二个是,词典匹配方法只能提取已存在于词典中的概念,无法有效识别新出现的基金概念或同一概念的不同表达方式,并且需要人工不断更新词典以覆盖新发现的基金概念词,维护成本较高。


技术实现思路

1、本专利技术实施例提供了基于深度学习的基金名称概念提取方法、装置及相关介质,旨在解决现有技术中的基金概念提取方法准确率低下且维护成本较高的问题。

2、第一方面,本专利技术实施例提供了一种基于深度学习的基金名称概念提取方法,包括:

3、分别采集申报基金名称数据和发行基金名称数据,以构建原始基金数据集;

4、分别标注所述原始基金数据集中的每条基金数据的概念词,得到训练基金数据集;

5、对所述训练基金数据集进行数据预处理,得到基金预处理数据;

6、构建基金概念提取模型,并利用所述基金预处理数据对所述基金概念提取模型进行训练优化,得到训练后的基金概念提取模型;

7、利用所述训练后的基金概念提取模型对新输入的基金数据进行概念预测,得到模型预测结果;

8、将所述模型预测结果进行概念词转换,得到基金名称概念提取结果。

9、第二方面,本专利技术实施例提供了一种基于深度学习的基金名称概念提取装置,包括:

10、数据构建单元,用于分别采集申报基金名称数据和发行基金名称数据,以构建原始基金数据集;

11、数据标注单元,用于分别标注所述原始基金数据集中的每条基金数据的概念词,得到训练基金数据集;

12、数据处理单元,用于对所述训练基金数据集进行数据预处理,得到基金预处理数据;

13、模型训练单元,用于构建基金概念提取模型,并利用所述基金预处理数据对所述基金概念提取模型进行训练优化,得到训练后的基金概念提取模型;

14、模型预测单元,用于利用所述训练后的基金概念提取模型对新输入的基金数据进行概念预测,得到模型预测结果;

15、结果输出单元,用于将所述模型预测结果进行概念词转换,得到基金名称概念提取结果。

16、第三方面,本专利技术实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述第一方面的基于深度学习的基金名称概念提取方法。

17、第四方面,本专利技术实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述第一方面的基于深度学习的基金名称概念提取方法。

18、本专利技术实施例提供一种基于深度学习的基金名称概念提取方法,包括构建原始基金数据集,标注原始基金数据集中的概念词,得到训练基金数据集;对训练基金数据集进行数据预处理,得到基金预处理数据;构建基金概念提取模型,并利用基金预处理数据对基金概念提取模型进行训练优化,得到训练后的基金概念提取模型;利用训练后的基金概念提取模型对新输入的基金数据进行概念预测,得到模型预测结果;将模型预测结果进行概念词转换,得到基金名称概念提取结果。本专利技术通过将新输入的基金数据输入到训练后的基金概念提取模型中进行预测,并利用模型预测结果提取得到基金名称概念提取结果,如此,提高了基金概念提取的准确率,降低维护成本。

19、本专利技术实施例还提供一种基于深度学习的基金名称概念提取装置、计算机设备和存储介质,同样具有上述有益效果。

本文档来自技高网...

【技术保护点】

1.一种基于深度学习的基金名称概念提取方法,其特征在于,包括:

2.根据权利要求1所述的基于深度学习的基金名称概念提取方法,其特征在于,所述分别采集申报基金名称数据和发行基金名称数据,以构建原始基金数据集,包括:

3.根据权利要求1所述的基于深度学习的基金名称概念提取方法,其特征在于,所述分别标注所述原始基金数据集中的每条基金数据的概念词,得到训练基金数据集,包括:

4.根据权利要求1所述的基于深度学习的基金名称概念提取方法,其特征在于,所述构建基金概念提取模型,包括:

5.根据权利要求1所述的基于深度学习的基金名称概念提取方法,其特征在于,所述利用所述基金预处理数据对所述基金概念提取模型进行训练优化,得到训练后的基金概念提取模型,包括:

6.根据权利要求1所述的基于深度学习的基金名称概念提取方法,其特征在于,所述利用所述训练后的基金概念提取模型对新输入的基金数据进行概念预测,得到模型预测结果,还包括:

7.根据权利要求6所述的基于深度学习的基金名称概念提取方法,其特征在于,所述将所述模型预测结果进行概念词转换,得到基金名称概念提取结果,包括:

8.一种基于深度学习的基金名称概念提取装置,其特征在于,包括:

9.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于深度学习的基金名称概念提取方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于深度学习的基金名称概念提取方法。

...

【技术特征摘要】

1.一种基于深度学习的基金名称概念提取方法,其特征在于,包括:

2.根据权利要求1所述的基于深度学习的基金名称概念提取方法,其特征在于,所述分别采集申报基金名称数据和发行基金名称数据,以构建原始基金数据集,包括:

3.根据权利要求1所述的基于深度学习的基金名称概念提取方法,其特征在于,所述分别标注所述原始基金数据集中的每条基金数据的概念词,得到训练基金数据集,包括:

4.根据权利要求1所述的基于深度学习的基金名称概念提取方法,其特征在于,所述构建基金概念提取模型,包括:

5.根据权利要求1所述的基于深度学习的基金名称概念提取方法,其特征在于,所述利用所述基金预处理数据对所述基金概念提取模型进行训练优化,得到训练后的基金概念提取模型,包括:

6.根据权利要求1所述的基于深度学习的基金名称概念提...

【专利技术属性】
技术研发人员:何同飞姚树宇朱运运
申请(专利权)人:招商基金管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1