数据处理方法、系统、服务器及介质技术方案

技术编号:37984757 阅读:22 留言:0更新日期:2023-06-30 09:59
本申请实施例提供数据处理方法、系统、服务器及介质。该方法包括:获取用于为同一类上市公司构建股票主题指数的主题信息、用于描述主题信息的主题关键词以及待构建主题指数的目标上市公司相关的目标文档;其中,主题关键词是预先从已创建主题指数的参考上市公司相关的参考文档中抽取到的;将目标文档和主题关键词输入预训练的打分模型,得到各主题信息对应的主题分值;根据各主题信息对应的主题分值,确定用于构建目标上市公司对应的主题指数的主题信息。构建主题指数时,利用得到的主题关键词以及目标文档来对目标上市公司对应的主题信息打分,根据主题分值大小确定目标上市公司对应的主题信息,能够提高主题指数构建工作效率,降低人工成本。降低人工成本。降低人工成本。

【技术实现步骤摘要】
数据处理方法、系统、服务器及介质


[0001]本申请涉及计算机
,尤其涉及数据处理方法、系统、服务器及介质。

技术介绍

[0002]在股票中,往往通过主题指数全面了解某一类型公司整体指数情况。然而,主题指数的构建过程比较繁琐,需要充分了解该公司的产品构成。尤其一些大型公司,所涉及的产品内容和类型都很复杂。想要准确确定该公司的主题类型,需要很多专业人员对该公司产品构成进行充分解读后确定。此外,由于公司多元化产品发展需求,各项产品占比会根据市场行情进行动态调整,那么调整后该公司对应的主题也会发生相应变化,则需要专业人员对主题做相应调整。

技术实现思路

[0003]为解决或改善现有技术中存在的问题,本申请各实施例提供了数据处理方法、系统、服务器及介质。
[0004]第一方面,在本申请的一个实施例中,提供了一种数据处理方法。该方法包括:
[0005]获取用于为同一类上市公司构建股票主题指数的主题信息、用于描述所述主题信息的主题关键词以及待构建所述主题指数的目标上市公司相关的目标文档;其中,所述主题关键词是预先从已创本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取用于为同一类上市公司构建股票主题指数的主题信息、用于描述所述主题信息的主题关键词以及待构建主题指数的目标上市公司相关的目标文档;其中,所述主题关键词是预先从已创建所述主题指数的参考上市公司相关的参考文档中抽取到的;将所述目标文档和所述主题关键词输入预训练的打分模型进行匹配并打分,确定所述目标文档对应的至少一个所述主题信息以及各所述主题信息的主题分值;根据各所述主题信息对应的主题分值,确定用于构建所述目标上市公司对应的主题指数的主题信息。2.根据权利要求1所述的方法,其特征在于,获取用于为同一类上市公司构建股票主题指数的主题信息、用于描述所述主题信息的主题关键词以及待构建主题指数的目标上市公司相关的目标文档之前,还包括:当目标上市公司相关的目标文档信息更新时,或者,所述目标上市公司对应的主题信息更新时,生成所述主题关键词更新请求;响应于所述主题关键词更新请求,获取主题信息以及用于定义所述主题信息的所述参考文档;从所述参考文档提取用于描述所述主题信息的主题关键词。3.根据权利要求1或2所述的方法,其特征在于,所述目标文档包括:目标上市公司的财报文档、公告文档和研报文档中至少一个。4.根据权利要求1所述的方法,其特征在于,获取用于为同一类上市公司构建股票主题指数的主题信息、用于描述所述主题信息的主题关键词以及待构建主题指数的目标上市公司相关的目标文档之前,还包括:确定所述目标上市公司相关的原始文档;将所述原始文档转换为文本格式的所述目标文档;根据目标文档的文档类型,确定对所述目标文档的预处理方式。5.根据权利要求4所述的方法,其特征在于,所述根据目标文档的文档类型,确定对所述目标文档的预处理方式,包括:若所述目标文档的所述文档类型为财报文档,对...

【专利技术属性】
技术研发人员:徐阆平
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1