研究报告的标签生成方法技术

技术编号:39595227 阅读:11 留言:0更新日期:2023-12-03 19:53
本申请提供了一种研究报告的标签生成方法

【技术实现步骤摘要】
研究报告的标签生成方法、装置及电子设备


[0001]本申请涉及金融
,尤其是涉及一种研究报告的标签生成方法

装置及电子设备


技术介绍

[0002]随着业务深耕某一行业场景,对该行业的调研分析也不断深入,产生了很多有价值的行业研究报告

比如,金融行业在开展互联网金融的过程中,随着业务不断深化融合,涌现出诸多有行业价值的金融研究报告,然而现有技术中,对于研究报告的标注往往只依赖于所提关键词或报告中的高频词,报告标注精准性不高,因而其使用上也效果不佳


技术实现思路

[0003]本申请的目的在于提供一种研究报告的标签生成方法

装置及电子设备,能够实现研究报告的精准标签标注,从而提高研究报告的应用效果

[0004]第一方面,本申请实施例提供一种研究报告的标签生成方法,方法包括:获取目标研究报告对应的第一分词标签信息

第二分词标签信息和第三分词标签信息;其中,第一分词标签信息为通过预设分词应用服务进行专家分词处理后得到的;第二分词标签信息为通过预设分词算法进行分词处理后得到的高频分词标签;第三分词标签信息为通过多维度语义分析的知识图谱技术处理后得到的;将第一分词标签信息

第二分词标签信息和第三分词标签信息进行合并去重处理,得到目标研究报告对应的目标分词标签信息

[0005]在本申请较佳的实施方式中,上述获取目标研究报告对应的第一分词标签信息的步骤,包括:将目标研究报告上传至预设分词应用服务,以使相关行业专家人工对目标研究报告进行分词打标处理,得到目标研究报告对应的第一分词标签信息

[0006]在本申请较佳的实施方式中,上述获取目标研究报告对应的第二分词标签信息的步骤,包括:通过预设分词算法,对目标研究报告进行分词处理,得到分词结果;从分词结果中筛选出现频次超过预设阈值的分词,作为目标研究报告的第二分词标签信息

[0007]在本申请较佳的实施方式中,上述获取目标研究报告对应的第三分词标签信息的步骤,包括:获取目标研究报告对应的报告相关信息;报告相关信息至少包括以下之一:报告主题

报告名称

报表简述

报告详情;采用多维度语义分析的知识图谱技术对报告相关信息进行实体

概念

关系分析,并构建报告语义知识网络,生成报告特征数据集;将报告特征数据集作为目标研究报告对应的第三分词标签信息

[0008]在本申请较佳的实施方式中,上述将第一分词标签信息

第二分词标签信息和第三分词标签信息进行合并去重处理,得到目标研究报告对应的目标分词标签信息的步骤,包括:将第一分词标签信息和第二分词标签信息进行第一合并去重处理,得到第一合并去重标签结果;将第一合并去重标签结果和第三分词标签信息进行第二合并去重处理,得到第二合并去重标签结果;将第二合并去重标签结果作为目标研究报告对应的目标分词标签信息

[0009]在本申请较佳的实施方式中,上述合并去重处理的过程如下:将两个分词标签信息均上传至标签系统,以使标签系统基于两个分词标签信息进行标签加工,以进行合并

去重

关联报告处理,得到合并去重标签结果

[0010]在本申请较佳的实施方式中,上述得到目标研究报告对应的目标分词标签信息的步骤之后,还包括:响应针对目标研究报告的标签查询请求,将目标研究报告对应的目标分词标签信息进行展示

[0011]第二方面,本申请实施例还提供一种研究报告的标签生成装置,装置包括:分词标签获取模块,用于获取目标研究报告对应的第一分词标签信息

第二分词标签信息和第三分词标签信息;其中,第一分词标签信息为通过预设分词应用服务进行分词处理后得到的;第二分词标签信息为通过预设分词算法进行分词处理后得到的高频分词标签;第三分词标签信息为通过多维度语义分析的知识图谱技术处理后得到的;标签合并去重模块,用于将第一分词标签信息

第二分词标签信息和第三分词标签信息进行合并去重处理,得到目标研究报告对应的目标分词标签信息

[0012]第三方面,本申请实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述第一方面所述的方法

[0013]第四方面,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述第一方面所述的方法

[0014]本申请实施例提供的研究报告的标签生成方法

装置及电子设备中,首先获取通过预设分词应用服务对目标研究报告进行专家分词处理后得到的第一分词标签信息,获取通过预设分词算法对目标研究报告进行分词处理后得到的高频分词标签组成的第二分词标签信息,获取通过多维度语义分析的知识图谱技术对目标研究报告处理后得到的第三分词标签信息;然后将第一分词标签信息

第二分词标签信息和第三分词标签信息进行合并去重处理,得到目标研究报告对应的目标分词标签信息

这种方式可以将多种提取标签方式处理得到的标签信息进行融合,提高研究报告的标签标精准性,从而提高研究报告的应用效果

附图说明
[0015]为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0016]图1为本申请实施例提供的一种研究报告的标签生成方法的流程图;
[0017]图2为本申请实施例提供的一种研究报告的标签生成方法中第二分词标签信息的获取方式的流程图;
[0018]图3为本申请实施例提供的一种研究报告的标签生成方法中第三分词标签信息的获取方式的流程图;
[0019]图4为本申请实施例提供的一种研究报告的标签生成方法中合并去重方式的流程
图;
[0020]图5为本申请实施例提供的一种研究报告的标签生成装置的结构框图;
[0021]图6为本申请实施例提供的一种电子设备的结构示意图

具体实施方式
[0022]下面将结合实施例对本申请的技术方案进行清楚

完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例

基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种研究报告的标签生成方法,其特征在于,所述方法包括:获取目标研究报告对应的第一分词标签信息

第二分词标签信息和第三分词标签信息;其中,所述第一分词标签信息为通过预设分词应用服务进行专家分词处理后得到的;所述第二分词标签信息为通过预设分词算法进行分词处理后得到的高频分词标签;所述第三分词标签信息为通过多维度语义分析的知识图谱技术处理后得到的;将所述第一分词标签信息

所述第二分词标签信息和所述第三分词标签信息进行合并去重处理,得到所述目标研究报告对应的目标分词标签信息
。2.
根据权利要求1所述的方法,其特征在于,获取目标研究报告对应的第一分词标签信息的步骤,包括:将所述目标研究报告上传至所述预设分词应用服务,以使相关行业专家人工对所述目标研究报告进行分词打标处理,得到所述目标研究报告对应的第一分词标签信息
。3.
根据权利要求1所述的方法,其特征在于,获取目标研究报告对应的第二分词标签信息的步骤,包括:通过预设分词算法,对所述目标研究报告进行分词处理,得到分词结果;从所述分词结果中筛选出现频次超过预设阈值的分词,作为所述目标研究报告的第二分词标签信息
。4.
根据权利要求1所述的方法,其特征在于,获取目标研究报告对应的第三分词标签信息的步骤,包括:获取所述目标研究报告对应的报告相关信息;所述报告相关信息至少包括以下之一:报告主题

报告名称

报表简述

报告详情;采用多维度语义分析的知识图谱技术对所述报告相关信息进行实体

概念

关系分析,并构建报告语义知识网络,生成报告特征数据集;将所述报告特征数据集作为所述目标研究报告对应的第三分词标签信息
。5.
根据权利要求1所述的方法,其特征在于,将所述第一分词标签信息

所述第二分词标签信息和所述第三分词标签信息进行合并去重处理,得到所述目标研究报告对应的目标分...

【专利技术属性】
技术研发人员:刘文渊田鸥苏志锋
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1