产业科技文本数据推送方法技术

技术编号:39573591 阅读:8 留言:0更新日期:2023-12-03 19:25
本公开的实施例公开了产业科技文本数据推送方法

【技术实现步骤摘要】
产业科技文本数据推送方法、装置、设备和介质


[0001]本公开的实施例涉及计算机
,具体涉及产业科技文本数据推送方法

装置

设备和介质


技术介绍

[0002]产业科技文本数据推送方法,是用于根据用户的需求,推送技术信息以供用户快速了解相关产业领域技术发展的一项技术

目前,在推送产业科技文本数据时,通常采用的方式为:首先,对产业领域内的相关科技文本资料进行抽取得到科技知识集

然后,将抽取到的科技知识集存储至关系数据库

最后,可以对关系数据库中的科技知识进行查询,并将查询到的科技数据直接推送至用户终端进行显示,以供用户查看并了解对应产业领域的科技发展情况

[0003]然而,专利技术人发现,当采用上述方式推送产业科技文本数据时,经常会存在如下技术问题:第一,由于同一产业领域内的科技知识间通常存在着大量多对多的关联关系,若采用关系数据库对科技知识进行存储,则需要通过多次查询或连接查询的方式获取科技数据,从而,导致数据查询耗时较长,难以及时推送科技数据;第二,由于在科技知识抽取过程中,通常采用关键字或模版的方式抽取实体间关系,从而,容易导致抽取结果数据缺失;第三,当查询到的产业科技数据的数据量较大时,若直接推送至用户终端,则会导致占用通信资源较多

[0004]该
技术介绍
部分中所公开的以上信息仅用于增强对本专利技术构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息


技术实现思路

[0005]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述

本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围

[0006]本公开的一些实施例提出了产业科技文本数据推送方法

装置

设备和介质,来解决以上
技术介绍
部分提到的技术问题中的一项或多项

[0007]第一方面,本公开的一些实施例提供了一种产业科技文本数据推送方法,该方法包括:获取产业科技文本知识数据集;确定上述产业科技文本知识数据集中的每个产业科技文本知识数据对应的目标知识信息,得到目标知识信息集;对上述目标知识信息集中的各个目标知识信息进行融合处理,得到融合知识信息集;基于上述融合知识信息集,生成知识图谱信息;对上述知识图谱信息进行图谱补全处理,得到目标知识图谱信息;响应于接收到数据查询请求,对上述目标知识图谱信息对应的知识图谱执行查询操作,以生成科技数据查询结果;对上述科技数据查询结果进行预处理,得到待显示科技数据结果;将上述待显
示科技数据结果推送至目标终端,以供显示

[0008]第二方面,本公开的一些实施例提供了一种产业科技文本数据推送装置,装置包括:获取单元,被配置成获取产业科技文本知识数据集;确定单元,被配置成确定上述产业科技文本知识数据集中的每个产业科技文本知识数据对应的目标知识信息,得到目标知识信息集;融合处理单元,被配置成对上述目标知识信息集中的各个目标知识信息进行融合处理,得到融合知识信息集;生成单元,被配置成基于上述融合知识信息集,生成知识图谱信息;图谱补全处理单元,被配置成对上述知识图谱信息进行图谱补全处理,得到目标知识图谱信息;执行单元,被配置成响应于接收到数据查询请求,对上述目标知识图谱信息对应的知识图谱执行查询操作,以生成科技数据查询结果;预处理单元,被配置成对上述科技数据查询结果进行预处理,得到待显示科技数据结果;推送单元,被配置成将上述待显示科技数据结果推送至目标终端,以供显示

[0009]第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法

[0010]第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现上述第一方面任一实现方式所描述的方法

[0011]本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的产业科技文本数据推送方法,可以缩短数据查询耗时,及时推送科技数据

具体来说,造成数据查询耗时较长,难以及时推送科技数据的原因在于:由于同一产业领域内的科技知识间通常存在着大量多对多的关联关系,若采用关系数据库对科技知识进行存储,则需要通过多次查询或连接查询的方式获取科技数据,从而,导致数据查询耗时较长,难以及时推送科技数据

基于此,本公开的一些实施例的产业科技文本数据推送方法,首先,获取产业科技文本知识数据集

由此,可以得到用于后续抽取科技知识的各个源数据

其次,确定上述产业科技文本知识数据集中的每个产业科技文本知识数据对应的目标知识信息,得到目标知识信息集

由此,可以得到每个源数据抽取到的科技知识

然后,对上述目标知识信息集中的各个目标知识信息进行融合处理,得到融合知识信息集

由此,可以得到对应各个源数据的实体对齐且去除冗余数据后的科技数据,便于后续进行查询以供显示给用户进行查看科技数据

接着,基于上述融合知识信息集,生成知识图谱信息

由此,可以得到构建知识图谱的基础数据

再接着,对上述知识图谱信息进行图谱补全处理,得到目标知识图谱信息

由此,可以得到更为全面的知识图谱,以便后续显示给用户

之后,响应于接收到数据查询请求,对上述目标知识图谱信息对应的知识图谱执行查询操作,以生成科技数据查询结果

由此,便于后续对与查询需求对应的科技知识进行显示

接着,对上述科技数据查询结果进行预处理,得到待显示科技数据结果

由此,便于后续直观显示科技数据

最后,将上述待显示科技数据结果推送至目标终端,以供显示

因此,本公开的一些实施例的产业科技文本数据推送方法,可以通过构建知识图谱的方式,更好的展示产业科技知识网络,且通过图搜索可以快速在知识图谱中查询到所需的科技知识,而无需针对一个查询需求进行多次查询或连接查询

从而,可以缩短数据查询耗时

进而,可以及时向用户推送科技数据,以供显示给用户了解对应产业领域的科技发展现状

附图说明
[0012]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征

优点及方面将变得更加明显

贯穿附图中,相同或相似的附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种产业科技文本数据推送方法,包括:获取产业科技文本知识数据集;确定所述产业科技文本知识数据集中的每个产业科技文本知识数据对应的目标知识信息,得到目标知识信息集;对所述目标知识信息集中的各个目标知识信息进行融合处理,得到融合知识信息集;基于所述融合知识信息集,生成知识图谱信息;对所述知识图谱信息进行图谱补全处理,得到目标知识图谱信息;响应于接收到数据查询请求,对所述目标知识图谱信息对应的知识图谱执行查询操作,以生成科技数据查询结果;对所述科技数据查询结果进行预处理,得到待显示科技数据结果;将所述待显示科技数据结果推送至目标终端,以供显示
。2.
根据权利要求1所述的方法,其中,所述确定所述产业科技文本知识数据集中的每个产业科技文本知识数据对应的目标知识信息,包括:将所述产业科技文本知识数据输入至预先训练完成的文本实体关系信息生成模型,以生成文本实体关系信息,其中,所述文本实体关系信息包括文本实体信息组和文本关系信息组;基于所述产业科技文本知识数据和所述文本实体信息组,生成知识实体信息组;基于所述知识实体信息组和所述文本关系信息组,生成实体间关系信息组;将所述知识实体信息组和所述实体间关系信息组确定为目标知识信息
。3.
根据权利要求2所述的方法,其中,所述对所述目标知识信息集中的各个目标知识信息进行融合处理,得到融合知识信息集,包括:确定所述目标知识信息集中的

每个知识实体信息组对应的更新知识实体信息组,得到更新知识实体信息组集;基于所述更新知识实体信息组集和所述目标知识信息集中的

各个实体间关系信息组,生成更新实体间关系信息组集;对所述更新实体间关系信息组集中的各个更新实体间关系信息进行去冗处理,得到目标实体间关系信息集;对于所述目标实体间关系信息集中的每个目标实体间关系信息,执行以下步骤:从所述更新知识实体信息组集对应的各个更新知识实体信息中

选出与所述目标实体间关系信息相匹配的更新知识实体信息,作为关联知识实体信息,得到关联知识实体信息组;基于所述关联知识实体信息组和所述目标实体间关系信息,生成融合知识信息
。4.
根据权利要求3所述的方法,其中,所述基于所述关联知识实体信息组和所述目标实体间关系信息,生成融合知识信息,包括:对所述关联知识实体信息组进行分类,得到第一关联知识实体信息组和第二关联知识实体信息组;对所述第一关联知识实体信息组中的各个第一关联知识实体信息进行融合处理,得到第一实体信息;对所述第二关联知识实体信息组中的各个第二关联知识实体信息进行融合处理,得到
第二实体信息;将所述第一实体信息

所述第二实体信息和所述目标实体间关系信息确定为融合知识信息
。5.
根据权利要求1所述的方法,其中,所述对所述知识图谱信息进行图谱补全处理,得到目标知识图谱信息,包括:基于所述知识图谱信息,生成待确认实体关系信息集;对于所述待确认实体关系信息集中的每个...

【专利技术属性】
技术研发人员:黄震杨秀丽朱玉芳
申请(专利权)人:北京中企慧云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1