System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于知识图谱的信息捕捉方法、装置及计算机设备制造方法及图纸_技高网

一种基于知识图谱的信息捕捉方法、装置及计算机设备制造方法及图纸

技术编号:42457110 阅读:16 留言:0更新日期:2024-08-21 12:47
本公开涉及网络信息处理技术领域,尤其涉及一种基于知识图谱的信息捕捉方法、装置及计算机设备,本方法首先从预构建的知识图谱中获取关键词;其次以关键词为索引,从持续更新的网络数据中捕捉舆情信息;最后将从舆情信息中提取的三元组信息更新至知识图谱中;本实施例通过上述的方式,从持续捕捉的舆情信息中提取时效性较高三元组信息,利用三元组信息完成了对知识图谱不断扩展,提高了知识图谱的完整性;并且,随着不断扩展知识图谱,使得下一次获取的关键词能够紧跟网络话题的演变和发展,从而保证了以关键词为索引捕捉的舆情信息的时效性和准确性,进而使得对舆情信息的分析结果具有更高的参考价值。

【技术实现步骤摘要】

本公开涉及网络信息处理,尤其涉及一种基于知识图谱的信息捕捉方法、装置及计算机设备


技术介绍

1、随着互联网技术的飞速发展,社交媒体、新闻网站和论坛等平台成为人们分享观点和交流思想的重要场所,对该类平台上的舆情信息进行分析成为了解公众意见、预测事情发展趋势等的关键。

2、当前主要通过舆情监控系统完成对舆情信息的实时捕捉和分析,且舆情监控系统多依赖于人工整理的关键词列表和规则配置进行信息捕捉。但该方法存在着明显的局限性,如,关键词和配置规则难以覆盖所有潜在的关键词和话题,且随着网络语言的快速演变和新话题的持续涌现,原定的关键词列表和规则配置很难迅速适应语境的变化,影响了信息捕捉的时效性和准确性。

3、如何避免上述问题,给出一种能随着时间发展有效采集信息的方法,成为当前要解决的问题。


技术实现思路

1、为了解决上述技术问题,本公开提供了一种基于知识图谱的信息捕捉方法、装置及计算机设备。

2、第一方面,本专利技术提供了一种基于知识图谱的信息捕捉方法,包括:

3、从预构建的知识图谱中获取关键词;以关键词为索引,从网络数据中捕捉包含关键词的舆情信息;从舆情信息中提取三元组信息;根据三元组信息对知识图谱进行更新,以从更新后的知识图谱中重新获取关键词进行信息捕捉。

4、本实施例提供的基于知识图谱的信息捕捉方法,首先从预构建的知识图谱中获取关键词;其次以关键词为索引,从持续更新的网络数据中捕捉舆情信息;最后将从舆情信息中提取的三元组信息更新至知识图谱中;本实施例通过上述的方式,从持续捕捉的舆情信息中提取时效性较高三元组信息,利用三元组信息完成了对知识图谱不断扩展,提高了知识图谱的完整性;并且,随着不断扩展知识图谱,使得下一次获取的关键词能够紧跟网络话题的演变和发展,从而保证了以关键词为索引捕捉的舆情信息的时效性和准确性,进而使得对舆情信息的分析结果具有更高的参考价值。

5、在一可选的实施方式中,方法还包括:

6、当关键词为至少两个时,获取索引逻辑;基于关键词和索引逻辑构建索引式;从网络数据中捕捉符合索引式的舆情信息。

7、本实施例提供的基于知识图谱的信息捕捉方法,给出了当关键词为至少两个时,基于关键词捕捉舆情信息的一种实施方式,该方式根据符合用户意愿的索引逻辑,根据由索引逻辑和关键词构建的索引式完成舆情信息捕捉,使得最终得到的舆情信息满足用户需求,准确性更高。

8、在一可选的实施方式中,知识图谱通过如下方式构建:

9、获取预设场景对应的网络数据;从网络数据中提取三元组信息;根据三元组信息构建知识图谱。

10、在一可选的实施方式中,从网络数据中提取三元组信息,包括:

11、获取网络数据的数据形式;利用与数据形式对应的处理方式对网络数据进行处理,得到与网络数据对应的三元组信息。

12、在一可选的实施方式中,从舆情信息中提取三元组信息,包括:

13、将舆情信息输入至预训练的信息抽取模型中,提取舆情信息中包含的三元组信息。

14、在一可选的实施方式中,在将舆情信息输入至预训练的信息抽取模型之后,方法还包括:

15、输出三元组信息对应的置信度,置信度用于表征三元组信息的准确度。

16、在一可选的实施方式中,方法还包括:

17、将置信度高于预设阈值的三元组信息更新至知识图谱中。

18、在一可选的实施方式中,在以关键词为索引,从网络数据中捕捉包含关键词的舆情信息之后,方法还包括:

19、对舆情信息进行情感倾向分析。

20、第二方面,本专利技术提供了一种基于知识图谱的信息捕捉装置,包括:

21、第一获取模块,用于从预构建的知识图谱中获取关键词;第一捕捉模块,用于以关键词为索引,从网络数据中捕捉包含关键词的舆情信息;第一提取模块,用于从舆情信息中提取三元组信息;第一更新模块,用于根据三元组信息对知识图谱进行更新,以从更新后的知识图谱中重新获取关键词进行信息捕捉。

22、第三方面,本专利技术提供了一种计算机设备,包括:

23、存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而
技术实现思路
第一方面中任一实施方式的基于知识图谱的信息捕捉方法。

本文档来自技高网...

【技术保护点】

1.一种基于知识图谱的信息捕捉方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述知识图谱通过如下方式构建:

4.根据权利要求3所述的方法,其特征在于,所述从所述网络数据中提取三元组信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述从所述舆情信息中提取三元组信息,包括:

6.根据权利要求5所述的方法,其特征在于,在所述将所述舆情信息输入至预训练的信息抽取模型之后,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1所述的方法,其特征在于,在所述以所述关键词为索引,从网络数据中捕捉包含所述关键词的舆情信息之后,所述方法还包括:

9.一种基于知识图谱的信息捕捉装置,其特征在于,包括:

10.一种计算机设备,其特征在于,包括:

【技术特征摘要】

1.一种基于知识图谱的信息捕捉方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述知识图谱通过如下方式构建:

4.根据权利要求3所述的方法,其特征在于,所述从所述网络数据中提取三元组信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述从所述舆情信息中提取三元组信息,包括:

6.根据权利要...

【专利技术属性】
技术研发人员:雷涛谭可华耿宗可
申请(专利权)人:天云融创数据科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1