舆情关联方法、装置、可读存储介质及电子设备制造方法及图纸

技术编号:33541707 阅读:20 留言:0更新日期:2022-05-21 09:51
本发明专利技术提供了一种舆情关联方法、装置、可读存储介质及其电子设备,舆情关联方法包括:获取舆情文本,获取所述舆情文本中的多个实体,确定所述舆情文本与所述多个实体中的每个实体对应的信息标签,基于确定的所述信息标签,将所述舆情文本与所述信息标签对应的实体关联,以使用户通过所述实体对应的所述信息标签获取到舆情信息。采用本方法能够准确地确定出该舆情中相关的实体,并将舆情与该实体及实体对应的信息标签进行关联,避免了一些无关紧要的舆情新闻与其关系不大的实体进行关联事件的发生,以使用户可以通过信息标签获取到实体对应的关联舆情以及通过舆情获取到关键信息。息。息。

【技术实现步骤摘要】
舆情关联方法、装置、可读存储介质及电子设备


[0001]本专利技术涉及数据处理
,具体涉及一种舆情关联方法、装置、可读存储介质及其电子设备。

技术介绍

[0002]在企业详情页的舆情板块中,用户希望可以通过该舆情板块了解到一家企业近期发生的事件、新闻等。为了使用户及时了解该企业对应舆情新闻中的关键信息,需要将存在关键信息的舆情与企业对应,以供用户直观了解企业存在的正向信息和风险信息。然而互联网时代存在大量的舆情新闻,包括正面舆情和负面舆情,现有技术中并没有针对舆情新闻的关键信息进行筛选,就仅通过模型简单的对舆情中的实体进行识别,这样不仅存在企业与舆情对应错误的情况,而且也会将一些无关紧要的舆情新闻与其关系不大的实体进行关联;此外,当舆情新闻中出现多个实体的情况时,现有技术并不能准确判断出该舆情新闻所表达的语义倾向对应于多个实体中的哪个,从而无法与其对应的实体进行准确关联,导致风险信息的可信度低,给用户带来了诸多不便。由此可见,如何准确地将舆情与实体进行关联成为当前亟待解决的技术问题。

技术实现思路

[0003]本专利技术提供一种舆情关联方法、装置、可读存储介质及其电子设备,用以克服或者缓解现有技术中存在的上述技术问题。
[0004]根据本专利技术的一个方面,提供了一种舆情关联方法,所述方法包括:
[0005]获取舆情文本;
[0006]获取所述舆情文本中的多个实体;
[0007]确定所述舆情文本与所述多个实体中的每个实体对应的信息标签;
[0008]基于确定的所述信息标签,将所述舆情文本与所述信息标签对应的实体关联,以使用户通过所述实体对应的所述信息标签获取到舆情信息。
[0009]可选地,所述获取所述舆情文本中的多个实体,具体包括:
[0010]根据预设方式将所述舆情文本进行分句得到多个语句;
[0011]对所述多个语句中的每个语句根据句子构成方式进行分词;
[0012]根据分词结果中所述每个语句的谓语动词确定所述每个语句中出现的企业实体;
[0013]将确定的所有企业实体作为所述舆情文本中的多个实体。
[0014]可选地,所述根据预设方式将所述舆情文本进行分句得到多个语句,具体包括:
[0015]响应于舆情文本为中文文本,根据最终标识符对所述舆情文本进行分句得到多个语句;
[0016]响应于舆情文本为英文文本,根据预设标号和大写字母的组合方式对所述舆情文本进行分句得到多个语句。
[0017]可选地,所述将确定的所有企业实体作为所述舆情文本中的多个实体之后,还包
括:
[0018]确定所述多个实体中的各个实体在所述舆情文本中以所述第一人称视角出现的频次;
[0019]基于所述各个实体在所述舆情文本中以所述第一人称视角出现的频次,确定与所述舆情相关的最终实体。
[0020]可选地,所述方法还包括:
[0021]使用垃圾语料词集合,判断所述舆情文本的质量;
[0022]若根据所述舆情文本的质量确定所述舆情文本为垃圾舆情,则对所述舆情文本执行过滤处理;
[0023]若根据所述舆情文本的质量确定所述舆情文本为有效舆情,则执行所述获取所述舆情文本中的多个实体的步骤。
[0024]可选地,确定所述舆情文本与所述多个实体中的每个实体对应的信息标签,具体包括:
[0025]确定所述舆情文本中与所述多个实体分别对应的预设关键词;
[0026]根据所述多个实体分别对应的预设关键词确定所述舆情文本与所述多个实体中的每个实体对应的信息标签。
[0027]可选地,确定所述舆情文本中与所述多个实体分别对应的预设关键词,具体包括:
[0028]根据所述多个实体中的每个实体对应的谓语动词和语句语义确定所述舆情文本中所述多个实体分别对应的预设关键词。
[0029]根据本专利技术的另一个方面,提供了一种舆情关联装置,所述装置包括:
[0030]第一获取模块,用于获取舆情文本;
[0031]第二获取模块,用于获取所述舆情文本中的多个实体;
[0032]第一确定模块,用于确定所述舆情文本与所述多个实体中的每个实体对应的信息标签;
[0033]所述关联模块,用于基于确定的所述信息标签,将所述舆情文本与所述信息标签对应的实体关联,以使用户通过所述实体对应的所述信息标签获取到舆情信息。
[0034]根据本专利技术的又一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机可执行程序,所述计算机可执行程序被运行以实施本专利技术实施例任一所述的舆情关联方法。
[0035]根据本专利技术的又一个方面,提供了一种电子设备,所述电子设备包括存储器以及处理器,所述存储器上用于存储计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施本专利技术实施例任一所述的舆情关联方法。
[0036]本专利技术提供了一种舆情关联方法,采用本方法能够准确地确定出该舆情中相关的实体,并将舆情与该实体及实体对应的信息标签进行关联,避免了一些无关紧要的舆情新闻与其关系不大的实体进行关联事件的发生,以使用户可以通过信息标签获取到实体对应的关联舆情以及通过舆情获取到关键信息。
附图说明
[0037]图1为本专利技术实施例一种舆情关联方法流程示意图;
[0038]图2为本专利技术实施例一种舆情关联方法流程示意图;
[0039]图3为本专利技术实施例一种舆情关联方法流程示意图;
[0040]图4为本专利技术实施例一种舆情关联装置结构示意图;
[0041]图5为本专利技术实施例中电子设备的结构示意图。
具体实施方式
[0042]下面,将参考附图详细地描述根据本专利技术的示例实施例。显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是本专利技术的全部实施例,应理解,本专利技术不受这里描述的示例实施例的限制。
[0043]应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。
[0044]本领域技术人员可以理解,本专利技术实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
[0045]还应理解,在本专利技术实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
[0046]还应理解,对于本专利技术实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
[0047]另外,本专利技术中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A 和B,单独存在B这三种情况。另外,本专利技术中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0048]还应理解,本专利技术对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种舆情关联方法,其特征在于,所述方法包括:获取舆情文本;获取所述舆情文本中的多个实体;确定所述舆情文本与所述多个实体中的每个实体对应的信息标签;基于确定的所述信息标签,将所述舆情文本与所述信息标签对应的实体关联,以使用户通过所述实体对应的所述信息标签获取到舆情信息。2.根据权利要求1所述的方法,其特征在于,所述获取所述舆情文本中的多个实体,具体包括:根据预设方式将所述舆情文本进行分句得到多个语句;对所述多个语句中的每个语句根据句子构成方式进行分词;根据分词结果中所述每个语句的谓语动词确定所述每个语句中出现的企业实体;将确定的所有企业实体作为所述舆情文本中的多个实体。3.根据权利要求2所述的方法,其特征在于,所述根据预设方式将所述舆情文本进行分句得到多个语句,具体包括:响应于舆情文本为中文文本,根据最终标识符对所述舆情文本进行分句得到多个语句;响应于舆情文本为英文文本,根据预设标号和大写字母的组合方式对所述舆情文本进行分句得到多个语句。4.根据权利要求2所述的方法,其特征在于,所述将确定的所有企业实体作为所述舆情文本中的多个实体之后,还包括:确定所述多个实体中的各个实体在所述舆情文本中以所述第一人称视角出现的频次;基于所述各个实体在所述舆情文本中以所述第一人称视角出现的频次,确定与所述舆情相关的最终实体。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:使用垃圾语料词集合,判断所述舆情文本的质量;若根据所述舆情文本的质量确定所述舆情文本为垃圾舆情,则对所述舆情文本执行过滤处理;若根据所...

【专利技术属性】
技术研发人员:庞世娜
申请(专利权)人:北京金堤科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1