实体舆情计算方法及系统技术方案

技术编号:28320996 阅读:11 留言:0更新日期:2021-05-04 13:01
本发明专利技术实施例提供一种实体舆情计算方法及系统,属于计算机技术领域。包括:获取指定实体以及与所述指定实体的舆情相关的当前文本、以及用于示出当前文本的情感倾向状态的情感数值;根据预设定的分类模型,获取当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频,其中分类模型被配置为以文本为输入,并以词频为输出;基于所获取的当前词频,计算当前文本与当前事件类别集中的每一当前事件类别的当前相关性数值;以及基于当前文本对应的当前事件类别集、每一当前事件类别的当前相关性数值以及情感数值,计算用于示出指定实体的舆情状态的舆情数值。本发明专利技术获得的结果可以反映公司的真实舆情状态。

【技术实现步骤摘要】
实体舆情计算方法及系统
本专利技术涉及计算机
,具体地涉及实体舆情计算方法及系统。
技术介绍
对于很多实体,例如公司,确定其舆情状态的是重要的任务之一。在相关技术中,一般通过对文本进行处理来确定公司的舆情状态,其中,对于文本的处理包括简单地识别所述文本中的当前公司及判断所述文本的情感。然而,一旦发生突发性事件,采用上述相关技术所确定的舆情状态的舆情数值受到突发事件的影响较大。例如,一个公司每天正常情况下会有10篇新闻文本,但是发生了某个突发事件后,新闻文本总量激增到了30,导致舆情状态里事件的影响会被夸大,从而并不能精准反映公司的真实舆情状态。
技术实现思路
本专利技术实施例的目的是提供一种实体舆情计算方法及系统,该实体舆情计算方法及系统所计算的舆情数值考虑了所有事件类型的影响,可以反映公司的真实舆情状态。为了实现上述目的,本专利技术实施例提供一种实体舆情计算方法,所述实体舆情计算方法包括:获取指定实体以及与所述指定实体的舆情相关的当前文本,以及获取用于示出所述当前文本的情感倾向状态的情感数值;根据预设定的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频,其中所述分类模型被配置为以文本为输入,并以所述文本对应的事件类别集及用于示出其中每一事件类别的词频为输出;基于所获取的当前词频,计算所述当前文本与所述当前事件类别集中的每一当前事件类别的当前相关性数值;以及基于所述当前文本对应的当前事件类别集、所述每一当前事件类别的所述当前相关性数值以及所述情感数值,计算用于示出所述指定实体的舆情状态的舆情数值。优选地,所述获取与所述指定实体的舆情相关的当前文本指定实体包括:获取指定实体对应的匹配标识文本及排除标识文本;以及获取存在所述匹配标识文本且不存在排除标识文本的当前文本。优选地,所述获取用于示出所述当前文本的情感倾向状态的情感数值包括:根据预设定的深度学习情感模型,获取用于示出所述当前文本的情感倾向状态的情感数值;其中,所述深度学习情感模型被配置为以文本为输入,并以示出所输入的所述文本的情感倾向状态的情感数值为输出。优选地,所述根据预设定的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频包括:建立分类模型;获取历史数据,其中所述历史数据包括与指定实体的舆情相关的各历史文本、与每一历史文本对应的事件类别集及用于示出其中每一事件类别的词频;基于所述历史数据训练所述分类模型,得到训练后的分类模型;以及将所述当前文本输入所述训练后的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频。优选地,所述计算所述当前文本用于示出所述指定实体的舆情状态的舆情数值包括:根据预设定的每一事件类别与示出其对舆情状态的影响程度的权重的对应关系,确定所述当前文本对应的当前事件类别集中每一当前事件类别对应的当前权重;以及将所述当前事件类别集中每一当前事件类别对应的当前权重与其当前相关性数值乘积相叠加后乘以所述情感数值得到所述指定实体的所述舆情数值。优选地,在所述计算所述当前文本与所述当前事件类别集中的每一当前事件类别的当前相关性数值之后,该实体舆情计算方法还包括:针对每一当前事件类别的当前相关性数值,执行:若所述当前相关性数值大于预设定阈值且所述当前文本中存在预设定的减分词组,则根据预设定的各第一相关性数值区间与用于修正舆情数值的修正值的第一对应关系,确定与所述当前相关性数值所在的第一相关性数值区间对应的当前修正值,其中所述各第一相关性数值区间被配置为每一区间内的相关性数值大于预设定阈值的各区间;以及若所述当前相关性数值小于或等于所述预设定阈值且所述当前文本对应的当前事件类别集中存在预设定的特殊事件类别,则根据预设定的各第二相关性数值区间与修正值的第二对应关系,确定与所述当前相关性数值所在第二相关性数值区间对应的当前修正值,其中所述第二相关性数值区间被配置为每一区间内的相关性数值小于或等于预设定阈值;并且,所述计算用于示出所述指定实体的舆情状态的舆情数值包括:基于所述当前文本对应的当前事件类别集及其中每一当前事件类别的当前相关性数值、所述情感数值、以及所述当前修正值,计算所述舆情数值。优选地,所述基于所述当前文本对应的当前事件类别集及其中每一当前事件类别的当前相关性数值、所述情感数值以及所述当前修正值,计算所述当前文本用于示出所述指定实体的舆情状态的舆情数值包括:根据预设定的每一事件类别与示出其对舆情状态的影响程度的权重的对应关系,确定所述当前文本对应的当前事件类别集中每一当前事件类别对应的当前权重;以及通过公式Func(CSeq,RSeq)*S-F,计算得到所述当前文本用于示出所述指定实体的舆情状态的舆情数值;其中,所述Func(CSeq,RSeq)为叠加所述当前事件类别集中每一当前事件类别对应的当前权重与其当前相关性数值的乘积的公式,所述Cseq为所有当前权重的集合,所述Rseq为所有当前相关性数值的集合,所述S为所述情感数值,所述F为所述当前修正值。另外,本专利技术提供一种实体舆情计算系统,所述实体舆情计算系统包括:文本数值获取单元,用于获取指定实体与指定实体的舆情相关的当前文本、以及用于示出所述当前文本的情感倾向状态的情感数值;类别词频获取单元,用于根据预设定的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频,其中所述分类模型被配置为以文本为输入,并以所述文本对应的事件类别集及用于示出其中每一事件类别的词频为输出;相关性计算单元,用于基于所获取的当前词频,计算所述当前文本与所述当前事件类别集中的每一当前事件类别的当前相关性数值;以及舆情计算单元,用于基于所述当前文本对应的当前事件类别集、所述每一当前事件类别的所述当前相关性数值以及所述情感数值,计算用于示出所述指定实体的舆情状态的舆情数值。另外,本专利技术还提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行本申请上述的实体舆情计算方法。另外,本专利技术还提供一种处理器,用于运行程序,其中,所述程序被运行时用于执行:如上述的实体舆情计算方法。另外,本专利技术还提供一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述的实体舆情计算方法。另外,本专利技术还提供一种电子设备,设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如上述的实体舆情计算方法。通过上述技术方案,获取到当前文本及其情感倾向状态的情感数值,根据预设定的分类模型可以根据输入的当前文本直接获得其输出的当前文本对应的时间类别集及每一当前事件类别的词频,其中所述每一当前事件类别的词频用于计算当前文本与每一当前事件类别的当前相关性数值,再根据已经分类的当前事件类别集、每一当前事件类别的当前相关性数值及上述的当前文本的情感倾向状态的数值综合计算舆情数值,该舆情数值充分考虑了事件类本文档来自技高网...

【技术保护点】
1.一种实体舆情计算方法,其特征在于,所述实体舆情计算方法包括:/n获取指定实体以及与所述指定实体的舆情相关的当前文本,以及获取用于示出所述当前文本的情感倾向状态的情感数值;/n根据预设定的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频,其中所述分类模型被配置为以文本为输入,并以所述文本对应的事件类别集及用于示出其中每一事件类别的词频为输出;/n基于所获取的当前词频,计算所述当前文本与所述当前事件类别集中的每一当前事件类别的当前相关性数值;以及/n基于所述当前文本对应的当前事件类别集、所述每一当前事件类别的所述当前相关性数值以及所述情感数值,计算用于示出所述指定实体的舆情状态的舆情数值。/n

【技术特征摘要】
1.一种实体舆情计算方法,其特征在于,所述实体舆情计算方法包括:
获取指定实体以及与所述指定实体的舆情相关的当前文本,以及获取用于示出所述当前文本的情感倾向状态的情感数值;
根据预设定的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频,其中所述分类模型被配置为以文本为输入,并以所述文本对应的事件类别集及用于示出其中每一事件类别的词频为输出;
基于所获取的当前词频,计算所述当前文本与所述当前事件类别集中的每一当前事件类别的当前相关性数值;以及
基于所述当前文本对应的当前事件类别集、所述每一当前事件类别的所述当前相关性数值以及所述情感数值,计算用于示出所述指定实体的舆情状态的舆情数值。


2.根据权利要求1所述的实体舆情计算方法,其特征在于,所述获取与所述指定实体的舆情相关的当前文本包括:
获取指定实体对应的匹配标识文本及排除标识文本;以及
获取存在所述匹配标识文本且不存在排除标识文本的当前文本。


3.根据权利要求1所述的实体舆情计算方法,其特征在于,所述获取用于示出所述当前文本的情感倾向状态的情感数值包括:
根据预设定的深度学习情感模型,获取用于示出所述当前文本的情感倾向状态的情感数值;其中,所述深度学习情感模型被配置为以文本为输入,并以示出所输入的所述文本的情感倾向状态的情感数值为输出。


4.根据权利要求1所述的实体舆情计算方法,其特征在于,所述根据预设定的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频包括:
建立分类模型;
获取历史数据,其中所述历史数据包括与指定实体的舆情相关的各历史文本、与每一历史文本对应的事件类别集及用于示出其中每一事件类别的词频;
基于所述历史数据训练所述分类模型,得到训练后的分类模型;以及
将所述当前文本输入所述训练后的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频。


5.根据权利要求1所述的实体舆情计算方法,其特征在于,所述计算所述当前文本用于示出所述指定实体的舆情状态的舆情数值包括:
根据预设定的每一事件类别与示出其对舆情状态的影响程度的权重的对应关系,确定所述当前文本对应的当前事件类别集中每一当前事件类别对应的当前权重;以及
将所述当前事件类别集中每一当前事件类别对应的当前权重与其当前相关性数值乘积相叠加后乘以所述情感数值得到所述指定实体的所述舆情数值。


6.根据权利要求1所述的实体舆情计算方法,其特征在于,
在所述计算所述当前文本与所述当前事件类别集中的每一当前事件类别的当前相关性数值之后,该实体舆情计算方法还包括:
针对每一当前事件类别的当前相关性数值,执行:若所述当前相关性数值大于预设定阈值且所述当前文本中存在预设定的减分词组,则根据预设定的各第一相关性数值区间与用于修正舆情数值的修正值的第一对应关系,确定...

【专利技术属性】
技术研发人员:崔志伸
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1