【技术实现步骤摘要】
实体舆情计算方法及系统
本专利技术涉及计算机
,具体地涉及实体舆情计算方法及系统。
技术介绍
对于很多实体,例如公司,确定其舆情状态的是重要的任务之一。在相关技术中,一般通过对文本进行处理来确定公司的舆情状态,其中,对于文本的处理包括简单地识别所述文本中的当前公司及判断所述文本的情感。然而,一旦发生突发性事件,采用上述相关技术所确定的舆情状态的舆情数值受到突发事件的影响较大。例如,一个公司每天正常情况下会有10篇新闻文本,但是发生了某个突发事件后,新闻文本总量激增到了30,导致舆情状态里事件的影响会被夸大,从而并不能精准反映公司的真实舆情状态。
技术实现思路
本专利技术实施例的目的是提供一种实体舆情计算方法及系统,该实体舆情计算方法及系统所计算的舆情数值考虑了所有事件类型的影响,可以反映公司的真实舆情状态。为了实现上述目的,本专利技术实施例提供一种实体舆情计算方法,所述实体舆情计算方法包括:获取指定实体以及与所述指定实体的舆情相关的当前文本,以及获取用于示出所述当前文本的情感倾向状态的情感数值;根据预设定的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频,其中所述分类模型被配置为以文本为输入,并以所述文本对应的事件类别集及用于示出其中每一事件类别的词频为输出;基于所获取的当前词频,计算所述当前文本与所述当前事件类别集中的每一当前事件类别的当前相关性数值;以及基于所述当前文本对应的当前事件类别集、所述每一当前事件类别的所述当前相关性数值以及所述情感 ...
【技术保护点】
1.一种实体舆情计算方法,其特征在于,所述实体舆情计算方法包括:/n获取指定实体以及与所述指定实体的舆情相关的当前文本,以及获取用于示出所述当前文本的情感倾向状态的情感数值;/n根据预设定的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频,其中所述分类模型被配置为以文本为输入,并以所述文本对应的事件类别集及用于示出其中每一事件类别的词频为输出;/n基于所获取的当前词频,计算所述当前文本与所述当前事件类别集中的每一当前事件类别的当前相关性数值;以及/n基于所述当前文本对应的当前事件类别集、所述每一当前事件类别的所述当前相关性数值以及所述情感数值,计算用于示出所述指定实体的舆情状态的舆情数值。/n
【技术特征摘要】
1.一种实体舆情计算方法,其特征在于,所述实体舆情计算方法包括:
获取指定实体以及与所述指定实体的舆情相关的当前文本,以及获取用于示出所述当前文本的情感倾向状态的情感数值;
根据预设定的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频,其中所述分类模型被配置为以文本为输入,并以所述文本对应的事件类别集及用于示出其中每一事件类别的词频为输出;
基于所获取的当前词频,计算所述当前文本与所述当前事件类别集中的每一当前事件类别的当前相关性数值;以及
基于所述当前文本对应的当前事件类别集、所述每一当前事件类别的所述当前相关性数值以及所述情感数值,计算用于示出所述指定实体的舆情状态的舆情数值。
2.根据权利要求1所述的实体舆情计算方法,其特征在于,所述获取与所述指定实体的舆情相关的当前文本包括:
获取指定实体对应的匹配标识文本及排除标识文本;以及
获取存在所述匹配标识文本且不存在排除标识文本的当前文本。
3.根据权利要求1所述的实体舆情计算方法,其特征在于,所述获取用于示出所述当前文本的情感倾向状态的情感数值包括:
根据预设定的深度学习情感模型,获取用于示出所述当前文本的情感倾向状态的情感数值;其中,所述深度学习情感模型被配置为以文本为输入,并以示出所输入的所述文本的情感倾向状态的情感数值为输出。
4.根据权利要求1所述的实体舆情计算方法,其特征在于,所述根据预设定的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频包括:
建立分类模型;
获取历史数据,其中所述历史数据包括与指定实体的舆情相关的各历史文本、与每一历史文本对应的事件类别集及用于示出其中每一事件类别的词频;
基于所述历史数据训练所述分类模型,得到训练后的分类模型;以及
将所述当前文本输入所述训练后的分类模型,获取所述当前文本对应的当前事件类别集及用于示出其中每一当前事件类别的当前词频。
5.根据权利要求1所述的实体舆情计算方法,其特征在于,所述计算所述当前文本用于示出所述指定实体的舆情状态的舆情数值包括:
根据预设定的每一事件类别与示出其对舆情状态的影响程度的权重的对应关系,确定所述当前文本对应的当前事件类别集中每一当前事件类别对应的当前权重;以及
将所述当前事件类别集中每一当前事件类别对应的当前权重与其当前相关性数值乘积相叠加后乘以所述情感数值得到所述指定实体的所述舆情数值。
6.根据权利要求1所述的实体舆情计算方法,其特征在于,
在所述计算所述当前文本与所述当前事件类别集中的每一当前事件类别的当前相关性数值之后,该实体舆情计算方法还包括:
针对每一当前事件类别的当前相关性数值,执行:若所述当前相关性数值大于预设定阈值且所述当前文本中存在预设定的减分词组,则根据预设定的各第一相关性数值区间与用于修正舆情数值的修正值的第一对应关系,确定...
【专利技术属性】
技术研发人员:崔志伸,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。