企业舆情监测方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:20589127 阅读:41 留言:0更新日期:2019-03-16 07:14
本申请涉及一种基于大数据的企业舆情监测方法、装置、计算机设备和存储介质。所述方法包括:获取包含待监测企业实体的舆情文本,对舆情文本进行分句处理得到舆情语句,获取舆情语句中的特征词,根据预先设置各个舆情分类对应的词向量模型,得到特征词的词向量,根据舆情语句中特征词的词向量,得到舆情语句对应各个舆情分类的特征向量,将特征向量分别输入预先设置的预测模型中,得到舆情语句对应各个舆情分类的概率,选择概率最大的舆情分类作为舆情语句对应的第一舆情特征,根据舆情文本中舆情语句的第一舆情特征,得到舆情文本对应的第二舆情特征,通过舆情文本的第二舆情特征,对待监测企业进行舆情监测。采用本方法能够提高舆情监测的效率。

【技术实现步骤摘要】
企业舆情监测方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种企业舆情监测方法、装置、计算机设备和存储介质。
技术介绍
舆情是指在出现特定事件时,民众所持的社会态度。近年来,随着互联网技术的发展,网络资源处于高度的共享之中,因此,网络中出现的舆情,传播范围之广,受众面积之大,往往对企业的经营状况造成影响。如何有效的监测企业在网络中的舆情,是人们研究的重点,舆情一般分为积极舆情、消极舆情和中性舆情,不同的舆情可以直接或间接反映企业的经营状况,在对网络中舆情进行分类时,主要通过人为对文本中情感词进行分析,从而确定该文本是何种舆情。然而网络中舆情文本数量之大,若全面对企业舆情进行监测,则需要耗费大量的人力物力,使得对企业舆情监测效率低下。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够解决全面监测企业舆情时效率低下的企业舆情监测方法、装置、计算机设备和存储介质。一种企业舆情监测方法,所述方法包括:获取包含待监测企业实体的舆情文本;对所述舆情文本进行分句处理得到舆情语句;获取所述舆情语句中的特征词;根据预先设置各个舆情分类对应的词向量模型,得到所述特征词的词向量;根据所述舆情语句中特征词的词向量,得到所述舆情语句对应各个舆情分类的特征向量;将所述特征向量分别输入预先设置的预测模型中,得到所述舆情语句对应各个舆情分类的概率;选择概率最大的舆情分类作为所述舆情语句的第一舆情特征,根据舆情文本中舆情语句的第一舆情特征,得到所述舆情文本的第二舆情特征;通过所述舆情文本的第二舆情特征,对待监测企业进行舆情监测。在其中一个实施例中,还包括:设置每一舆情文本对应一监测点,获取当前监测点的舆情特征,根据所述舆情特征,得到当前监测点的舆情评分,获取历史监测点的舆情评分,根据历史监测点的舆情评分和当前监测点的舆情评分,生成舆情评分曲线,根据所述舆情评分曲线对待监测企业进行舆情监测。在其中一个实施例中,还包括:根据历史监测点的舆情评分,得到各历史监测点的舆情得分;获取前一监测点的舆情得分,根据前一监测点的舆情得分和当前监测点的舆情评分求和,得到当前监测点的舆情得分;根据当前监测点的舆情得分和历史监测点的舆情得分,生成舆情评分曲线。在其中一个实施例中,还包括:获取各个所述监测点的时间标签;将当前监测点的舆情特征与前一监测点的舆情特征进行对比,若二者一致,则根据当前监测点的时间标签和前一监测点的时间标签,得到当前监测点的时间系数;根据当前监测点的舆情评分乘以所述时间系数后与前一监测点的舆情得分求和,得到当前监测点的舆情得分。在其中一个实施例中,还包括:获取预先设置的所述舆情特征对应的舆情词库,所述舆情词库包括积极词库,消极词库以及中性词库;根据所述舆情词库对所述舆情语句进行匹配,得到所述舆情语句中积极词、消极词或者中性词的频率;根据所述频率与积极词、消极词或者中性词的预设评分的乘积得到所述舆情语句的评分;根据所述舆情文本中舆情语句的评分求均值得到当前监测点的舆情评分。在其中一个实施例中,还包括:根据所述舆情语句在所述舆情文本中的位置,给各个舆情语句设置权值;将所述舆情文本中各舆情语句的评分乘以所述权值后求均值,得到当前监测点的舆情评分。在其中一个实施例中,还包括:获取所述舆情语句对应于同一词向量模型的词向量组;所述词向量组是多个所述词向量的集合;根据所述词向量组中词向量的均值,得到所述舆情语句对应于舆情分类的特征向量。一种企业舆情监测装置,所述装置包括:特征提取模块,用于获取包含待监测企业实体的舆情文本;对所述舆情文本进行分句处理得到舆情语句;获取所述舆情语句中的特征词;向量构建模块,用于根据预先设置各个舆情分类对应的词向量模型,得到所述特征词的词向量;根据所述舆情语句中特征词的词向量,得到所述舆情语句对应各个舆情分类的特征向量;舆情预测模块,用于将所述特征向量分别输入预先设置的预测模型中,得到所述舆情语句对应各个舆情分类的概率;选择概率最大的舆情分类作为所述舆情语句对应的第一舆情特征,根据舆情文本中舆情语句对应的第一舆情特征,得到所述舆情文本对应的第二舆情特征;监测模块,用于通过所述舆情文本对应的第二舆情特征,对待监测企业进行舆情监测。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取包含待监测企业实体的舆情文本;对所述舆情文本进行分句处理得到舆情语句;获取所述舆情语句中的特征词;根据预先设置各个舆情分类对应的词向量模型,得到所述特征词的词向量;根据所述舆情语句中特征词的词向量,得到所述舆情语句对应各个舆情分类的特征向量;将所述特征向量分别输入预先设置的预测模型中,得到所述舆情语句对应各个舆情分类的概率;选择概率最大的舆情分类作为所述舆情语句对应的第一舆情特征,根据舆情文本中舆情语句对应的第一舆情特征,得到所述舆情文本对应的第二舆情特征;通过所述舆情文本对应的第二舆情特征,对待监测企业进行舆情监测。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取包含待监测企业实体的舆情文本;对所述舆情文本进行分句处理得到舆情语句;获取所述舆情语句中的特征词;根据预先设置各个舆情分类对应的词向量模型,得到所述特征词的词向量;根据所述舆情语句中特征词的词向量,得到所述舆情语句对应各个舆情分类的特征向量;将所述特征向量分别输入预先设置的预测模型中,得到所述舆情语句对应各个舆情分类的概率;选择概率最大的舆情分类作为所述舆情语句对应的第一舆情特征,根据舆情文本中舆情语句对应的第一舆情特征,得到所述舆情文本对应的第二舆情特征;通过所述舆情文本对应的第二舆情特征,对待监测企业进行舆情监测。上述企业舆情监测方法、装置、计算机设备和存储介质,通过获取包含待监测企业实体的舆情文本,然后对舆情文本进行分句处理得到舆情语句,获取舆情语句中的特征词,以此完成舆情文本中特征词的提取。根据预先设置各个舆情分类对应的词向量模型,得到特征词的词向量,根据舆情语句中特征词的词向量,得到舆情语句对应各个舆情分类的特征向量,完成特征向量的构建;将特征向量分别输入预先设置的预测模型中,得到舆情语句对应各个舆情分类的概率;选择概率最大的舆情分类作为舆情语句对应的第一舆情特征,根据舆情文本中舆情语句的第一舆情特征,得到舆情文本的第二舆情特征;通过舆情文本的第二舆情特征,对待监测企业进行舆情监测。本专利技术实施例,通过对舆情文本进行分句处理,将单个舆情语句作为分类的对象,通过预测模型对舆情语句进行分类,然后根据舆情文本中舆情语句的第一舆情特征,得到舆情文本的第二舆情特征,从而对企业舆情特征进行监测,上述过程无需人工干涉,分析与计算过程快速准确,在对企业进行全面舆情监测时,可以提高舆情监测的效率。附图说明图1为一个实施例中企业舆情监测方法的应用场景图;图2为一个实施例中企业舆情监测方法的流程示意图;图3为一个实施例中舆情监测步骤的流程示意图;图4为一实施例中舆情监测曲线的示意图;图5为一个实施例中得到监测点的舆情评分步骤的流程示意图;图6为一个实施例中企业舆情监测装置的结构框图;图7为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、本文档来自技高网...

【技术保护点】
1.一种企业舆情监测方法,所述方法包括:获取包含待监测企业实体的舆情文本;对所述舆情文本进行分句处理得到舆情语句;获取所述舆情语句中的特征词;根据预先设置各个舆情分类对应的词向量模型,得到所述特征词的词向量;根据所述舆情语句中特征词的词向量,得到所述舆情语句对应各个舆情分类的特征向量;将所述特征向量分别输入预先设置的预测模型中,得到所述舆情语句对应各个舆情分类的概率;选择概率最大的舆情分类作为所述舆情语句对应的第一舆情特征,根据舆情文本中舆情语句对应的第一舆情特征,得到所述舆情文本对应的第二舆情特征;通过所述舆情文本对应的第二舆情特征,对待监测企业进行舆情监测。

【技术特征摘要】
1.一种企业舆情监测方法,所述方法包括:获取包含待监测企业实体的舆情文本;对所述舆情文本进行分句处理得到舆情语句;获取所述舆情语句中的特征词;根据预先设置各个舆情分类对应的词向量模型,得到所述特征词的词向量;根据所述舆情语句中特征词的词向量,得到所述舆情语句对应各个舆情分类的特征向量;将所述特征向量分别输入预先设置的预测模型中,得到所述舆情语句对应各个舆情分类的概率;选择概率最大的舆情分类作为所述舆情语句对应的第一舆情特征,根据舆情文本中舆情语句对应的第一舆情特征,得到所述舆情文本对应的第二舆情特征;通过所述舆情文本对应的第二舆情特征,对待监测企业进行舆情监测。2.根据权利要求1所述的方法,其特征在于,通过所述舆情文本的第二舆情特征,对待监测企业进行舆情监测,包括:设置每一舆情文本对应一监测点;获取当前监测点对应的第三舆情特征,根据所述第三舆情特征,得到当前监测点的舆情评分;获取历史监测点的舆情评分,根据历史监测点的舆情评分和当前监测点的舆情评分,生成舆情评分曲线,根据所述舆情评分曲线对待监测企业进行舆情监测。3.根据权利要求2所述的方法,其特征在于,根据历史监测点的舆情评分和当前监测点的舆情评分,生成舆情评分曲线,包括:根据历史监测点的舆情评分,得到各历史监测点的舆情得分;获取前一监测点的舆情得分,根据前一监测点的舆情得分和当前监测点的舆情评分求和,得到当前监测点的舆情得分;根据当前监测点的舆情得分和历史监测点的舆情得分,生成舆情评分曲线。4.根据权利要求3所述的方法,其特征在于,根据前一监测点的舆情得分和当前监测点的舆情评分求和,得到当前监测点的舆情得分,包括:获取各个所述监测点的时间标签;将当前监测点的第三舆情特征与前一监测点的第三舆情特征进行对比,若二者一致,则根据当前监测点的时间标签和前一监测点的时间标签,得到当前监测点的时间系数;根据当前监测点的舆情评分乘以所述时间系数后与前一监测点的舆情得分求和,得到当前监测点的舆情得分。5.根据权利要求2所述的方法,其特征在于,根据所述第三舆情特征,得到当前监测点的舆情评分,包括:获取预先设置的所述第三舆情...

【专利技术属性】
技术研发人员:夏良超
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1