评论信息情感分析方法、装置、计算机存储介质和服务器制造方法及图纸

技术编号:18940787 阅读:29 留言:0更新日期:2018-09-15 11:07
本发明专利技术提供一种评论信息情感分析方法、装置、计算机存储介质和服务器,以解决现有技术中存在的缺乏自动化对评论信息进行情感分析方法的问题。所述的方法包括步骤:获取第一评论信息中每个分段的分词集合;确定每个分段的分词集合中属于预设的分词特征库的若干个分词,基于每个分段的若干个分词生成每个分段的向量;基于每个分段的向量生成所述第一评论信息的向量;将所述第一评论信息的向量输入预先生成的情感分析模型中,得到所述第一评论信息的预测值;将所述第一评论信息的预测值与预设阈值进行比较,根据比较结果得到所述第一评论信息的情感分析结果。本发明专利技术实施例实现了对评论信息的自动化情感分析。

Comment information emotion analysis method, device, computer storage medium and server

The invention provides an emotional analysis method, a device, a computer storage medium and a server for comment information to solve the problem of lacking an automatic emotional analysis method for comment information in the prior art. The method comprises steps of: obtaining a word segmentation set for each segment in the first comment information; determining a number of words belonging to a preset word segmentation feature library in the word segmentation set for each segment, generating a vector for each segment based on a number of words for each segment; and generating the first comment information based on a vector for each segment. The vector of the first comment information is input into the pre-generated emotional analysis model, and the predicted value of the first comment information is obtained; the predicted value of the first comment information is compared with the preset threshold value, and the emotional analysis result of the first comment information is obtained according to the comparison result. The embodiment of the invention realizes the automatic sentiment analysis of the comment information.

【技术实现步骤摘要】
评论信息情感分析方法、装置、计算机存储介质和服务器
本专利技术涉及计算机
,具体而言,本专利技术涉及一种评论信息情感分析方法、装置、存储介质和服务器。
技术介绍
在产品的运营过程中,需要对产品的质量进行评价,以确定优质产品推荐给用户。传统的方法是人工评价法,由编辑、运营人员体验产品给产品打分进行质量评价。这种做法一方面消耗大量的人力物力,另一方面受评测人员的主观因素影响,无法保证对所有产品给出客观且准确的产品质量评价。本专利技术的专利技术人经研究发现,通过用户评论信息自动评价产品质量可以有效解决上述问题。而通过用户评论信息给产品质量评分的方法核心工作在于如何对一条评论信息进行自动化的情感分析,自动判别一条评论信息是褒义还是贬义。然而现有技术中缺乏自动化对评论信息进行情感分析的方法。
技术实现思路
本专利技术针对现有方式的缺点,提出一种评论信息情感分析方法、装置、存储介质和服务器,用以解决现有技术中存在的缺乏自动化对评论信息进行情感分析方法的问题,以实现对评论信息的自动化情感分析。本专利技术的实施例根据第一个方面,提供了一种评论信息情感分析方法,包括步骤:获取第一评论信息中每个分段的分词集合;确定每个分段的分词集合中属于预设的分词特征库的若干个分词,基于每个分段的若干个分词生成每个分段的向量;基于每个分段的向量生成所述第一评论信息的向量;将所述第一评论信息的向量输入预先生成的情感分析模型中,得到所述第一评论信息的预测值,其中,所述情感分析模型用于表征向量与预测值之间的关联关系;将所述第一评论信息的预测值与预设阈值进行比较,根据比较结果得到所述第一评论信息的情感分析结果。在一个实施例中,所述情感分析模型通过以下步骤生成:获取训练样本包含的各个第二评论信息中每个分段的分词集合,以及用户对各个第二评论信息分类的类别;确定每个分段的分词集合中属于所述分词特征库的若干个分词,基于每个分段的若干个分词生成每个分段的向量;基于每个分段的向量生成各个第二评论信息的向量;将各个第二评论信息的向量和各自的类别输入循环神经网络中进行训练,生成情感分析模型。在一个实施例中,所述分词特征库用于描述其包含的各个分词的价值大小顺序;所述基于每个分段的若干个分词生成每个分段的向量,包括:基于所述分词特征库,按照价值从大到小的顺序对每个分段的若干个分词进行排序,生成每个分段的预设维度的原始输入特征;对每个分段的原始输入特征中每个元素进行哈希运算,并对哈希运算得到的哈希值进行取模,生成每个分段的向量。在一个实施例中,所述基于每个分段的向量生成各个第二评论信息的向量,包括:按照各个第二评论信息中每个分段的先后顺序,由各个分段的向量生成各个第二评论信息的向量。在一个实施例中,所述将各个第二评论信息的向量和各自的类别输入循环神经网络中进行训练,生成情感分析模型,包括:通过预设算法求解预先构建的损失函数最小时所述循环神经网络的模型参数,基于求解的所述循环神经网络的模型参数得到情感分析模型,其中,所述损失函数为与各个第二评论信息的预测值和类别有关的函数,各个第二评论信息的预测值为与所述循环神经网络的模型参数和各个第二评论信息的向量有关的变量。在一个实施例中,所述分词特征库通过以下步骤得到:根据用户对输入的各个第二评论信息分类的类别,从各个第二评论信息中筛选出训练样本,其中,所述训练样本包括正样本和负样本;获取所述训练样本的分词集合,其中,所述训练样本的分词集合包括正样本的分词集合和负样本的分词集合;统计所述训练样本的分词集合中每个分词在所述正样本的分词集合中出现的第一次数和在所述负样本的分词集合中出现的第二次数;根据所述训练样本的分词集合中每个分词的第一次数和第二次数,确定所述训练样本的分词集合中每个分词的价值;按照价值从大到小的顺序,从所述训练样本的分词集合中选取预设数目的分词,由所述预设数目的分词构成分词特征库。在一个实施例中,所述根据所述训练样本的分词集合中每个分词的第一次数和第二次数,确定所述训练样本的分词集合中每个分词的价值,包括:依次从所述训练样本的分词集合中选取一个分词;若该分词的总次数大于等于预设值,确定该分词的价值为设定值与该分词在正样本占比和负样本占比乘积的差,其中,该分词在正样本占比为该分词的第一次数与总次数的比值,该分词在负样本占比为该分词的第二次数与总次数的比值,总次数为第一次数和第二次数之和;若该分词的总次数小于预设值,确定该分词的价值为零。本专利技术的实施例根据第二个方面,还提供了一种评论信息情感分析装置,包括:分词集合获取模块,用于获取第一评论信息中每个分段的分词集合;分段向量生成模块,用于确定每个分段的分词集合中属于预设的分词特征库的若干个分词,基于每个分段的若干个分词生成每个分段的向量;评论信息向量生成模块,用于基于每个分段的向量生成所述第一评论信息的向量;预测值获得模块,用于将所述第一评论信息的向量输入预先生成的情感分析模型中,得到所述第一评论信息的预测值,其中,所述情感分析模型用于表征向量与预测值之间的关联关系;情感分析结果获得模块,用于将所述第一评论信息的预测值与预设阈值进行比较,根据比较结果得到所述第一评论信息的情感分析结果。本专利技术的实施例根据第三个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一项所述的评论信息情感分析方法。本专利技术的实施例根据第四个方面,还提供了一种服务器,所述服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的评论信息情感分析方法。上述实施例提供的评论信息情感分析方法、装置、计算机存储介质和服务器,自动生成评论信息的向量,将该评论信息的向量输入情感分析模型中得到该评论信息的预测值,进而根据该预测值与预设阈值的比较结果实现对该评论信息的自动化情感分析。通过机器学习的方法对评论信息进行自动化的情感分析,可以大大节省人力物力成本,对用户评价信息给出客观且准确的分类判断。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术一个实施例的分词特征库生成方法的流程示意图;图2为本专利技术一个实施例的分词的价值确定方法的流程示意图;图3为本专利技术一个实施例的情感分析模型生成方法的流程示意图;图4为本专利技术一个实施例的分段的向量生成方法的流程示意图;图5为本专利技术一个具体实施例的循环神经网络的结构示意图;图6为本专利技术一个实施例的评论信息情感分析方法的流程示意图;图7为本专利技术一个实施例的评论信息情感分析装置的结构示意图;图8为本专利技术一个实施例的服务器的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式,这里使用的“第一本文档来自技高网
...

【技术保护点】
1.一种评论信息情感分析方法,其特征在于,包括步骤:获取第一评论信息中每个分段的分词集合;确定每个分段的分词集合中属于预设的分词特征库的若干个分词,基于每个分段的若干个分词生成每个分段的向量;基于每个分段的向量生成所述第一评论信息的向量;将所述第一评论信息的向量输入预先生成的情感分析模型中,得到所述第一评论信息的预测值,其中,所述情感分析模型用于表征向量与预测值之间的关联关系;将所述第一评论信息的预测值与预设阈值进行比较,根据比较结果得到所述第一评论信息的情感分析结果。

【技术特征摘要】
1.一种评论信息情感分析方法,其特征在于,包括步骤:获取第一评论信息中每个分段的分词集合;确定每个分段的分词集合中属于预设的分词特征库的若干个分词,基于每个分段的若干个分词生成每个分段的向量;基于每个分段的向量生成所述第一评论信息的向量;将所述第一评论信息的向量输入预先生成的情感分析模型中,得到所述第一评论信息的预测值,其中,所述情感分析模型用于表征向量与预测值之间的关联关系;将所述第一评论信息的预测值与预设阈值进行比较,根据比较结果得到所述第一评论信息的情感分析结果。2.根据权利要求1所述的评论信息情感分析方法,其特征在于,所述情感分析模型通过以下步骤生成:获取训练样本包含的各个第二评论信息中每个分段的分词集合,以及用户对各个第二评论信息分类的类别;确定每个分段的分词集合中属于所述分词特征库的若干个分词,基于每个分段的若干个分词生成每个分段的向量;基于每个分段的向量生成各个第二评论信息的向量;将各个第二评论信息的向量和各自的类别输入循环神经网络中进行训练,生成情感分析模型。3.根据权利要求2所述的评论信息情感分析方法,其特征在于,所述分词特征库用于描述其包含的各个分词的价值大小顺序;所述基于每个分段的若干个分词生成每个分段的向量,包括:基于所述分词特征库,按照价值从大到小的顺序对每个分段的若干个分词进行排序,生成每个分段的预设维度的原始输入特征;对每个分段的原始输入特征中每个元素进行哈希运算,并对哈希运算得到的哈希值进行取模,生成每个分段的向量。4.根据权利要求2所述的评论信息情感分析方法,其特征在于,所述基于每个分段的向量生成各个第二评论信息的向量,包括:按照各个第二评论信息中每个分段的先后顺序,由各个分段的向量生成各个第二评论信息的向量。5.根据权利要求2所述的评论信息情感分析方法,其特征在于,所述将各个第二评论信息的向量和各自的类别输入循环神经网络中进行训练,生成情感分析模型,包括:通过预设算法求解预先构建的损失函数最小时所述循环神经网络的模型参数,基于求解的所述循环神经网络的模型参数得到情感分析模型,其中,所述损失函数为与各个第二评论信息的预测值和类别有关的函数,各个第二评论信息的预测值为与所述循环神经网络的模型参数和各个第二评论信息的向量有关的变量。6.根据权利要求1至5任意一项所述的评论信息情感分析方法,其特征在于,所述分词特征库通过以下步骤得到:...

【专利技术属性】
技术研发人员:潘岸腾
申请(专利权)人:广州优视网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1