【技术实现步骤摘要】
句子的情感极性分析方法、装置及存储介质
本专利技术涉及信息
,尤其涉及一种句子的情感极性分析方法、装置及计算机可读存储介质。
技术介绍
舆情分析是根据特定问题的需要,对针对这个问题的舆情进行深层次的思维加工和分析研究,得到相关结论的过程。在舆情分析中,通常比较关心一些新闻或者微博表达出的情感,通过情感判断用户对产品的情感倾向,而对较长文本的情感判断是以句子情感极性判断为基础的。因而如何准确判断句子的情感倾向是一个亟待解决的重要问题。现有技术的情感极性分析方法通常是基于情感词典简单地匹配,对于中性的句子判断错误率过大。另外,现有技术通常是基于情感词典进行简单的匹配和权重的累加,再加上一些简单的机器学习模型,比如fasttext(快速文本分类器)模型,对于判断深层次语义的句子情感判断不准确,无法满足任务需求。再者,现有技术对于较长的句子极性判断准确率不足。
技术实现思路
本专利技术实施例提供一种句子的情感极性分析方法、装置及计算机可读存储介质,以至少解决现有技术中的一个或多个技术问题。< ...
【技术保护点】
1.一种句子的情感极性分析方法,其特征在于,包括:/n利用机器学习模型对句子的情感极性进行分析,得到表示所述句子的情感极性的结果向量,所述机器学习模型包括决策树模型、分类器模型、卷积神经网络模型和循环神经网络模型中至少两种;/n利用逻辑回归模型拟合所述结果向量,得到所述句子的情感极性。/n
【技术特征摘要】
1.一种句子的情感极性分析方法,其特征在于,包括:
利用机器学习模型对句子的情感极性进行分析,得到表示所述句子的情感极性的结果向量,所述机器学习模型包括决策树模型、分类器模型、卷积神经网络模型和循环神经网络模型中至少两种;
利用逻辑回归模型拟合所述结果向量,得到所述句子的情感极性。
2.根据权利要求1所述的方法,其特征在于,在利用机器学习模型对句子的情感极性进行分析之前,还包括:
利用词语分析模型对情感词进行扩容以建立情感词典,所述词语分析模型包括点间互信息、词向量和实体识别程序中至少一种;
使用所述情感词典训练所述机器学习模型。
3.根据权利要求2所述的方法,其特征在于,所述决策树模型包括梯度提升决策树模型,使用所述情感词典训练所述机器学习模型,包括:
针对句子的词性特征和/或词性交叉特征构建所述梯度提升决策树模型,并使用所述情感词典训练所述梯度提升决策树模型。
4.根据权利要求2或3所述的方法,其特征在于,所述分类器模型包括快速文本分类器模型,使用所述情感词典训练所述机器学习模型,还包括:
针对句子的N-Gram特征构建所述快速文本分类器模型,并使用所述情感词典训练所述快速文本分类器模型。
5.根据权利要求2所述的方法,其特征在于,使用所述情感词典训练所述机器学习模型,还包括:
针对句子的语义特征构建所述卷积神经网络模型,并使用所述情感词典训练所述卷积神经网络模型。
6.根据权利要求5所述的方法,其特征在于,使用所述情感词典训练所述卷积神经网络模型,包括:将用词向量模型训练的词向量作为输入,增加预训练词向量通道。
7.根据权利要求2或3所述的方法,其特征在于,使用所述情感词典训练所述机器学习模型,还包括:
在所述循环神经网络模型中采用注意力机制,针对句子的语义特征,对长句子构建所述循环神经网络模型,并使用所述情感词典训练所述循环神经网络模型。
8.一种句子的情感极性分析装置,其特征在于,包括:
极性分析单元,用于利用机器学习模型对句子的情感极性进行分析,得到表示所述句子的情感极性的结果向量,所述机器学习模型包括决策树模型、分类器模型、卷积神经网络模型和循环...
【专利技术属性】
技术研发人员:崔路男,尹存祥,吴伟佳,韦庭,潘旭,雍倩,李云聪,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。