The present invention provides a combination of user and product information emotional neural network analysis method, including: obtaining of the text information, user information and the target information; according to the semantic vector text constructing sentences, text segment information and long term memory neural network model; according to the semantic vector of sentences and text segments. And the user information and the target information obtained to evaluate enhanced vector sentences and text segments; based on the enhanced vector emotion classification text text. The present invention provides a neural network emotion analysis method which combines user and product information. At the word level and sentence level, we combine the characteristics of user and product information into the attention mechanism, which greatly improves the performance of emotional classification.
【技术实现步骤摘要】
本专利技术涉及自然语言处理以及情感分析领域,尤其涉及一种基于注意力机制结合用户和产品信息的神经网络情感分析模型。
技术介绍
情感分析任务旨在通过人们的语言文字分析人们所表达的情感或者挖掘“用户”的意见,是数据挖掘领域和自然语言处理领域的一项重要任务。近年来,由于互联网评论网站的快速成长,评论文本数据海量出现,情感分析任务吸引了越来越多研究者的注意。本专利技术解决的重点问题是情感分析任务中的情感分类任务。情感分类任务从文本的结构角度划分,可以分为三个级别:词语级别、句子级别、文本段级别。词语级别的情感分类主要是对给定词语的情感极性划分,例如“积极”、“消极”或者不同等级情感强度;句子级别情感分类是对给定的一句话预测其情感倾向;文本段级别情感分类是对用户所表达的完整文本段进行情感倾向预测。文本段级别情感分类是情感分类任务中至关重要的一个环节,因为“用户”表达的“评论”经常是以文本段的形式出现,所以文本段级别的情感分类具有更广阔的应用价值;同时大量词语级别和句子级别情感分类研究的最终目的也是为了预测文本段级别的情感倾向。文本段级别的情感分类任务假设一段“评论”是一个特定“用户”表达的对一个特定“产品”的情感,同时,这里所提及的“评论”、“用户”、“产品”都是一个形象化的称呼,“评论”可以指任意类型文本段,“用户”指文本段的生成者,“产品”指文本段描述的目标。现阶段大多数工作都把情感分类任务看作文本分类任务的一个特殊任务。这些工作把不同的情感极性或者情感强度视为不同的分类,随后采用机器学习算法提取相应特征如“词袋”向量,训练分类器对文本段进行情感分类。由于分类器 ...
【技术保护点】
一种结合用户和产品信息的神经网络情感分析方法,其特征在于,包括:获取待分析的文本段信息、用户信息和待评目标信息;根据所述文本段信息和长短期记忆神经网络模型在词语层面、句子层面上构建句子、文本段的语义向量;根据所述句子和文本段的语义向量,以及用户信息和待评目标信息获得句子和文本段的增强向量;根据文本段的增强向量获得文本段的情感分类并输出显示。
【技术特征摘要】
1.一种结合用户和产品信息的神经网络情感分析方法,其特征在于,包括:获取待分析的文本段信息、用户信息和待评目标信息;根据所述文本段信息和长短期记忆神经网络模型在词语层面、句子层面上构建句子、文本段的语义向量;根据所述句子和文本段的语义向量,以及用户信息和待评目标信息获得句子和文本段的增强向量;根据文本段的增强向量获得文本段的情感分类并输出显示。2.根据权利要求1所述的方法,其特征在于,根据所述文本段信息和长短期记忆神经网络模型在词语层面、句子层面上构建句子、文本段的语义向量,包括:采用文本深度表示模型在相应领域文本语料库中训练语言模型获得词向量;根据所述词向量和语义分析算式获得句子的语义向量,所述语义分析算法为:每一步给定当前输入词向量使用上一步的隐状态和记忆单元状态来得到这一步的隐状态和记忆单元状态ijifjioji=σσσ(W·[hj-1i,wji]+b),]]>c^ji=tanh(W·[hj-1i,wji]+b)]]>其中,i,f,o表示长短期记忆神经网络的输入、遗忘和输出门,⊙表示逐位相乘,σ表示sigmoid函数,W和b表示待训练的参数;为词向量,将得到的隐状态通过一个平均池化层得到当前句子的语义向量;根据所述句子的语义向量和语义分析算式获得文本段的语义向量,所述语义分析算法为:每一步给定当前输入句子的语义向量使用上一步的隐状态和记忆单元状态来得到这一步的隐状态和记忆单元状态ijifjioji=σσσ(W·[hj-1i,sji]+b),]]>c^ji=tanh(W·[hj-1i,sji]+b)]]>其中,i,f,o表示长短期记忆神经网络的输入、遗忘和输出门,⊙表示逐位相乘,σ表示sigmoid函数,W和b表示待训练的参数;为句子的语义向量,将得到的隐状态通过一个平均池化层得到文本段的语义向量。3.根据权利要求2所述的方法,其特征在于,所述根据所述句子和文本段的语义向量,以及用户信息和待评目标信息获得句子和文本段的增强向量,包括:根据用户信息和待评目标信息分别映射获得用户特征向量和目标特征向量;根据用户特征向量和...
【专利技术属性】
技术研发人员:孙茂松,陈慧敏,刘知远,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。