【技术实现步骤摘要】
一种产品评论情感分类方法和系统
本专利技术涉及情感分类领域,属于一种产品评论情感分类方法和系统。
技术介绍
随着智能手机、平板电脑、无线传感器网络等各种普适系统的快速发展,人类已经生活在由通信网、互联网、传感网相互融合的混合网络环境中。其中,基于评论的情感分析是意见挖掘领域的一个重要分支和研究方向,主要研究如何采用自动化的方法,从用户的评论中获取用户对事物的褒贬倾向。由于情感分类可以在一定程度上解决网上各种评论信息杂乱的现象,方便用户准确地定位所需信息,因此,情感分类已成为一项具有较大实用价值的关键技术,是组织和管理数据的有力手段,该领域的研究得到了很多专家的重视。情感分类的方法有两种,一种是基于语义词典的分类方法,一种是基于机器学习的分类方法。其中,基于机器学习的情感分类虽然已经有过不少的研究,但目前大部分研究只是单纯地从文本出发,以传统的机器学习的方式,只使用文本信息进行情感分类,没有考虑过文本之外的其他一些因素(例如文本所针对产品的属性信息等),这些与文本相关的潜在因素也是十分重要的。以一个餐厅为例,用户对该餐 ...
【技术保护点】
1.一种产品评论情感分类方法,其特征在于,所述情感分类方法包括:/nS1:获取对象产品相关评论的文本信息,对其进行文本转换,以将文本信息转换成统一的向量形式;/nS2:以转换成向量形式的评论为基础,区分并且提取对象产品的至少一个属性标签;/nS3:以转换成向量形式的评论为基础,预测得到评论的情感标签;/nS4:结合对象产品的属性标签和预测得到的评论的情感标签,针对对象产品的每个评论进行情感分类与属性分类的联合学习,寻找两者之间存在的共性关系。/n
【技术特征摘要】
1.一种产品评论情感分类方法,其特征在于,所述情感分类方法包括:
S1:获取对象产品相关评论的文本信息,对其进行文本转换,以将文本信息转换成统一的向量形式;
S2:以转换成向量形式的评论为基础,区分并且提取对象产品的至少一个属性标签;
S3:以转换成向量形式的评论为基础,预测得到评论的情感标签;
S4:结合对象产品的属性标签和预测得到的评论的情感标签,针对对象产品的每个评论进行情感分类与属性分类的联合学习,寻找两者之间存在的共性关系。
2.根据权利要求1所述的产品评论情感分类方法,其特征在于,步骤S1中,所述获取对象产品相关评论的文本信息,对其进行文本转换,以将文本信息转换成统一的向量形式包括以下步骤:
S11:将训练集中每个评论相关句子x中的所有单词统计到词汇集合V中,每个单词设置有相应的编号xi,xi表示句子x中的第i个单词,每个单词xi∈V由一连串的字符Ci=[c1,c2,…,cl]组成,其中l是这个单词的最大长度并且每个单词都要加到这个长度上;
S12:将每个句子x表示为[V[x1],V[x2],…,V[xn]]的形式,其中n为每个句子所包含的单词个数,Q∈Rd×|C|是词汇的表示矩阵,C记为字符的词汇,d为字符向量的维度
S13:将词向量以及词汇集合V作为输入,传入到Embedding层,再由Embedding层构建字符向量Ci,Ci∈Rd×l,将Ci的集合作为LSTM的输入。
3.根据权利要求1所述的产品评论情感分类方法,其特征在于,步骤S2中,所述以转换成向量形式的评论为基础,区分并且提取对象产品的至少一个属性标签是指,采用多层感知器训练二进制分类器来预测对象产品的属性极性,包括以下步骤:
S21:将评论的文本信息表示为输入向量H,采用LSTM的隐藏层以学习更高层次的特征HB:
S22:将隐藏层生成的HB作为softmax输出层的输入,经过softmax层预测商品的属性标签为PB:
PB=softmax(WbHB+Bb)
其中,Wb,Bb均为实验模型的参数。
4.根据权利要求1所述的产品评论情感分类方法,其特征在于,步骤S3中,所述以转换成向量形式的评论为基础,预测得到评论的情感标签是指,采用多层感知器训练二进制分类器预测给定评论的情感极性,包括以下步骤:
S31:将评论的文本信息作为输入向量H,采用LSTM的隐藏层来学习更高层次的特征Hp:
S32:将隐藏层生成的Hp作为normal输出层的...
【专利技术属性】
技术研发人员:章红,王中卿,贾俊铖,那幸仪,
申请(专利权)人:苏州大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。