【技术实现步骤摘要】
一种基于序列到序列的评论方面类别检测方法及系统
[0001]本专利技术涉及电子商务
,具体而言,涉及一种基于序列到序列的评论方面类别检测方法及系统。
技术介绍
[0002]随着在线购物的兴起,评论开始爆发式的增长,比如在很多购物网站上都会有成千上万条关于餐厅或酒店的评论,这些评论涉及食物,价格,环境,服务等。很显然一般的用户很难使用这些庞大的数据提取信息。因此,基于方面情绪分析(ABSA)开始出现,这种方法旨在自动从这些评论中提取有用的信息。尤其方面类别检测(ACD)它是 ABSA 的子任务,主要侧重于如何为每条评论分配方面类别。例如,"服务"可以分配给评论"这家餐厅的服务真的很好!两类"服务"和"食物"需要分配给评论"餐厅的服务员非常好,但菜肴真的很一般!通常,一条评论包含多个句子,每个句子又可能包含多个方面类别。因此,ACD可视为多标签分类任务。鉴于此,许多以前的研究利用一对一的分类模型为每个方面类别训练一个分类器,并取得了良好的效果。但是训练多个分类器是一项耗时且耗费资源的工作。为了解决这个问题,一些研究人员应用 ...
【技术保护点】
【技术特征摘要】
1.一种基于序列到序列的评论方面类别检测方法,其特征在于,包括:S1.获取若干条已知方面类别的用户评论中各个句子的隐藏状态;S2.根据自注意力权重矩阵和各个句子的隐藏状态进行乘法运算得到各个句子的自注意力嵌入矩阵;S3.将所述自注意力嵌入矩阵变换为一维向量并通过一个全连接层进行处理得到各个句子的句子特征向量;S4. 获取初始化的方面类别嵌入向量和当前句子的上下文向量,并将初始化的方面类别嵌入向量、当前句子的上下文向量和隐藏状态进行合并后通过LSTM网络进行处理得到所述当前句子初始时刻的输出隐藏状态和方面类别嵌入向量;S5.将所述当前句子上一时刻的输出隐藏状态、方面类别嵌入向量和上下文向量合并后再次通过LSTM网络进行处理得到当前时刻的输出隐藏状态和方面类别嵌入向量;以此循环,直到识别到所述当前句子的尾部后输出各个句子的最终输出隐藏状态;S6.将所述当前句子的最终输出隐藏状态与对应的句子特征向量进行拼接后通过一个全连接层和softmax函数进行处理,得到所述当前句子的方面类别检测结果。2.根据权利要求1所述的方法,其特征在于,所述S2的实现方式为:上式中,W
s1
和W
s2
均为权重矩阵;且、W
s2
∈R
r
×
d
,R表示实数域,r是表示句子中方面类别个数的超参数,d和u2是表示矩阵大小的超参数;H表示句子的隐藏状态;H
T
表示H的转置矩阵;A表示预设的自注意力权重矩阵;表示自注意力嵌入矩阵。3.根据权利要求2所述的方法,其特征在于,所述S3的实现方式为:上式中,v表示句子特征向量,且,u3表示超参数;W1表示权重系数;b1表示偏置值;m表示自注意力嵌入矩阵M变换后的一维向量,且。4.根据权利要求2所述的方法,其特征在于,所述S5的实现方式为:上式中,s
t
表示当前句子的最终输出隐藏状态;g(y at
‑1)表示上一时刻当前句子的方面类别嵌入向量;y at
‑1表示上一时刻当前句子所属方面类别的概率分布。5.根据权利要求2所述的方法,其特征在于,所述S6的实现方式为:上式中,v表示句子特征向量;s
t
表示当前句子的输出隐藏状态;W
f
表示权重系数;b
f
表示偏置值;y at
表示当前句子的方面类别概率分布。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:S7.通过一个全...
【专利技术属性】
技术研发人员:王思宇,黄鹏,江岭,
申请(专利权)人:成都晓多科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。