一种基于深度学习的短文本情感要素抽取方法及装置制造方法及图纸

技术编号:14525144 阅读:97 留言:0更新日期:2017-02-02 03:41
本发明专利技术公开了一种基于深度学习的短文本情感要素抽取方法及装置,涉及机器翻译技术领域;解决了现有计算机系统对于自然语言的理解仍处于相对较低的阶段,情感评价对象识别结果不佳的技术问题;该技术方案包括:采用双向长短时记忆的循环神经网络对句子进行建模,然后为每个类别构建分类器,进行分类;对于输入句子而言,将句子中的每个词表示为词向量,作为输入序列输入到所述循环神经网络中;依次计算所述循环神经网络中的每个隐藏状态,计算句子的特征表示;得到句子的特征表示之后,采用逻辑分类器对句子进行分类,识别句子中所评论的情感要素的类别。

【技术实现步骤摘要】

本专利技术涉及机器翻译
,特别涉及一种基于深度学习的短文本情感要素抽取方法及装置
技术介绍
随着Web2.0的大规模普及,各种资源呈几何爆炸式增长,人们通过网络进行沟通和交流的渠道也越来越畅通。互联网无疑已经成为当代重要的信息载体,为广大互联网用户提供了一个可以发表、交流和共享自己见解的广阔平台。越来越多的用户选择在网络上利用各种交流平台分享自己的观点、生活经历和工作经验。由此,在各类网络平台上产生了大量的评论信息。这些信息包含了信息发表者表达的某种主观情绪,如果能够分析数据中的这些情感因素,我们将可以获得网络具体网络环境的用户舆论对某事物或某事件的整体看法。网络上许多关于电子商务的网站如雨后春笋般出现,这些购物网站或者产品论坛是一个商家介绍自己产品以及消费者发表评论的绝佳平台。对商家而言,这是推荐自己商品和了解消费者反馈的绝佳机会。同时,这也是潜在的购物者了解即将购买的产品,进行消费选择的一种方式。因此越来越多的人会先到网上参考用户的针对意向产品的评论信息然后再做出最终的消费决策,也有越来越多的商家把网络用户的评论作为改进产品、提升服务的信息来源。同时,美国Facebook、Twitter等社交平台的出现和成功,推动了社会网络化的进程,开启了人与人沟通的新模式。我国也相继出现各类社交网络平台,如人人网、开心网、新浪微博、腾讯微博等,正是由于此类网络社交平台具有极大的自由性和开放性,逐渐成为网民意见表达强有力的平台和信息传播重要的集散地,网络言论的数量与多样性达到了空前的程度。然而面对浩瀚的数据资源,人工处理的方式是难以胜任现有的需求的。用户评论中含有了大量的、丰富的、可利用的带有主观色彩的情感信息,同时还包含了许多不为人知的潜在知识。由此,情感分析技术应运而生,它能将各种人类情感转化成实实在在的数据。情感分析可以应用在现实生活的诸多方面,如电子商务、商业智能、民意调查、电子学习、舆情分析、情报分析、企业管理等。商家可以通过这些信息获取消费者意见,更好地理解消费者的喜好与消费习惯,设计生产出更有针对性的产品;政府机构可以通过分析热点事件的舆情,为指定方针政策提供依据;而普通消费者则可以依次作为其购买行为以及消费决策的重要参考。因此面向文本的情感分析研究,已成为近年国内外科学探索的热点。美国Twitter公司曾于2011年发表关于使用微博情感分析比对民意调查[i]以及预测股票市场的相关论文[ii],可见情感分析的应用范围非常广泛,有关的研究课题在国际上已经持续多年。按照分析粒度的不同,情感分析可以分为篇章级、句子级、词语级等等[iii]。句子级情感分析和篇章级情感分析通常只能反映文本整体情感倾向,表达的信息不够完整。越来越多的科研人员将研究重点放在了更细粒度的情感分析上,直接对句子的评价对象展开分析。对每条文本,识别出其中被评论的实体(entity)和被评论的属性(aspect)。但是,由于人类自然语言本身的复杂性和多样性,现有计算机系统对于自然语言的理解仍处于相对较低的阶段;受制于此,情感评价对象识别结果仍不如人意,要将丰富的自然语言现象进行恰如其分的解释,仍有大量问题需要解决。
技术实现思路
本专利技术要解决的是现有计算机系统对于自然语言的理解仍处于相对较低的阶段,情感评价对象识别结果不佳的技术问题。为了解决上述问题,本专利技术提供了一种基于深度学习的短文本情感要素抽取方法,包括:采用双向长短时记忆的循环神经网络对句子进行建模,然后为每个类别构建分类器,进行分类;对于输入句子而言,将句子中的每个词表示为词向量,作为输入序列输入到所述循环神经网络中;依次计算所述循环神经网络中的每个隐藏状态,计算句子的特征表示;得到句子的特征表示之后,采用逻辑分类器对句子进行分类,识别句子中所评论的情感要素的类别。本专利技术还提供了一种基于深度学习的短文本情感要素抽取装置,包括:建模单元,用于采用双向长短时记忆的循环神经网络对句子进行建模,然后为每个类别构建分类器,进行分类;输入单元,用于对于输入句子而言,将句子中的每个词表示为词向量,作为输入序列输入到所述循环神经网络中;计算单元,用于依次计算所述循环神经网络中的每个隐藏状态,计算句子的特征表示;分类单元,用于得到句子的特征表示之后,采用逻辑分类器对句子进行分类,识别句子中所评论的情感要素的类别。本专利技术的技术方案实现了一种基于深度学习的短文本情感要素抽取方法及装置,基于神经网络的深度学习方法,能自动的学习抽象特征表示,建立输入与输出信号间复杂的映射关系,给情感评价对象研究提供了新的思路。基于循环神经网络的句子建模方法,根据句子的特征表示对其进行分类,识别其中的评价对象类别信息。附图说明图1一种基于深度学习的短文本情感要素抽取方法流程图;图2典型循环神经网络结构示意图;图3LSTM结构示意图;图4双向循环神经网络示意图;图5神经网络结构一示意图;图6神经网络结构二示意图;图7神经网络结构三示意图;图8一种基于深度学习的短文本情感要素抽取装置结构示意图。具体实施方式下面将结合附图及实施例对本专利技术的技术方案进行更详细的说明。需要说明的是,如果不冲突,本专利技术实施例以及实施例中的各个特征可以相互结合,均在本专利技术的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。实施例一,一种基于深度学习的短文本情感要素抽取方法,如图1所示,包括:采用双向长短时记忆的循环神经网络对句子进行建模,然后为每个类别构建分类器,进行分类;对于输入句子而言,将句子中的每个词表示为词向量,作为输入序列输入到所述循环神经网络中;依次计算所述循环神经网络中的每个隐藏状态,计算句子的特征表示;得到句子的特征表示之后,采用逻辑分类器对句子进行分类,识别句子中所评论的情感要素的类别。在模型中,直接使用隐藏层的状态对句子进行建模。一种基于深度学习的短文本情感要素抽取方法,基于神经网络的深度学习方法,能自动的学习抽象特征表示,建立输入与输出信号间复杂的映射关系,给情感评价对象研究提供了新的思路。基于循环神经网络的句子建模方法,根据句子的特征表示对其进行分类,识别其中的评价对象类别信息。实施例二,一种基于深度学习的短文本情感要素抽取方法,如图5-7所示,在实施例一的基础上。进一步包括:更优的,如图5所示,所述依次计算所述循环神经网络中的每个隐藏状态,具体为第t时刻的隐藏层节点计算方式如下,其中,htf是前向循环神经网络的隐藏节点值,htb是后向循环神经网络的隐藏节点值,选用最后时刻的隐藏节点值作为句子的向量表示,即其中c是需要的句子向量表示,冒号表示向量拼接。本专利技术中,这种策略记为brnn-final。这种方法为一种最为直接的策略来获得句子的整体表示。使用最后一个时刻状态捕捉到句子的全部信息,简便、易行。更优的,如图6所示,所述依次计算所述循环神经网络中的每个隐藏状态,具体为给定输入序列,循环神经网络可以产生一个隐藏状态序列,其中,第i时刻的状态由前向循环神经网络和后向循环神经网络共同拼接而成,将所有隐藏状态序列输入到一个最大池化层中,隐藏状态序列组合起来可以视为一个矩阵,所述最大池化层取输入矩阵的每一行的最大值作为输出值,然后将这个固定大小的向量作为句子本文档来自技高网
...

【技术保护点】
一种基于深度学习的短文本情感要素抽取方法,其特征在于,采用双向长短时记忆的循环神经网络对句子进行建模,然后为每个类别构建分类器,进行分类;对于输入句子而言,将句子中的每个词表示为词向量,作为输入序列输入到所述循环神经网络中;依次计算所述循环神经网络中的每个隐藏状态,计算句子的特征表示;得到句子的特征表示之后,采用逻辑分类器对句子进行分类,识别句子中所评论的情感要素的类别。

【技术特征摘要】
1.一种基于深度学习的短文本情感要素抽取方法,其特征在于,采用双向长短时记忆的循环神经网络对句子进行建模,然后为每个类别构建分类器,进行分类;对于输入句子而言,将句子中的每个词表示为词向量,作为输入序列输入到所述循环神经网络中;依次计算所述循环神经网络中的每个隐藏状态,计算句子的特征表示;得到句子的特征表示之后,采用逻辑分类器对句子进行分类,识别句子中所评论的情感要素的类别。2.如权利要求1所述的方法,其特征在于,所述依次计算所述循环神经网络中的每个隐藏状态,具体为第t时刻的隐藏层节点计算方式如下,其中,htf是前向循环神经网络的隐藏节点值,htb是后向循环神经网络的隐藏节点值,选用最后时刻的隐藏节点值作为句子的向量表示,即其中c是需要的句子向量表示,冒号表示向量拼接。3.如权利要求1所述的方法,其特征在于,所述依次计算所述循环神经网络中的每个隐藏状态,具体为给定输入序列,循环神经网络可以产生一个隐藏状态序列,其中,第i时刻的状态由前向循环神经网络和后向循环神经网络共同拼接而成,将所有隐藏状态序列输入到一个最大池化层中,隐藏状态序列组合起来可以视为一个矩阵,所述最大池化层取输入矩阵的每一行的最大值作为输出值,然后将这个固定大小的向量作为句子的整体表示输入到分类器中。4.如权利要求1所述的方法,其特征在于,所述依次计算所述循环神经网络中的每个隐藏状态,具体为将循环神经网络得到的隐藏状态矩阵输入到卷积神经网络中。5.如权利要求1所述的方法,其特征在于,为每个类别训练一个二分类器。6.一种基于深度学习的短文本情感要素抽取装置,其...

【专利技术属性】
技术研发人员:程国艮巢文涵周庆
申请(专利权)人:中译语通科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1