用于评价文本的情感度的方法和设备技术

技术编号:10151913 阅读:160 留言:0更新日期:2014-06-30 18:55
本发明专利技术公开了一种用于评价文本的情感度的方法和设备。所述用于评价文本的情感度的方法包括:从待评价的文本中抽取目标词和观点词;在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与所抽取的目标词对应的或者在语义上最相近的目标词簇,搜索与所述目标词簇相关联的所述观点词;根据所述情感语义图中的所述目标词簇与所述观点词之间的情感强度和情感极性,计算所述待评价的文本的情感度。

【技术实现步骤摘要】
用于评价文本的情感度及用于评价实体的方法和设备
本专利技术一般地涉及自然语言处理。具体而言,本专利技术涉及一种能够评价文本的情感度的方法和设备以及一种能够评价实体的方法和设备。
技术介绍
随着互联网应用技术,尤其是Web2.0的蓬勃发展,用户逐渐成为互联网上的内容的重要创造者。用户生成的文本,如产品评论、论坛帖子、博客文章、微博博文等的数量呈几何级增长。在情感分析、情感计算、舆情分析、商业智能等应用中,从海量的非结构化的用户生成文本中抽取情感词,并预测情感词的情感倾向性。然而,情感倾向性,即情感极性,仅仅是对于情感的定性的度量。如果能够获知情感词的情感强度,定量地进行分析,则可以更有效地计算文本的情感度,更好地支持以上列出的各种应用。举例来说,“这款相机还可以”和“我非常喜欢这款相机”表达的情感极性都是正的,但是表达的情感强度是不同的。因此,希望提出一种技术,其能够从定性和定量两个方面评价给定文本的情感度。此外,在不提供具体文本的情况下,也希望能够获知对于给定实体的评价。例如,苹果公司新推出了产品iphone5,则用户可能希望获知对于iphone5的评价。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。本专利技术的目的是针对现有技术的上述问题,提出一种能够评价文本的情感度的方法和设备以及一种能够评价实体的方法和设备。为了实现上述目的,根据本专利技术的一个方面,提供了一种用于评价文本的情感度的方法,包括:从待评价的文本中抽取目标词和观点词;在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与所抽取的目标词对应的或者在语义上最相近的目标词簇,搜索与所述目标词簇相关联的所述观点词;根据所述情感语义图中的所述目标词簇与所述观点词之间的情感强度和情感极性,计算所述待评价的文本的情感度。根据本专利技术的另一个方面,提供了一种用于评价文本的情感度的设备,包括:抽取装置,用于从待评价的文本中抽取目标词和观点词;搜索装置,用于在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与所抽取的目标词对应的或者在语义上最相近的目标词簇,搜索与所述目标词簇相关联的所述观点词;情感度计算装置,用于根据所述情感语义图中的所述目标词簇与所述观点词之间的情感强度和情感极性,计算所述待评价的文本的情感度。根据本专利技术的再一个方面,提供了一种用于评价实体的方法,包括:在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与待评价的实体对应的或者在语义上最相近的第一目标词簇,搜索与所述第一目标词簇相关联的一个或多个第一观点词;根据所述情感语义图中的所述第一目标词簇与所述一个或多个第一观点词之间的情感强度和情感极性,计算所述待评价的实体的情感得分。根据本专利技术的再一个方面,提供了一种用于评价实体的设备,包括:搜索装置,用于在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与待评价的实体对应的或者在语义上最相近的第一目标词簇,搜索与所述第一目标词簇相关联的一个或多个第一观点词;情感得分计算装置,用于根据所述情感语义图中的所述第一目标词簇与所述一个或多个第一观点词之间的情感强度和情感极性,计算所述待评价的实体的情感得分。另外,根据本专利技术的另一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本专利技术的上述方法。此外,根据本专利技术的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本专利技术的上述方法。附图说明参照下面结合附图对本专利技术实施例的说明,会更加容易地理解本专利技术的以上和其它目的、特点和优点。附图中的部件只是为了示出本专利技术的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。附图中:图1示出了情感语义图的示例;图2示出了用于获得情感语义图的训练方法的流程图;图3示出了上述训练方法中步骤S24的具体流程的流程图;图4示出了根据本专利技术第一实施例的文本情感度评价方法的流程图;图5示出了根据本专利技术第二实施例的文本情感度评价方法的流程图;图6示出了根据本专利技术第一实施例的实体评价方法的流程图;图7示出了根据本专利技术第二实施例的实体评价方法的流程图;图8示出了根据本专利技术实施例的训练装置的结构方框图;图9示出了根据本专利技术实施例的文本情感度评价设备的结构方框图;图10示出了根据本专利技术实施例的实体评价设备的结构方框图;以及图11示出了可用于实施根据本专利技术实施例的方法和设备的计算机的示意性框图。具体实施方式在下文中将结合附图对本专利技术的示范性实施例进行详细描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本专利技术,在附图中仅仅示出了与根据本专利技术的方案密切相关的装置结构和/或处理步骤,而省略了与本专利技术关系不大的其他细节。另外,还需要指出的是,在本专利技术的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。本专利技术基于情感语义图来实现用于评价文本的情感度的方法和设备以及用于评价实体的方法和设备。因此,下文中首先介绍情感语义图及其构建方法。首先,应明确,本专利技术评价的文本以及用于生成情感语义图的训练文本应是含有情感的文本,其可能包括目标词、观点词、修饰词。目标词是指含有情感的文本中包括的、整个文本针对其表达情感的词。目标词一般是名词,包括实体,尤其是命名实体。观点词是指对于目标词进行带有感情色彩的评价的词,包括形容词。修饰词是指对于观点词进行关于感情色彩的程度的限定的词,包括副词。应注意,在下文中以汉语为例,对本专利技术进行说明。但本专利技术不限于此。本专利技术同样适用于其它语言文字,目标词、观点词、修饰词的种类和范围可相应地针对具体的语言而有所调整。这对于本领域技术人员而言是例行的工作。可利用大量的训练样本,即含有情感的文本,来生成情感语义图。图1示出了情感语义图的示例。如图1所示,情感语义图包括圆形表示的目标词簇C,如C1、C2、C3等。目标词簇C包括一个目标词或者语义上相同或相近的多个目标词,如照片、相片、图像等。情感语义图还包括三角形表示的观点词O,如O1、O2、O3、O4等;以及矩形表示的修饰词M,如M1、M2、M3等。目标词簇C之间存在语义关联,目标词簇C之间的有向边表明该有向边连接的两个目标词簇C之间的语义关系。语义关系的示例包括:整体与组成部分的关系、行政区划关系、组织关系、人际关系等。目标词簇C之本文档来自技高网...
用于评价文本的情感度的方法和设备

【技术保护点】
一种用于评价文本的情感度的方法,包括:从待评价的文本中抽取目标词和观点词;在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与所抽取的目标词对应的或者在语义上最相近的目标词簇,搜索与所述目标词簇相关联的所述观点词;根据所述情感语义图中的所述目标词簇与所述观点词之间的情感强度和情感极性,计算所述待评价的文本的情感度。

【技术特征摘要】
1.一种用于评价文本的情感度的方法,包括:从待评价的文本中抽取目标词和观点词;在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与所抽取的目标词对应的或者在语义上最相近的目标词簇,搜索与所述目标词簇相关联的所述观点词;根据所述情感语义图中的所述目标词簇与所述观点词之间的情感强度和情感极性,计算所述待评价的文本的情感度,其中所述情感语义图通过如下训练步骤获得:从训练文本中抽取目标词、观点词和修饰词;将语义相同或相近的所述目标词聚类为目标词簇;识别所述观点词和所述修饰词的情感极性;基于所述目标词簇、所述观点词、所述修饰词、所识别的观点词和修饰词的情感极性,构建所述情感语义图;利用所述训练文本,计算所述观点词对于所述目标词簇的情感强度以及所述修饰词的作用强度;利用所计算的情感强度和作用强度,更新所构建的情感语义图;其中所述情感语义图中目标词簇与观点词之间的路径表明该观点词对于该目标词簇的情感强度和情感极性,观点词和修饰词之间的路径表明该修饰词对于该观点词的作用强度和情感极性。2.如权利要求1所述的方法,其中所述情感语义图中还包括有观点词与修饰词之间的关系;并且还从所述待评价的文本中抽取修饰词;还在所述情感语义图中搜索与所述观点词相关联的所述修饰词;还根据所述情感语义图中的所述观点词与所述修饰词之间的作用强度和情感极性,计算所述待评价的文本的情感度。3.如权利要求1或2所述的方法,其中所述情感语义图具有如下形式之一:表、数据库、数组、TXT文本文件、资源描述框架RDF文件、XML文件。4.如权利要求1所述的方法,其中所述训练步骤还包括:基于语义相关的先验知识,确定所述目标词簇之间的关系;其中还基于所述目标词簇之间的关系构建所述情感语义图;并且所述情感语义图中目标词簇与目标词簇之间的有向边表明该有向边连接的两个目标词簇之间的语义关系。5.一种用于评价实体的方法,包括:在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与待评价的实体对应的或者在语义上最相近的第一目标词簇,搜索与所述第一目标词簇相关联的一个或多个第一观点词;根据所述情感语义图中的所述第一目标词簇与所述一个或多个第一观点词之间的情感强度和情感极性,计算所述待评价的实体的情感得分,其中所述情感语义图通过如下训练步骤获得:从训练文本中抽取目标词、观点词和修饰词;将语义相同或相近的所述目标词聚类为目标词簇;识别所述观点词和所述修饰词的情感极性;基于所述目标词簇、所述观点词、所述修饰词、所识别的观点词和修饰词的情感极性,构建所述情感语义图;利用所述训练文本,计算所述观点词对于所述目标词簇的情感强度以及所述修饰词的作用强度;利用所计算的情感强度和作用强度,更新所构建的情感语义图;其中所述情感语义图中目标词簇与观点词之间的路径表明该观点词对于该目标词簇的情感强度和情感极性,观点词和修饰词之间的路径表明该修饰词对于该观点词的作用强度和情感极性。6.如权利要求5所述的方法,其中所述情感语义图中还包括有观点词与修饰词之间的关系;并且所述方法还包括...

【专利技术属性】
技术研发人员:缪庆亮孟遥于浩
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1