【技术实现步骤摘要】
用于评价文本的情感度及用于评价实体的方法和设备
本专利技术一般地涉及自然语言处理。具体而言,本专利技术涉及一种能够评价文本的情感度的方法和设备以及一种能够评价实体的方法和设备。
技术介绍
随着互联网应用技术,尤其是Web2.0的蓬勃发展,用户逐渐成为互联网上的内容的重要创造者。用户生成的文本,如产品评论、论坛帖子、博客文章、微博博文等的数量呈几何级增长。在情感分析、情感计算、舆情分析、商业智能等应用中,从海量的非结构化的用户生成文本中抽取情感词,并预测情感词的情感倾向性。然而,情感倾向性,即情感极性,仅仅是对于情感的定性的度量。如果能够获知情感词的情感强度,定量地进行分析,则可以更有效地计算文本的情感度,更好地支持以上列出的各种应用。举例来说,“这款相机还可以”和“我非常喜欢这款相机”表达的情感极性都是正的,但是表达的情感强度是不同的。因此,希望提出一种技术,其能够从定性和定量两个方面评价给定文本的情感度。此外,在不提供具体文本的情况下,也希望能够获知对于给定实体的评价。例如,苹果公司新推出了产品iphone5,则用户可能希望获知对于iphone5的评价。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。本专利技术的目的是针对现有技术的上述问题,提出一种能够评价文本的情感度的方法和设备以及一种能够评价实体的方法和 ...
【技术保护点】
一种用于评价文本的情感度的方法,包括:从待评价的文本中抽取目标词和观点词;在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与所抽取的目标词对应的或者在语义上最相近的目标词簇,搜索与所述目标词簇相关联的所述观点词;根据所述情感语义图中的所述目标词簇与所述观点词之间的情感强度和情感极性,计算所述待评价的文本的情感度。
【技术特征摘要】
1.一种用于评价文本的情感度的方法,包括:从待评价的文本中抽取目标词和观点词;在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与所抽取的目标词对应的或者在语义上最相近的目标词簇,搜索与所述目标词簇相关联的所述观点词;根据所述情感语义图中的所述目标词簇与所述观点词之间的情感强度和情感极性,计算所述待评价的文本的情感度,其中所述情感语义图通过如下训练步骤获得:从训练文本中抽取目标词、观点词和修饰词;将语义相同或相近的所述目标词聚类为目标词簇;识别所述观点词和所述修饰词的情感极性;基于所述目标词簇、所述观点词、所述修饰词、所识别的观点词和修饰词的情感极性,构建所述情感语义图;利用所述训练文本,计算所述观点词对于所述目标词簇的情感强度以及所述修饰词的作用强度;利用所计算的情感强度和作用强度,更新所构建的情感语义图;其中所述情感语义图中目标词簇与观点词之间的路径表明该观点词对于该目标词簇的情感强度和情感极性,观点词和修饰词之间的路径表明该修饰词对于该观点词的作用强度和情感极性。2.如权利要求1所述的方法,其中所述情感语义图中还包括有观点词与修饰词之间的关系;并且还从所述待评价的文本中抽取修饰词;还在所述情感语义图中搜索与所述观点词相关联的所述修饰词;还根据所述情感语义图中的所述观点词与所述修饰词之间的作用强度和情感极性,计算所述待评价的文本的情感度。3.如权利要求1或2所述的方法,其中所述情感语义图具有如下形式之一:表、数据库、数组、TXT文本文件、资源描述框架RDF文件、XML文件。4.如权利要求1所述的方法,其中所述训练步骤还包括:基于语义相关的先验知识,确定所述目标词簇之间的关系;其中还基于所述目标词簇之间的关系构建所述情感语义图;并且所述情感语义图中目标词簇与目标词簇之间的有向边表明该有向边连接的两个目标词簇之间的语义关系。5.一种用于评价实体的方法,包括:在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与待评价的实体对应的或者在语义上最相近的第一目标词簇,搜索与所述第一目标词簇相关联的一个或多个第一观点词;根据所述情感语义图中的所述第一目标词簇与所述一个或多个第一观点词之间的情感强度和情感极性,计算所述待评价的实体的情感得分,其中所述情感语义图通过如下训练步骤获得:从训练文本中抽取目标词、观点词和修饰词;将语义相同或相近的所述目标词聚类为目标词簇;识别所述观点词和所述修饰词的情感极性;基于所述目标词簇、所述观点词、所述修饰词、所识别的观点词和修饰词的情感极性,构建所述情感语义图;利用所述训练文本,计算所述观点词对于所述目标词簇的情感强度以及所述修饰词的作用强度;利用所计算的情感强度和作用强度,更新所构建的情感语义图;其中所述情感语义图中目标词簇与观点词之间的路径表明该观点词对于该目标词簇的情感强度和情感极性,观点词和修饰词之间的路径表明该修饰词对于该观点词的作用强度和情感极性。6.如权利要求5所述的方法,其中所述情感语义图中还包括有观点词与修饰词之间的关系;并且所述方法还包括...
【专利技术属性】
技术研发人员:缪庆亮,孟遥,于浩,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。