情感倾向性分析的方法及装置制造方法及图纸

技术编号:15272995 阅读:66 留言:0更新日期:2017-05-04 13:05
本发明专利技术公开了一种情感倾向性分析的方法及装置,涉及互联网技术领域,为解决情感倾向性分析结果不准确的问题而发明专利技术。本发明专利技术的方法包括:识别学习文本中的主观句,学习文本中的句子对应有用于记录情感倾向性的标注语料;识别主观句中的情感词;在主观句中查找对情感词做出倾向性贡献的搭配词;将情感词与搭配词的组合,结合主观句的标注语料,生成情感倾向性分析规则;通过情感倾向性分析规则对目标文本中的句子进行规则匹配,获得目标文本的情感倾向性结果。本发明专利技术主要用于对汉语文本进行情感倾向性分析的过程中。

Method and device for analysis of emotion tendentiousness

The invention discloses a method and a device for analyzing the emotion tendency, which relates to the technical field of the internet. The method of the invention comprises: identifying learning text in the subjective sentence, learning the sentences in the corresponding text corpus for recording sentiment; recognition of emotion in subjective sentence words; find tendency to make contribution to the development of emotion words collocation in subjective sentences; emotional words and word collocation combination, combination the analysis of subjective sentence corpus, rule generation sentiment; the sentiment analysis rules are rules of the target text in the sentence, the emotion of the target text. The present invention is mainly used in the process of analyzing Chinese text.

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种情感倾向性分析的方法及装置
技术介绍
所谓情感倾向性分析,就是对文本内容中的主观性信息进行分析,挖掘文本所表达的观点和态度。由于每个人的立场、出发点各有不同,因此不同网民看待同一事物的信念、意见、情绪存在很大差异。在论坛、博客等反映草根观点的网络媒体上,这种差异通常表现的尤为明显。因此,为了有效了解网民对政策、时事的观点态度,需要对网络上的文本内容(例如留言)进行情感倾向性分析,定性分析出文本内容传递的观点态度是正向情感、负向情感还是中性情感。现有技术主要采用词语匹配的方法进行情感倾向性分析。这种方法通过分词与词性组合的方式识别短语、句子的情感倾向性,然后通过对短语、句子的情感倾向性的累加获得整个文本的总体情感倾向性。词语匹配的方法需要人工对分词与词性组合的规则进行设定。人工设定的规则数量有限,往往难以覆盖所有的语言现象,为改善这种方式的缺陷,目前还出现了一种机器学习的分析方式。该方式能够由计算机基于给定情感倾向性的文本语料自动学习训练出情感分析规则,只要文本语料的样本空间足够大,就能够训练出足够多的情感分析规则。由于规则的设定无需人工介入,因此目前主流市场上大多采用机器学习的方式进行情感倾向性分析。在实际应用中专利技术人发现,现有的机器学习方式会找出整个文本中的情感词,以及对情感词的倾向方向及倾向程度分别做出贡献的否定副词(例如几乎没有、不是、绝非等)和程度副词(例如一点、非常、特别等),然后根据情感词与副词的结合生成情感分析规则,并根据该规则对目标文本进行情感倾向性分析。这种方式仅仅定性考虑了文本中是否存在情感词和副词,但是并没有考虑情感词与副词之间的关系。举例而言,对于文本“调控房价的政策还是起作用的,没有因施政范围过小而受到影响。”现有的学习方式着眼于文本内容整体找出情感词“起作用”和否定副词“没有”,然后将两者结合获得“没有起作用”的情感分析规则,显然这与该文本实际要表达的情感方向完全相反。可以看出,现有的机器学习方式容易生成错误的情感分析规则,由此影响情感倾向性分析结果的准确性。
技术实现思路
本专利技术提供了一种情感倾向性分析的方法及装置,能够解决因情感分析规则错误导致的情感倾向性分析结果不准确的问题。为解决上述技术问题,一方面,本专利技术提供了一种情感倾向性分析的方法,该方法包括:识别学习文本中的主观句,所述学习文本中的句子对应有用于记录情感倾向性的标注语料;识别所述主观句中的情感词;在所述主观句中查找对所述情感词做出倾向性贡献的搭配词;将所述情感词与所述搭配词的组合,结合所述主观句的标注语料,生成情感倾向性分析规则;通过所述情感倾向性分析规则对目标文本中的句子进行规则匹配,获得所述目标文本的情感倾向性结果。另一方面,本专利技术还提供了一种情感倾向性分析的装置,该装置包括:识别单元,用于识别学习文本中的主观句,所述学习文本中的句子对应有用于记录情感倾向性的标注语料;所述识别单元还用于识别所述主观句中的情感词;查找单元,用于在所述主观句中查找对所述情感词做出倾向性贡献的搭配词;生成单元,用于将所述情感词与所述搭配词的组合,结合所述主观句的标注语料,生成情感倾向性分析规则;匹配单元,用于通过所述情感倾向性分析规则对目标文本中的句子进行规则匹配,获得所述目标文本的情感倾向性结果。本专利技术提供的情感倾向性分析的方法及装置,能够从学习文本中识别出表达态度、观点或立场的主观句,然后识别主观句中带有主观色彩的情感词,在主观句中查找诸如程度副词、否定副词等对情感词的情感倾向做出贡献的搭配词,并将情感词与搭配词的组合结合主观句的标注语料,生成针对语句的情感倾向性分析规则,最后通过情感倾向性分析规则对目标文本中的句子进行规则匹配,获得目标文本的情感倾向性结果。与现有技术相比,本专利技术能够对主观句内的情感词和搭配词进行组合,而非将整篇文本中的情感词和搭配词进行组合。由于句子内的情感词和搭配词之间的关联程度较强,或者说基于一般的语言习惯而言,一个句子中的搭配词通常用于修饰该句中的情感词,因此机器学习获得的情感倾向性分析规则更为准确,使用这种规则进行情感倾向性分析可以大大提高分析结果的准确度。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种情感倾向性分析的方法流程图;图2示出了本专利技术实施例提供的另一种情感倾向性分析的方法流程图;图3示出了本专利技术实施例提供的一种情感倾向性分析的装置的组成框图;图4示出了本专利技术实施例提供的另一种情感倾向性分析的装置的组成框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。为解决现有技术中,基于机器学习方式获得的情感倾向性分析规则不准确的问题,本专利技术实施例提供了一种情感倾向性分析的方法,该方法可以通过对机器学习算法的改进,获得更为准确的情感倾向性分析规则,并能够通过对该规则的使用提升情感倾向性分析结果的准确性。如图1所示,该方法包括:101、识别学习文本中的主观句,学习文本中的句子对应有用于记录情感倾向性的标注语料。本实施例中的学习文本为机器学习所使用的样本数据,该学习文本在使用前通过人工方式添加有标注语料,用于记录句子的情感倾向性。例如,对于某文本“这项政策制定的非常好。”,其标注语料可以为“正向情感”。本实施例中,学习文本中的标注语料包括针对自然句记录的标注语料,例如“这项政策制定的非常好。(正向情感)”,也包括针对标点句记录的标注语料,例如“这项政策出台的本意是好的(正向情感),但是并不被社会所认可(负向情感)。”,还可以包括针对短语、词、字的标注语料。其中,所谓自然句是指以句号、感叹号、问号等符号做结尾的完整语句,所谓标点句则是指以逗号、顿号、分号等符号做结尾的非完整语句。通常情况下,自然句由标点句组成。实际应用中,标注语料一般不添加到文本内容中,而是以配置信息等其他独立于文本内容的形式与文本内容进行关联,上述示例中标注语料的添加形式仅为便于理解之用,不作为对实际标注形式的具体限定。情感倾向性的表达通常由两个维度的指标组合而成,其一为定性性质的倾向方向指标,例如正向情感、负向情感、中性情感;其二为定量性质的倾向程度指标,例如通过连续或离散的数值区分“一般”、“还行”、“好”、“很好”、“非常好”等不同程度的情感表达。一般情况下,标注语料中至少需要包含倾向方向指标,用于对语句的情感倾向进行最基本的定性标注。为便于方案的理解,本实施例后续及后续实施例将仅以定性分析情感倾向性为例进行说明。在对学习文本进行学习时,首先要从文本中识别提取出包含本文档来自技高网
...
情感倾向性分析的方法及装置

【技术保护点】
一种情感倾向性分析的方法,其特征在于,所述方法包括:识别学习文本中的主观句,所述学习文本中的句子对应有用于记录情感倾向性的标注语料;识别所述主观句中的情感词;在所述主观句中查找对所述情感词做出倾向性贡献的搭配词;将所述情感词与所述搭配词的组合,结合所述主观句的标注语料,生成情感倾向性分析规则;通过所述情感倾向性分析规则对目标文本中的句子进行规则匹配,获得所述目标文本的情感倾向性结果。

【技术特征摘要】
1.一种情感倾向性分析的方法,其特征在于,所述方法包括:识别学习文本中的主观句,所述学习文本中的句子对应有用于记录情感倾向性的标注语料;识别所述主观句中的情感词;在所述主观句中查找对所述情感词做出倾向性贡献的搭配词;将所述情感词与所述搭配词的组合,结合所述主观句的标注语料,生成情感倾向性分析规则;通过所述情感倾向性分析规则对目标文本中的句子进行规则匹配,获得所述目标文本的情感倾向性结果。2.根据权利要求1所述的方法,其特征在于,在所述识别所述主观句中的情感词之前,所述方法进一步包括:根据标点符号将所述主观句拆分为主观标点句;所述识别所述主观句中的情感词,包括:识别所述主观标点句中的情感词。3.根据权利要求2所述的方法,其特征在于,所述在所述主观句中查找对所述情感词做出倾向性贡献的搭配词,包括:在所述主观标点句中,查找对所述主观标点句中的情感词做出倾向性贡献的搭配词;在所述主观句中,查找对所述主观标点句中的情感词做出倾向性贡献、并且位于相邻的主观标点句中的搭配词。4.根据权利要求3所述的方法,其特征在于,所述方法进一步包括:查找对所述主观句中的情感词做出倾向性贡献、并且位于相邻的主观句中的搭配词。5.根据权利要求4所述的方法,其特征在于,所述将所述情感词与所述搭配词的组合,结合所述主观句的标注语料,生成情感倾向性分析规则,包括:将所述主观标点句中的情感词与搭配词的组合,结合所述主观标点句的标注语料,生成标点句分析规则;将所述主观标点句中的情感词与同一主观句中相邻主观标点句中的搭配词的组合,结合相邻的两个主观标点句的标注语料,生成主观句分析规则;将主观句中的情感词与相邻主观句中的搭配词的组合,结合相邻的两个主观句的标注语料,生成句间分析规则。6.一种情感倾向性分析的装置,其...

【专利技术属性】
技术研发人员:朱波
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1