The invention discloses a method and a device for analyzing the emotion tendency, which relates to the technical field of the internet. The method of the invention comprises: identifying learning text in the subjective sentence, learning the sentences in the corresponding text corpus for recording sentiment; recognition of emotion in subjective sentence words; find tendency to make contribution to the development of emotion words collocation in subjective sentences; emotional words and word collocation combination, combination the analysis of subjective sentence corpus, rule generation sentiment; the sentiment analysis rules are rules of the target text in the sentence, the emotion of the target text. The present invention is mainly used in the process of analyzing Chinese text.
【技术实现步骤摘要】
本专利技术涉及互联网
,尤其涉及一种情感倾向性分析的方法及装置。
技术介绍
所谓情感倾向性分析,就是对文本内容中的主观性信息进行分析,挖掘文本所表达的观点和态度。由于每个人的立场、出发点各有不同,因此不同网民看待同一事物的信念、意见、情绪存在很大差异。在论坛、博客等反映草根观点的网络媒体上,这种差异通常表现的尤为明显。因此,为了有效了解网民对政策、时事的观点态度,需要对网络上的文本内容(例如留言)进行情感倾向性分析,定性分析出文本内容传递的观点态度是正向情感、负向情感还是中性情感。现有技术主要采用词语匹配的方法进行情感倾向性分析。这种方法通过分词与词性组合的方式识别短语、句子的情感倾向性,然后通过对短语、句子的情感倾向性的累加获得整个文本的总体情感倾向性。词语匹配的方法需要人工对分词与词性组合的规则进行设定。人工设定的规则数量有限,往往难以覆盖所有的语言现象,为改善这种方式的缺陷,目前还出现了一种机器学习的分析方式。该方式能够由计算机基于给定情感倾向性的文本语料自动学习训练出情感分析规则,只要文本语料的样本空间足够大,就能够训练出足够多的情感分析规则。由于规则的设定无需人工介入,因此目前主流市场上大多采用机器学习的方式进行情感倾向性分析。在实际应用中专利技术人发现,现有的机器学习方式会找出整个文本中的情感词,以及对情感词的倾向方向及倾向程度分别做出贡献的否定副词(例如几乎没有、不是、绝非等)和程度副词(例如一点、非常、特别等),然后根据情感词与副词的结合生成情感分析规则,并根据该规则对目标文本进行情感倾向性分析。这种方式仅仅定性考虑了文本中是否存在 ...
【技术保护点】
一种情感倾向性分析的方法,其特征在于,所述方法包括:识别学习文本中的主观句,所述学习文本中的句子对应有用于记录情感倾向性的标注语料;识别所述主观句中的情感词;在所述主观句中查找对所述情感词做出倾向性贡献的搭配词;将所述情感词与所述搭配词的组合,结合所述主观句的标注语料,生成情感倾向性分析规则;通过所述情感倾向性分析规则对目标文本中的句子进行规则匹配,获得所述目标文本的情感倾向性结果。
【技术特征摘要】
1.一种情感倾向性分析的方法,其特征在于,所述方法包括:识别学习文本中的主观句,所述学习文本中的句子对应有用于记录情感倾向性的标注语料;识别所述主观句中的情感词;在所述主观句中查找对所述情感词做出倾向性贡献的搭配词;将所述情感词与所述搭配词的组合,结合所述主观句的标注语料,生成情感倾向性分析规则;通过所述情感倾向性分析规则对目标文本中的句子进行规则匹配,获得所述目标文本的情感倾向性结果。2.根据权利要求1所述的方法,其特征在于,在所述识别所述主观句中的情感词之前,所述方法进一步包括:根据标点符号将所述主观句拆分为主观标点句;所述识别所述主观句中的情感词,包括:识别所述主观标点句中的情感词。3.根据权利要求2所述的方法,其特征在于,所述在所述主观句中查找对所述情感词做出倾向性贡献的搭配词,包括:在所述主观标点句中,查找对所述主观标点句中的情感词做出倾向性贡献的搭配词;在所述主观句中,查找对所述主观标点句中的情感词做出倾向性贡献、并且位于相邻的主观标点句中的搭配词。4.根据权利要求3所述的方法,其特征在于,所述方法进一步包括:查找对所述主观句中的情感词做出倾向性贡献、并且位于相邻的主观句中的搭配词。5.根据权利要求4所述的方法,其特征在于,所述将所述情感词与所述搭配词的组合,结合所述主观句的标注语料,生成情感倾向性分析规则,包括:将所述主观标点句中的情感词与搭配词的组合,结合所述主观标点句的标注语料,生成标点句分析规则;将所述主观标点句中的情感词与同一主观句中相邻主观标点句中的搭配词的组合,结合相邻的两个主观标点句的标注语料,生成主观句分析规则;将主观句中的情感词与相邻主观句中的搭配词的组合,结合相邻的两个主观句的标注语料,生成句间分析规则。6.一种情感倾向性分析的装置,其...
【专利技术属性】
技术研发人员:朱波,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。