一种获取词汇情感值的方法、装置、存储介质及处理器制造方法及图纸

技术编号:20916486 阅读:43 留言:0更新日期:2019-04-20 09:41
本发明专利技术公开了一种获取词汇情感值的方法、装置、存储介质及处理器,方法包括:获得非种子情感词在不同文本中的情感值,所述非种子情感词在所在文本中的情感值根据所述所在文本的总情感值和所述所在文本的总词数以及所述所在文本种子情感词的个数获得;根据所述非种子情感词在不同文本中的情感值获得所述非种子情感词的情感平均值;将所述情感平均值作为所述非种子情感词的情感值。能够发现和识别文本中不属于情感词库的词汇的情感值,从而使文本情感分析时可用的情感词数量提高,进而提高文本情感分析的准确性。该方法实现了非种子情感词情感值的自动化获取,减轻了语言学家识别情感词和确定情感词对应的情感值的人工负担。

A Method, Device, Storage Medium and Processor for Acquiring Emotional Value of Vocabulary

The invention discloses a method, device, storage medium and processor for acquiring Lexical Emotional value. The method includes: acquiring emotional value of non-seed emotional words in different texts, and obtaining emotional value of the non-seed emotional words in the text according to the total emotional value of the text and the total number of words of the text and the number of seed emotional words of the text; According to the emotional value of the non-seed emotional words in different texts, the emotional average value of the non-seed emotional words is obtained, and the emotional average value of the non-seed emotional words is taken as the emotional value of the non-seed emotional words. It can discover and recognize the emotional value of words that are not part of the emotional lexicon, so as to increase the number of emotional words available in text emotional analysis, and then improve the accuracy of text emotional analysis. This method realizes the automatic acquisition of emotional values of non-seed emotional words, and reduces the artificial burden of linguists in identifying emotional words and determining their corresponding emotional values.

【技术实现步骤摘要】
一种获取词汇情感值的方法、装置、存储介质及处理器
本专利技术涉及大数据
,尤其涉及一种获取词汇情感值的方法、装置、存储介质及处理器。
技术介绍
情感分析是一种对于自然语言的分析处理方法。目前,情感分析在很多领域都有着重要的作用。例如,通过对买家的评论数据进行情感分析来分析产品的预售率;通过对金融产品量化交易的舆论数据进行情感分析来分析舆论对股市或者基金期货的态度。目前,对文本进行情感分析时,主要是利用文本中出现的与情感词库重合的情感词,以及情感词对应的情感值,对文本的整体情感进行计算。而对于文本中出现的某些不属于情感词库的词汇,由于无法判断其是否为情感词,更无法确定其情感值,因此在文本情感分析时不予考虑。情感词库中的情感词及对应的情感值均是由语言学家根据语言学的业务知识定义并编入的。由于汉语语系中存在着海量的汉语词汇,同时随着互联网的不断发展,新的汉语词汇也在不断地产生和创造出来,因此,存在一些仍未编入情感词库却对文本有着情感倾向影响的未定义的情感词。如果在情感分析时忽略这些词汇的作用,容易导致文本情感分析的准确性不足。因此,在情感词库中情感词有限的情况下,如何提高文本情感分析本文档来自技高网...

【技术保护点】
1.一种获取词汇情感值的方法,其特征在于,包括:获得非种子情感词在不同文本中的情感值,所述非种子情感词在所在文本中的情感值根据所述所在文本的总情感值和所述所在文本的总词数以及所述所在文本种子情感词的个数获得;根据所述非种子情感词在不同文本中的情感值获得所述非种子情感词的情感平均值;将所述情感平均值作为所述非种子情感词的情感值。

【技术特征摘要】
1.一种获取词汇情感值的方法,其特征在于,包括:获得非种子情感词在不同文本中的情感值,所述非种子情感词在所在文本中的情感值根据所述所在文本的总情感值和所述所在文本的总词数以及所述所在文本种子情感词的个数获得;根据所述非种子情感词在不同文本中的情感值获得所述非种子情感词的情感平均值;将所述情感平均值作为所述非种子情感词的情感值。2.根据权利要求1所述的方法,其特征在于,还包括:根据所述非种子情感词的情感值判断所述非种子情感词是否属于情感词。3.根据权利要求2所述的方法,其特征在于,所述根据所述非种子情感词的情感值判断所述非种子情感词是否属于情感词,具体包括:分别获得情感词库中正向种子情感词对应的情感值的正向平均值和负向种子情感词对应的情感值的负向平均值;当所述非种子情感词的情感值大于或等于所述正向平均值时,确定所述非种子情感词属于正向情感词;当所述非种子情感词的情感值小于或等于所述负向平均值时,确定所述非种子情感词属于负向情感词;当所述非种子情感词的情感值大于所述负向平均值且小于所述正向平均值时,确定所述非种子情感词不属于情感词。4.根据权利要求2所述的方法,其特征在于,所述根据所述非种子情感词的情感值判断所述非种子情感词是否属于情感词,具体包括:当所述情感平均值为正数时,确定所述非种子情感词属于正向情感词;当所述情感平均值为负数时,确定所述非种子情感词属于负向情感词;当所述情感平均值为0时,确定所述非种...

【专利技术属性】
技术研发人员:赵耕弘崔朝辉赵立军张霞
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1