The embodiment of the present invention relates to the field of data processing, and discloses an emotional analysis method, device, electronic device and storage medium for text. In some embodiments of the present application, the emotional analysis method of the text includes: acquiring the words in the text to be analyzed; determining the polarity score of the words belonging to the emotional dictionary in the text to be analyzed according to the emotional dictionary; and performing the following operations for each word not belonging to the emotional dictionary in the text to be analyzed: determining the most important words in the emotional dictionary and those not belonging to the emotional dictionary. According to the polarity scores of the nearest words, the polarity scores of words that do not belong to the emotional dictionary are determined. According to the polarity scores of each word in the text to be analyzed, the emotional analysis results of the text to be analyzed are determined. In this implementation, according to the polarity score of the nearest word, the polarity score is given to words that are not part of the emotional dictionary in the text, which improves the accuracy of the emotional analysis of the text.
【技术实现步骤摘要】
一种文本的情感分析方法、装置、电子设备及存储介质
本专利技术实施例涉及数据处理领域,特别涉及一种文本的情感分析方法、装置、电子设备及存储介质。
技术介绍
目前,社交媒体上有大量关于产品和服务的用户评论或评价,它已经成为用户日常决策的信息来源。由于对某个产品的大量不同意见,用户可能很难根据这些评论或评价总结出总体的情感。情感词典(SentiWordNet)被认为是一种有效的情感分析词汇资源。SentiWordNet中的每个术语都与一组表示其积极性、消极性和中性的分数相关联。分数可以取决于术语的词性标记。它通常用于情感分析,它是确定文本情感取向(积极、消极或中性)的方法的集合。然而,专利技术人发现现有技术中至少存在如下问题:目前,SentiWordNet是确定文本极性的最常用的情感词典。然而,若需要分析的文本中的词汇里有大量的词汇没有出现在SentiWordNet中,这将限制情感分析的结果的正确率。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术实施方式的目的在于提供一种文本的情感分析方法、装置、电子设备及存储介质,使得能够确定文本的情感。为解决上述技术问题,本专利技术的实施方式提供了一种文本的情感分析方法,包括以下步骤:获取待分析文本中的词汇;根据情感词典,确定待分析文本中属于情感词典的词汇的极性分数;其中,情感词典用于确定情感词典所包含的单词的极性分数;针对待分析文本中的每个不属于情感词典的词汇,分别进行以下操作:确定情感词典中与不属于情感词典的词汇 ...
【技术保护点】
1.一种文本的情感分析方法,其特征在于,包括:获取待分析文本中的词汇;根据情感词典,确定所述待分析文本中属于所述情感词典的词汇的极性分数;其中,所述情感词典用于确定所述情感词典所包含的单词的极性分数;针对所述待分析文本中的每个不属于所述情感词典的词汇,分别进行以下操作:确定所述情感词典中与所述不属于所述情感词典的词汇最接近的单词;根据所述最接近的单词的极性分数,确定所述不属于所述情感词典的词汇的极性分数;根据所述待分析文本中的词汇的极性分数,确定所述待分析文本的情感分析结果。
【技术特征摘要】
2018.12.29 CN 201811633385X1.一种文本的情感分析方法,其特征在于,包括:获取待分析文本中的词汇;根据情感词典,确定所述待分析文本中属于所述情感词典的词汇的极性分数;其中,所述情感词典用于确定所述情感词典所包含的单词的极性分数;针对所述待分析文本中的每个不属于所述情感词典的词汇,分别进行以下操作:确定所述情感词典中与所述不属于所述情感词典的词汇最接近的单词;根据所述最接近的单词的极性分数,确定所述不属于所述情感词典的词汇的极性分数;根据所述待分析文本中的词汇的极性分数,确定所述待分析文本的情感分析结果。2.根据权利要求1所述文本的情感分析方法,其特征在于,所述确定所述情感词典中与所述不属于所述情感词典的词汇最接近的单词,具体包括:确定所述不属于所述情感词典的词汇的第一词向量,以及所述情感词典的每个单词的第二词向量;确定每个所述第二词向量各自与所述第一词向量之间的距离;将与所述第一词向量距离最近的第二词向量所对应的单词,作为与所述不属于所述情感词典的词汇最接近的单词。3.根据权利要求2所述的文本的情感分析方法,其特征在于,所述确定每个所述第二词向量各自与所述第一词向量之间的距离,具体包括:针对每个第二词向量,分别进行以下操作:按照公式a计算所述第二词向量与所述第一词向量的距离;其中,公式a为:其中,ai表示所述第二词向量,j表示所述第一词向量,‖A‖[F]表示所述第一词向量与所述第二词向量之间的距离,abs是绝对值函数。4.根据权利要求2所述的文本的情感分析方法,其特征在于,所述确定所述不属于所述情感词典的词汇的第一词向量,以及所述情感词典的每个单词的第二词向量,具体包括:使用词向量模型Word2VEC方法,确定所述第一词向量,以及所述第二词向量。5.根据权利要求1所述的文本的情感分析方法,其特征在于,所述根据情感词典,确定所述待分析文本中属于所述情感词典的词汇的极性分数,具体包括:确定所述属于所述情感词典的词汇在所述待分析文本中的词性;查...
【专利技术属性】
技术研发人员:陈海波,
申请(专利权)人:深兰科技上海有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。