The invention discloses an emotion feature recognition method and device, which relates to the field of information technology, and solves the problem of low efficiency and low accuracy in the recognition of emotional features in the existing technology. The main technical scheme of the invention is as follows: first, the review data of the target product is obtained, the product review data includes the text data of the product review, and then the text data of the product review is processed according to the preprocessing rules, and multiple sentences containing the same emotional words are obtained; finally, the multiple sentences are included. The longest common substring of the emotion word is determined as the emotional characteristic of the target product. The invention is suitable for the recognition of emotional features.
【技术实现步骤摘要】
一种情感特征的识别方法及装置
本专利技术涉及信息
,尤其涉及一种情感特征的识别方法及装置。
技术介绍
随着信息技术的不断发展,越来越多的用户在网络上购买产品并对购买的产品进行评论。在实际应用中,产品评论直接影响产品营销。近年来,随着产品评论对产品营销的影响越来越大,从产品评论数据中识别出情感特征,然后根据情感特征进行自然语言处理中的情感分析、观点挖掘越来越重要。其中,情感特征是指能够表达正面、负面或者中立的字符串。例如,根据情感特征可以分析有关产品文章中作者对该产品的评价倾向。目前,在进行情感特征识别时,通常采用人工方式识别产品评论数据中的情感特征。然而,由于产品评论数据中的情感特征的数量庞大,若采用人工方式识别产品评论数据中的情感特征,需要投入大量的人力成本、时间成本且人工识别过程中容易出错,导致情感特征识别的效率较低和准确率较低。
技术实现思路
鉴于上述问题,提出了本专利技术,以便提供一种克服上述问题或者至少部分地解决上述问题的情感特征的识别方法及装置。为达到上述目的,本专利技术主要提供如下技术方案:一方面,本专利技术提供了一种情感特征的识别方法,所述方法包括:获取目标产品的评论数据,所述评论数据包括产品评论文本数据;按照预置处理规则对所述产品评论文本数据进行处理,得到包含相同情感词的多个句子;将所述多个句子之间包含所述情感词的最长公共子串确定为情感特征。另一方面,本专利技术提供了一种情感特征的识别装置,所述装置包括:获取单元,用于获取目标产品的评论数据,所述评论数据包括产品评论文本数据;处理单元,用于按照预置处理规则对所述获取单元获取的所述产品评论 ...
【技术保护点】
一种情感特征的识别方法,其特征在于,包括:获取目标产品的评论数据,所述评论数据包括产品评论文本数据;按照预置处理规则对所述产品评论文本数据进行处理,得到包含相同情感词的多个句子;将所述多个句子之间包含所述情感词的最长公共子串确定为所述目标产品的情感特征。
【技术特征摘要】
1.一种情感特征的识别方法,其特征在于,包括:获取目标产品的评论数据,所述评论数据包括产品评论文本数据;按照预置处理规则对所述产品评论文本数据进行处理,得到包含相同情感词的多个句子;将所述多个句子之间包含所述情感词的最长公共子串确定为所述目标产品的情感特征。2.根据权利要求1所述的方法,其特征在于,所述按照预置处理规则对所述产品评论文本数据进行处理,得到包含相同情感词的多个句子包括:按照预设分句规则对所述产品评论文本数据进行分句处理;按照预设分词规则对分句处理得到的句子进行分词处理;根据预置情感词典和分词处理得到的词语,从所述分句处理得到的句子中筛选出包含情感词的句子,所述预置情感词典中保存有不同的情感词;从所述包含情感词的句子中获取包含相同情感词的多个句子。3.根据权利要求1所述的方法,其特征在于,所述评论数据还包括所述产品评论文本数据的评价等级,所述将所述包含情感词的最长公共子串确定为所述目标产品的情感特征之后,所述方法还包括:查找所述目标产品的情感特征对应的评价等级;将所述评价等级与所述目标产品的情感特征进行关联,得到所述情感特征对应的情感类别。4.根据权利要求3所述的方法,其特征在于,所述将所述目标评论文本数据的评价等级与所述目标产品的情感特征进行关联,得到所述情感特征对应的情感类别之后,所述方法还包括:获取所述产品评论文本数据的评价等级对应的评价值;根据所述评价值确定所述多个句子的情感值,并获取所述多个句子包含的词语个数;将所述多个句子的情感值与所述词语个数的商确定为所述情感特征在所述多个句子中的情感值,所述情感特征在所述多个句子中为一个词语;将所述情感特征在所述多个句子中的情感值的平均值确定为所述情感特征的情感值。5.根据权利要求4所述的方法,其特征在于,所述将所述情感特征在所述多个句子中的情感值的平均值确定为所述情感特征的情感值之后,所述方法还包括:获取情感类别相同的各个情感特征以及所述各个情感特征分别对应的情感值;根据所述各个情感特征分别对应的情感值,统计各个情感类别...
【专利技术属性】
技术研发人员:朱波,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。