Preference region recognition method and apparatus of the present invention relates to a product, the method includes: acquiring users in different areas of the treated product and the comment text analysis, from the comment text acquisition to extract the product characteristics of products to be analyzed; determine the polarity of the characteristics of the product users in the comments in the text; correlation between the emotional tendency and regional characteristics of computing products; extract features from each regional preference product features; for a regional preference of each product feature, determine the product features for the sentiment polarity preference region. The invention can provide the preference area for the fragmentary and random online product review content, and make the enterprise develop the marketing strategy more effectively, and drive the regional marketing strategy of the enterprise product.
【技术实现步骤摘要】
产品的偏好区域识别方法和装置
本专利技术涉及文本挖掘
,尤其是涉及一种产品的偏好区域识别方法和装置。
技术介绍
随着Web2.0技术的快速发展,越来越多的用户选择通过在线社交媒体发表自己的购物体验。研究表明77%的消费者在购买之前会浏览在线评论。相比于个人推荐,75%的消费者更加相信在线产品评论。研究结果说明,在线产品评论在用户的购买决策中扮演着越来越重要的角色,成为企业重要的信息资源。从用户空间分布来看,不同区域的用户由于区域环境、文化以及经济的差异,对产品特征的偏好是不同的。实现对不同区域特征偏好的识别,从而驱动企业产品的区域化营销策略。但是,由于在线产品评论内容的零碎性和随意性,导致从在线产品评论中识别产品特征区域偏好十分复杂。
技术实现思路
针对以上缺陷,本专利技术提供一种产品的偏好区域识别方法和装置,可以提供偏好区域,使企业更加有针对性的制定营销策略,驱动企业产品的区域化营销策略。第一方面,本专利技术提供的产品的偏好区域识别方法包括:获取不同区域的用户对待分析产品的评论文本,并从获取的各条评论文本中提取出所述待分析产品的产品特征,其中的区域为用户所属城市的等级或用户的所属地区;根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性;根据每一个产品特征在包含该产品特征的各条评论文本中的情感极性以及包含该产品特征的各条评论文本的用户的所属区域,计算该产品特征的情感倾向与区域之间的关联程度;根据各个产品特征的情感倾向与区域之间的关联程度,从各个产品特征中提取出具有区域偏好的产品特征;对于提取出的具有区域偏好的每 ...
【技术保护点】
一种产品的偏好区域识别方法,其特征在于,包括:获取不同区域的用户对待分析产品的评论文本,并从获取的各条评论文本中提取出所述待分析产品的产品特征,其中的区域为用户所属城市的等级或用户的所属地区;根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性;根据每一个产品特征在包含该产品特征的各条评论文本中的情感极性以及包含该产品特征的各条评论文本的用户的所属区域,计算该产品特征的情感倾向与区域之间的关联程度;根据各个产品特征的情感倾向与区域之间的关联程度,从各个产品特征中提取出具有区域偏好的产品特征;对于提取出的具有区域偏好的每一个产品特征,根据在不同区域中包含该产品特征且该产品特征的情感极性相同的评论文本的数量的统计值与期望值之间的差值,确定该产品特征针对该情感极性的偏好区域。
【技术特征摘要】
1.一种产品的偏好区域识别方法,其特征在于,包括:获取不同区域的用户对待分析产品的评论文本,并从获取的各条评论文本中提取出所述待分析产品的产品特征,其中的区域为用户所属城市的等级或用户的所属地区;根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性;根据每一个产品特征在包含该产品特征的各条评论文本中的情感极性以及包含该产品特征的各条评论文本的用户的所属区域,计算该产品特征的情感倾向与区域之间的关联程度;根据各个产品特征的情感倾向与区域之间的关联程度,从各个产品特征中提取出具有区域偏好的产品特征;对于提取出的具有区域偏好的每一个产品特征,根据在不同区域中包含该产品特征且该产品特征的情感极性相同的评论文本的数量的统计值与期望值之间的差值,确定该产品特征针对该情感极性的偏好区域。2.根据权利要求1所述的方法,其特征在于,所述从获取的各条评论文本中提取出所述待分析产品的产品特征,包括:对各条评论文本进行中文分词,从分词结果中提取出名词和名词短语;利用关联规则从提取出的名词和名词短语中提取出频繁项集;对所述频繁项集中的名词和/或名词短语进行同义词聚合,并剔除所述频繁项集中的非产品特征词。3.根据权利要求1所述的方法,其特征在于,所述根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性,包括:确定所述观点词所属的情感词库的类型;根据所述情感词库的类型,确定该条评论文本中用户对该产品特征的情感极性。4.根据权利要求1所述的方法,其特征在于,所述每一条评论文本中的每一个产品特征的观点词为在该条评论文本中与该产品特征邻近的预设数量的字符中的形容词。5.根据权利要求1所述的方法,其特征在于,采用下式计算每一个产品特征的情感倾向与区域之间的关联程度:式中,χ2为该产品特征的情感倾向与区域之间的关联程度,nkj为在第k个区域中包含该产品特征且该产品特征的情感极性为j的评论文本的数量的统计值,Ekj为在第k个区域中包含该产品特征且该产品特征的情感极性为j的评...
【专利技术属性】
技术研发人员:张强,王安宁,杨善林,彭张林,倪鑫,任明仑,陆效农,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。