产品的偏好区域识别方法和装置制造方法及图纸

技术编号:15691806 阅读:114 留言:0更新日期:2017-06-24 05:18
本发明专利技术涉及一种产品的偏好区域识别方法和装置,该方法包括:获取不同区域的用户对待分析产品的评论文本,并从获取的各条评论文本中提取出所述待分析产品的产品特征;确定在评论文本中用户对产品特征的情感极性;计算产品特征的情感倾向与区域之间的关联程度;从各个产品特征中提取出具有区域偏好的产品特征;对于提取出的具有区域偏好的每一个产品特征,确定该产品特征针对该情感极性的偏好区域。本发明专利技术针对零碎、随意的在线产品评论内容,可以提供偏好区域,使企业更加有针对性的制定营销策略,驱动企业产品的区域化营销策略。

Product preference region identification method and device

Preference region recognition method and apparatus of the present invention relates to a product, the method includes: acquiring users in different areas of the treated product and the comment text analysis, from the comment text acquisition to extract the product characteristics of products to be analyzed; determine the polarity of the characteristics of the product users in the comments in the text; correlation between the emotional tendency and regional characteristics of computing products; extract features from each regional preference product features; for a regional preference of each product feature, determine the product features for the sentiment polarity preference region. The invention can provide the preference area for the fragmentary and random online product review content, and make the enterprise develop the marketing strategy more effectively, and drive the regional marketing strategy of the enterprise product.

【技术实现步骤摘要】
产品的偏好区域识别方法和装置
本专利技术涉及文本挖掘
,尤其是涉及一种产品的偏好区域识别方法和装置。
技术介绍
随着Web2.0技术的快速发展,越来越多的用户选择通过在线社交媒体发表自己的购物体验。研究表明77%的消费者在购买之前会浏览在线评论。相比于个人推荐,75%的消费者更加相信在线产品评论。研究结果说明,在线产品评论在用户的购买决策中扮演着越来越重要的角色,成为企业重要的信息资源。从用户空间分布来看,不同区域的用户由于区域环境、文化以及经济的差异,对产品特征的偏好是不同的。实现对不同区域特征偏好的识别,从而驱动企业产品的区域化营销策略。但是,由于在线产品评论内容的零碎性和随意性,导致从在线产品评论中识别产品特征区域偏好十分复杂。
技术实现思路
针对以上缺陷,本专利技术提供一种产品的偏好区域识别方法和装置,可以提供偏好区域,使企业更加有针对性的制定营销策略,驱动企业产品的区域化营销策略。第一方面,本专利技术提供的产品的偏好区域识别方法包括:获取不同区域的用户对待分析产品的评论文本,并从获取的各条评论文本中提取出所述待分析产品的产品特征,其中的区域为用户所属城市的等级或用户的所属地区;根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性;根据每一个产品特征在包含该产品特征的各条评论文本中的情感极性以及包含该产品特征的各条评论文本的用户的所属区域,计算该产品特征的情感倾向与区域之间的关联程度;根据各个产品特征的情感倾向与区域之间的关联程度,从各个产品特征中提取出具有区域偏好的产品特征;对于提取出的具有区域偏好的每一个产品特征,根据在不同区域中包含该产品特征且该产品特征的情感极性相同的评论文本的数量的统计值与期望值之间的差值,确定该产品特征针对该情感极性的偏好区域。可选的,所述从获取的各条评论文本中提取出所述待分析产品的产品特征,包括:对各条评论文本进行中文分词,从分词结果中提取出名词和名词短语;利用关联规则从提取出的名词和名词短语中提取出频繁项集;对所述频繁项集中的名词和/或名词短语进行同义词聚合,并剔除所述频繁项集中的非产品特征词。可选的,所述根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性,包括:确定所述观点词所属的情感词库的类型;根据所述情感词库的类型,确定该条评论文本中用户对该产品特征的情感极性。可选的,所述每一条评论文本中的每一个产品特征的观点词为在该条评论文本中与该产品特征邻近的预设数量的字符中的形容词。可选的,采用下式计算每一个产品特征的情感倾向与区域之间的关联程度:式中,χ2为该产品特征的情感倾向与区域之间的关联程度,nkj为在第k个区域中包含该产品特征且该产品特征的情感极性为j的评论文本的数量的统计值,Ekj为在第k个区域中包含该产品特征且该产品特征的情感极性为j的评论文本的数量的期望值。可选的,采用下式计算所述期望值Ekj:式中,n为获取的所有评论文本的数量,Cj为包含该产品特征且该产品特征的情感极性为j为评论文本的数量的统计值,Rk为包含该产品特征且用户所属第k个区域的评论文本的数量的统计值。可选的,所述确定该产品特征针对该情感极性的偏好区域,包括:计算在每一个区域中,包含具有该情感极性的该产品特征的评论文本的数量的统计值和期望值之间的差值;将各个区域中所述差值最大的区域作为该产品特征针对该情感极性的偏好区域。可选的,所述方法还包括:在从获取的各条评论文本中提取出所述待分析产品的产品特征后,将每一个产品特征与所述待分析产品的配置文档中的产品属性型号进行配对,并将该产品特征的偏好区域作为该产品属性型号的偏好区域。可选的,所述方法还包括:对与所述待分析产品同一类别的多个产品,分别进行偏好区域识别;根据同一类别的多个不同产品的偏好区域,形成该类别产品的偏好区域。第二方面,本专利技术提供的产品的偏好区域识别装置包括:第一特征提取模块,用于获取不同区域的用户对待分析产品的评论文本,并从获取的各条评论文本中提取出所述待分析产品的产品特征,其中的区域为用户所属城市的等级或用户的所属地区;情感极性确定模块,用于根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性;关联程度计算模块,用于根据每一个产品特征在包含该产品特征的各条评论文本中的情感极性以及包含该产品特征的各条评论文本的用户的所属区域,计算该产品特征的情感倾向与区域之间的关联程度;第二特征提取模块,用于根据各个产品特征的情感倾向与区域之间的关联程度,从各个产品特征中提取出具有区域偏好的产品特征;偏好区域计算模块,用于对于提取出的具有区域偏好的每一个产品特征,根据在不同区域中包含该产品特征且该产品特征的情感极性相同的评论文本的数量的统计值与期望值之间的差值,确定该产品特征针对该情感极性的偏好区域。本专利技术提供的产品的偏好区域识别方法和装置,首先提取评论文本中的产品特征,然后基于产品特征的情感极性和评论用户的所属区域,提取出具有区域偏好的产品特征,最后针对具有区域偏好的产品特征,基于包含具有某一情感极性的某一产品特征的评论文本的数量的统计值和期望值,确定该产品特征针对该情感极性的偏好区域,至此得到该待分析产品的各个具有区域偏好的产品特征针对不同情感极性的偏好区域。可见,本专利技术提供的偏好区域的识别方法,针对零碎、随意的在线产品评论内容,可以提供偏好区域,使企业更加有针对性的制定营销策略,驱动企业产品的区域化营销策略。附图说明为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。图1示出了一种产品的偏好区域识别方法的流程示意图。具体实施方式下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。第一方面,本专利技术提供一种产品的偏好区域识别方法,如图1所示,该方法具体包括以下步骤:S1、获取不同区域的用户对待分析产品的评论文本,并从获取的各条评论文本中提取出所述待分析产品的产品特征,其中的区域为用户所属城市的等级或用户的所属地区;可理解的是,所谓的用户所属城市的等级,例如根据2016年中国城市等级划分标准可知城市有一线城市、二线城市、三线及以下城市,即城市的等级包括一线、二线、三线及以下,城市的等级反映的是区域的经济。所谓的地区,例如根据中国自然地理特征可将城市或乡镇划分为七大地区,例如华东、华南、华北、华中、东北、西北、西南,地区反应的是区域的人文与环境。可见本专利技术中的区域可以针对评论用户所在城市的等级,也可以是评论用户所属的地区。可理解的是,所谓的产品特征,是指能够反映产品的某些特征的参数,例如对于汽车来说,产品特征有外观、空间、油耗、内饰、动力等。S2、根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用本文档来自技高网...
产品的偏好区域识别方法和装置

【技术保护点】
一种产品的偏好区域识别方法,其特征在于,包括:获取不同区域的用户对待分析产品的评论文本,并从获取的各条评论文本中提取出所述待分析产品的产品特征,其中的区域为用户所属城市的等级或用户的所属地区;根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性;根据每一个产品特征在包含该产品特征的各条评论文本中的情感极性以及包含该产品特征的各条评论文本的用户的所属区域,计算该产品特征的情感倾向与区域之间的关联程度;根据各个产品特征的情感倾向与区域之间的关联程度,从各个产品特征中提取出具有区域偏好的产品特征;对于提取出的具有区域偏好的每一个产品特征,根据在不同区域中包含该产品特征且该产品特征的情感极性相同的评论文本的数量的统计值与期望值之间的差值,确定该产品特征针对该情感极性的偏好区域。

【技术特征摘要】
1.一种产品的偏好区域识别方法,其特征在于,包括:获取不同区域的用户对待分析产品的评论文本,并从获取的各条评论文本中提取出所述待分析产品的产品特征,其中的区域为用户所属城市的等级或用户的所属地区;根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性;根据每一个产品特征在包含该产品特征的各条评论文本中的情感极性以及包含该产品特征的各条评论文本的用户的所属区域,计算该产品特征的情感倾向与区域之间的关联程度;根据各个产品特征的情感倾向与区域之间的关联程度,从各个产品特征中提取出具有区域偏好的产品特征;对于提取出的具有区域偏好的每一个产品特征,根据在不同区域中包含该产品特征且该产品特征的情感极性相同的评论文本的数量的统计值与期望值之间的差值,确定该产品特征针对该情感极性的偏好区域。2.根据权利要求1所述的方法,其特征在于,所述从获取的各条评论文本中提取出所述待分析产品的产品特征,包括:对各条评论文本进行中文分词,从分词结果中提取出名词和名词短语;利用关联规则从提取出的名词和名词短语中提取出频繁项集;对所述频繁项集中的名词和/或名词短语进行同义词聚合,并剔除所述频繁项集中的非产品特征词。3.根据权利要求1所述的方法,其特征在于,所述根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性,包括:确定所述观点词所属的情感词库的类型;根据所述情感词库的类型,确定该条评论文本中用户对该产品特征的情感极性。4.根据权利要求1所述的方法,其特征在于,所述每一条评论文本中的每一个产品特征的观点词为在该条评论文本中与该产品特征邻近的预设数量的字符中的形容词。5.根据权利要求1所述的方法,其特征在于,采用下式计算每一个产品特征的情感倾向与区域之间的关联程度:式中,χ2为该产品特征的情感倾向与区域之间的关联程度,nkj为在第k个区域中包含该产品特征且该产品特征的情感极性为j的评论文本的数量的统计值,Ekj为在第k个区域中包含该产品特征且该产品特征的情感极性为j的评...

【专利技术属性】
技术研发人员:张强王安宁杨善林彭张林倪鑫任明仑陆效农
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1