商品评论信息中重复信息处理方法技术

技术编号:14504331 阅读:43 留言:0更新日期:2017-01-31 12:17
本发明专利技术提供了一种商品评论信息中重复信息处理方法,其包括:S1:从商品评论信息中选取第一评论信息和第二评论信息;S2:从第一评论信息和第二评论信息中选择相同的关键词,并计算每个关键词在第一评论信息中出现的第一次数以及每个关键词在第二评论信息中出现的第二次数;S3:比较每个关键词的第一次数和第二次数,并计算每个关键词的第一次数和第二次数之间的差值;S4:如果第一次数大于第二次数,且差值在预设阈值内,则保留第一评论信息并隐藏第二评论信息;如果第一次数小于第二次数,且差值在预设阈值内,则保留第二评论信息并隐藏第一评论信息,本发明专利技术能够识别并处理重复的评论信息。

【技术实现步骤摘要】

本专利技术涉及计算机网络
,特别是涉及一种商品评论信息中重复信息处理方法
技术介绍
在电子商务领域,人们出了关心的商品本身的描述信息以外,还特别关注商品的评论信息,而这些评论信息都是购买过该商品的用户作出的,评论信息包括商品质量、性能参数等,是反映商品性能和服务质量的重要信息,往往受到人们的重点关注。但是,在实际情况中,很多用户对评论信息并不重视,只是为了完结商品网购流程而敷衍了事,导致常常出现一些毫无实际内容的评论信息,当某件商品存在很多条这样的评论信息时,将要购买该商品的用户在浏览评论信息时,将很难快速获得有价值的评论信息,这就导致商品交易效率比较低。
技术实现思路
本专利技术主要解决的技术问题是提供一种商品评论信息中重复信息处理方法,能够识别并处理重复的评论信息。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种商品评论信息中重复信息处理方法,包括:S1:从商品评论信息中选取第一评论信息和第二评论信息;S2:从所述第一评论信息和第二评论信息中选择相同的关键词,并计算所述每个关键词在所述第一评论信息中出现的第一次数以及所述每个关键词在所述第二评论信息中出现的第二次数;S3:比较所述每个关键词的第一次数和第二次数,并计算所述每个关键词的第一次数和第二次数之间的差值;S4:如果所述第一次数大于第二次数,且所述差值在预设阈值内,则保留所述第一评论信息并隐藏所述第二评论信息;如果所述第一次数小于第二次数,且所述差值在预设阈值内,则保留所述第二评论信息并所述隐藏第一评论信息。优选地,还包括:S5:如果所述第一次数大于第二次数或者所述第一次数小于第二次数,但所述差值大于预设阈值,则均保留所述第一评论信息和所述第二评论信息。区别于现有技术的情况,本专利技术的有益效果是:通过不同评论信息中关键词的比对来查找内容实质相同的评论信息,从而能够识别并处理重复的评论信息,可以提高用户的体验。附图说明图1是本专利技术实施例商品评论信息中重复信息处理方法的流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1,是本专利技术实施例商品评论信息中重复信息处理方法的流程示意图。本专利技术实施例商品评论信息中重复信息处理方法包括以下步骤:S1:从商品评论信息中选取第一评论信息和第二评论信息。其中,第一评论信息和第二评论信息是两条不相同的评论信息,它们既可以是不同用户提交的,也可以是由同一个用户提交的,例如,用户购买了两次商品。S2:从第一评论信息和第二评论信息中选择相同的关键词,并计算每个关键词在第一评论信息中出现的第一次数以及每个关键词在第二评论信息中出现的第二次数。其中,第一评论信息和第二评论信息均包含文字内容,可以通过比对的方式从它们中找到相同的关键词,例如,当商品为手机时,关键词可以是“系统流畅”、“省电”、“功能齐全”、“分辨率高”、“性价比高”等等具有实际价值的内容,也可以是“物流慢”、“快递慢”、“手机一般”等笼统性或无价值的内容。如果第一评论信息和第二评论信息中相同的关键词不止一个,那么,每一个关键词都要计算第一次数和第二次数。S3:比较每个关键词的第一次数和第二次数,并计算每个关键词的第一次数和第二次数之间的差值。S4:如果第一次数大于第二次数,且差值在预设阈值内,则保留第一评论信息并隐藏第二评论信息;如果第一次数小于第二次数,且差值在预设阈值内,则保留第二评论信息并隐藏第一评论信息。其中,如果第一次数和第二次数之间的差值在预设阈值内,说明第一评论信息和第二评论信息的内容基本一致,则保留第一次数和第二次数中最多的评论信息,而隐藏另一个评论信息。经过隐藏后,商品评论信息的条数将大为减少,用户可以快速查询到有价值的评论信息,从而提高了用户的体验。在本实施例中,商品评论信息中重复信息处理方法还包括:S5:如果第一次数大于第二次数或者第一次数小于第二次数,但差值大于预设阈值,则均保留第一评论信息和第二评论信息。其中,如果第一次数和第二次数之间的差值相差太大,说明第一评论信息和第二评论信息中均存在互不相同的内容,则第一评论信息和第二评论信息都保留。通过上述方式,本专利技术实施例的商品评论信息中重复信息处理方法通过不同评论信息中关键词的比对来查找内容实质相同的评论信息,从而能够识别并处理重复的评论信息,可以提高用户的体验。以上所述仅为本专利技术的实施例,并非因此限制本专利技术的专利范围,凡是利用本专利技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的
,均同理包括在本专利技术的专利保护范围内。本文档来自技高网
...

【技术保护点】
一种商品评论信息中重复信息处理方法,其特征在于,包括:S1:从商品评论信息中选取第一评论信息和第二评论信息;S2:从所述第一评论信息和第二评论信息中选择相同的关键词,并计算所述每个关键词在所述第一评论信息中出现的第一次数以及所述每个关键词在所述第二评论信息中出现的第二次数;S3:比较所述每个关键词的第一次数和第二次数,并计算所述每个关键词的第一次数和第二次数之间的差值;S4:如果所述第一次数大于第二次数,且所述差值在预设阈值内,则保留所述第一评论信息并隐藏所述第二评论信息;如果所述第一次数小于第二次数,且所述差值在预设阈值内,则保留所述第二评论信息并所述隐藏第一评论信息。

【技术特征摘要】
1.一种商品评论信息中重复信息处理方法,其特征在于,包括:
S1:从商品评论信息中选取第一评论信息和第二评论信息;
S2:从所述第一评论信息和第二评论信息中选择相同的关键词,并
计算所述每个关键词在所述第一评论信息中出现的第一次数以及所述
每个关键词在所述第二评论信息中出现的第二次数;
S3:比较所述每个关键词的第一次数和第二次数,并计算所述每个
关键词的第一次数和第二次数之间的差值;
S4:如果所述第一次数大于...

【专利技术属性】
技术研发人员:黄正强
申请(专利权)人:四川诚品电子商务有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1