基于评价内容和ID相似性识别的电商评价判断系统技术方案

技术编号:11938586 阅读:66 留言:0更新日期:2015-08-26 09:54
本发明专利技术涉及互联网领域,特别涉及基于评价内容和ID相似性识别的电商评价判断系统。包括客户机、网络连接装置、内容相似性判断模块、ID相似性判断模块、作弊因子判断模块以及虚假评价标记模块;其中所述客户机通过网络连接装置来获取目标商品的相关评价数据信息,并将信息分别输出到内容相似性判断模块与ID相似性判断模块中;所述ID相似性判断模块、作弊因子判断模块以及虚假评价标记模块依次相连;所述内容相似性判断模块的输出端与虚假评价标记模块相连。本发明专利技术分别判断出虚假评价内容和评价ID,并通过虚假评价标记模块将判断结果标记出来,为买家规避商品虚假评价而引起的交易风险。

【技术实现步骤摘要】

本专利技术设及互联网领域,特别设及基于评价内容和ID相似性识别的电商评价判 断系统。
技术介绍
在当代,随着互联网的普及,电子商务已经成为一种被广泛利用的商业贸易方式。 买卖双方主要是通过电商的网页或者是软件进行交易活动。由于电子商务没有传统的实体 店面,对销售人员的数量要求也不高,所W相比传统交易模式更能够控制运营成本,因而有 着更大的价格优势。但是,有很多不法商家为了提高自己的销量从而雇佣专业刷评价团队 也制造大量的虚假评价来对自己的商品进行虚假的宣传,从而欺骗消费者来提高自己的真 实销量。 目前电子商务的发展迅猛,体量巨大,电商环境中的卖家数量众多,用户在进行购 买决定时难W判断商品描述的真实性,对商品评价的依赖度很高,由于卖家评价作弊而造 成的商品的性能好评度虚高的情况引起的买家利益损失的情况严重。在该样的情况下,如 何对电子商务中商家的评价作弊行为进行识别和判断成电子商务发展过程中亟待解决的 问题;在判断虚假评价过程中如何全面的科学的将虚假评价识别出来,对于商品购买者和 电商环境管理者来说具有重要的意义;目前现有技术中还缺乏准确有效的相关设备来实现 相关的判断。
技术实现思路
为了解决现有技术中存在的问题,本专利技术提供了基于评价内容和ID相似性识别 的电商评价判断系统,分别通过内容相似性判断模块和ID相似性判断模块来识别目标商 品评价数据中的相同和相似评价内容,W及相同或者相似的评价ID,在判断出相同和相似 ID的基础上通过作弊因子判断模块,来鉴别出该些相同或者相似评价ID所发出商品评价 的频率是否明显高于正常的阔值,如果高于正常的阔值则将该些ID判断为虚假评价ID,通 过虚假评价判断模块将判断出的相同和相似评价内容和虚假评价ID标记出来;该样实现 了目标商品评价中虚假评价的自动识别,为电商环境管理者和商品消费者提供了简单可靠 的评价辨识工具。 为了实现上述专利技术目的,本专利技术提供了W下技术方案: 基于评价内容和ID相似性识别的电商评价判断系统;包括客户机、网络连接装 置、内容相似性判断模块、ID相似性判断模块、作弊因子判断模块W及虚假评价标记模块; 其中所述客户机一端通过网络连接装置来获取目标商品的相关评价数据信息(目前通过 爬虫技术可W很方便的获取到目标网页中的相关信息,提取的速度快,可分析数据的总量 巨大,所提取数据的分析方法成熟,成本低廉);所述客户机的另一端分别与所述内容相似 性判断模块的输入端W及所述ID相似性判断模块的输入端相连,所述内容相似性判断模 块的输出端与所述虚假评价标记模块相连;所述ID相似性判断模块的输出端与所述作弊 因子判断模块的输入端相连,所述ID相似性判断模块经过所述作弊因子判断模块与所述 虚假评价标记模块相连。 本系统工作时,所述客户机将获取到的目标商品评价信息分别输出到所述内容相 似性判断模块和所述ID相似性判断模块中;所述内容相似性判断模块判断出目标商品评 价信息中的相同和相似评价内容,并将判断结果输出到所述虚假评价标记模块中;目前如 果商家想要通过虚假交易和评价来提高系统显示商品的销量和好评情况,所需要的虚假评 价的数量较大,在该样的情况下人为捏造的评价往往在评价内容上具有较高的相似性,或 者就直接W相同的内容出现,本专利技术中的内容相似性判断模块通过比较目标商品评价数据 中的内容文本的相似性(目前文本相似性比较的判断方法已经比较成熟,比如说可W采取 余弦相似比较算法来判断文本内容之间的相似程度,当相似程度超过预设的阔值,则可认 为被比较的文本内容相似,具体的比较过程不再寶述),统计内容相同评价的数量,判断出 内容相似的评价;并将判断的结果输入到所述虚假评价标记模块中。[000引同时,所述ID相似性判断模块通过文本相似比较判断出目标商品评价信息中的 相同和相似评价ID,并将判断结果输入到所述作弊因子判断模块中,所述作弊因子判断模 块通过对目标ID作弊可能性进行分析,判断出作弊的虚假评价ID;并将判断结果输出到所 述虚假评价标记模块中。目前职业刷评价团队会人工或者利用自动注册机来注册很多小 号(所谓的小号是指,同一个人注册和使用的不同的ID号),该些职业评价团队所注册和 使用的小号ID具有一定规律性;一般情况下职业评价师所注册的一系列ID号也是根据系 统推荐或者自动生成的,该样的方式所产生的ID号会具有较大的关联性和相似性,比如说 ABC1、ABC2、ABC3、ABC4、ABC5.....ABCn。通过对评价ID的文本相似性比较就可W判断出 相同或者相似评价内容所对应的评价ID是否相同或者相似;如果相同或者相似,那么该些ID为虚假ID的可能性很高。本专利技术目标商品的评价内容和评价ID的相似性进行分别判 断,判断出的虚假评价的范围更大,判断结果更加全面。 进一步的,为了进一步提高虚假评价判断的准确性,使判断的结果更加严格,所述 ID相似性判断模块将判断结果输入到所述作弊因子判断模块中;所述作弊因子判断模块 在判断出的相同或者相似ID的基础上,分析对应ID发出评价的频率和时间,将对应ID发 出评价的频率与目标商品评价的平均评价频率进行比较,如果其比值高于设定的阔值,贝U 将该些评价ID判断为虚假评价ID,通过作弊因子判断模块对评价ID进行进一步的判断,判 断结果准确性较高。 进一步的,所述虚假评价标记模块将所述内容相似性判断模块所判断出的相同和 相似评价内容标记出来;所述虚假评价标记模块将所述作弊因子判断模块所判断出的虚假 评价ID标记出来。 进一步的,所述虚假评价标记模块将目标商品信息中即满足虚假评价内容又满足 虚假评价ID的对应评价进行着重标记。通过着重标记,商品买家和电商环境的管理者可W 对虚假评价进行层次化和更科学合理的处理。通过本系统对目标商品虚假评价的判断效率 高,虚假评价判断结果更加全面。[001引作为一种优选,所述内容相似性判断模块为内容相似性判断服务器;所述ID相似 性判断模块为ID相似性判断服务器;所述作弊因子判断模块为作弊因子判断服务器;所述 虚假评价标记模块为虚假评价标记服务器。所述相似评价内容判断服务器和所述虚假评价 标记服务器通过数据连线相连;所述ID相似性判断服务器、作弊因子判断服务器W及虚假 评价标记服务器通过数据连接线依次相连。服务器在处理能力、稳定性、可靠性、安全性、可 扩展性、可管理性等方面表现优秀,通过服务器来完成相关的ID相似性,内容相似性的相 关判断,可快速处理大量电商目标商品的相关数据,处理速度快,效率高。 与现有技术相比,本专利技术的有益效果;本专利技术提供基于评价内容和ID相似性识别 的电商评价判断系统。通过客户机访问目标商品的网址,爬取对应商品网页的评价数据;并 通过相关服务器对爬取到的评价数据进行判断,分别分析评价数据中评价内容、评价ID为 虚假评价内容或者虚假评价ID的可能性。 本专利技术通过虚假评价标记模块将判断出的相同、相似评价内容、虚假评价ID分别 标记出来。本专利技术通过对目标商品评价数据中的评价内容和评价ID进行分别的判断识别, 判断出当前第1页1 2 本文档来自技高网...

【技术保护点】
基于评价内容和ID相似性识别的电商评价判断系统,其特征在于,包括客户机、网络连接装置、内容相似性判断模块、ID相似性判断模块、作弊因子判断模块以及虚假评价标记模块;其中所述客户机通过网络连接装置来获取目标商品的相关评价数据信息,并将信息分别输出到内容相似性判断模块与ID相似性判断模块中;所述ID相似性判断模块、所述作弊因子判断模块以及所述虚假评价标记模块依次相连;所述内容相似性判断模块的输出端与所述虚假评价标记模块相连。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴雨浓何宏靖刘世林
申请(专利权)人:成都数联铭品科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1