一种电商平台店铺的监测方法技术

技术编号:27192336 阅读:11 留言:0更新日期:2021-01-31 11:35
本发明专利技术公开了一种电商平台店铺的监测方法,该方法通过每隔一段时间,获取竞争对手的店铺网页快照,将相邻两次获取的店铺网页的商品列表进行比较,得出店铺里商品有增加,增加了哪些,把增加的相应的数据放到execl里发送给用户,这样能第一时间知晓竞争对手的店铺商品和商品价格的变化,及时知晓新商品上架发布情况,提高自己店铺竞争力。得到的图形比对也作为分析竞争对手是否有盗图,进行电商维权的手段。手段。手段。

【技术实现步骤摘要】
一种电商平台店铺的监测方法


[0001]本专利技术涉及一种电商平台店铺的监测方法。

技术介绍

[0002]电子商务产业迅猛发展,已经显著改变人们的生产和生活方式。《2014年度中国电子商务市场数据监测报告》显示,我国电子商务市场交易规模达13.4万亿元,同比增长31.4%;其中,B2B电子商务市场交易额达10万亿元,同比增长21.9%;网络零售市场交易规模达2.82万亿元,同比增长49.7%。商务部预计,2015年电子商务交易额将超过18万亿元,全国网络零售交易额将达到社会消费品零售总额的10%以上。在全球经济面临诸多不确定性而复苏缓慢的形势下,电子商务成为经济转型发展的重要增长极。
[0003]与此同时,电子商务产品的竞争对手监测问题越来越引起用户的关注和担忧。由于电子商务环境的跨地域和虚拟性,不少电商经营主体诚信缺失、质量意识淡薄,致使电子商务领域假冒伪劣产品屡见不鲜,“质量门”事件频发。不少企业发现自己产品的仿冒品在网上泛滥成灾,而许多网购消费者也往往买到假冒伪劣产品,或是与广告信息不符。再加上电子商务交易具有即时性、无纸化、范围广的特点,网购维权常常陷入难以追溯、无法深究的困境,极大影响了消费者对电子商务产品质量环境的信心。

技术实现思路

[0004]本专利技术的目的在于针对现有技术的不足,提供一种电商平台店铺的监测方法,用户通过该方法能第一时间知晓竞争对手的店铺商品和商品价格的变化,及时知晓新商品上架发布情况,提高自己店铺竞争力。
[0005]为了解决上述技术问题,采用如下技术方案:
[0006]一种电商平台店铺的监测方法,其特征在于包括以下步骤:
[0007](a)获取店铺网页,将店家的网页内容通过网络爬虫存储至本地存储中,计算网页内容对应的模糊哈希,以及所有的商品列表,并利用网页截图技术存储所有的网页快照;
[0008](b)设定时间间隔T,每隔时间间隔T,重复步骤(a)的步骤,重新获取该店铺网页的信息;
[0009](c)比较相邻两次的店铺网页的商品列表是否有增加,如果店铺里商品有增加,增加了哪些,把增加的相应的数据放到execl里发送给用户,如果商品有减少也给用户发送相应的通知;
[0010](d)同一店铺的商品做内容比对,通过比较相邻两次的店铺网页的商品的模糊哈希值进行比对,如果相似度的值为100,则没有变化,进入步骤(f)比对图片信息;否则,进入步骤(e)分析网页数据,比较哪些数据发生变化;
[0011](e)对相邻两次的店铺网页的html标签进行解析获取相应的参数信息,并对相邻两次的数据进行比对,看数据是否有变化,如果有变化通知用户变化前后的数据,没有则进入下一步继续比对图片信息;
[0012](f)获取相邻两次网页截图的灰度像素的比较数组和相邻两次网页截图的汉明距离,通过汉明距离计算相似度,取值范围[0.0-1.0]。如果相似度不是100%,通知用户新的图片,作为竞品分析参考。图形比对也可以作为分析竞争对手是否有盗图,进行电商维权的手段。
[0013]优选的,所述商品列表包括获取商品相应的名称、价格、主图、销量和评价。
[0014]优选的,所述模糊哈希的原理为使用一个弱哈希计算文件局部内容,在特定条件下对文件进行分片,然后使用一个强哈希对文件每片计算哈希值,取这些值的一部分并连接起来,与分片条件一起构成一个模糊哈希结果。
[0015]优选的,通过模糊哈希的结果计算使用一个字符串相似性对比算法判断两个模糊哈希值的相似度有多少,判断两个文件的相似程度。
[0016]优选的,所述汉明距离用来计算两个向量的相似度,通过比较向量每一位是否相同,若不同则汉明距离加1,这样得到汉明距离;向量相似度越高,对应的汉明距离越小。
[0017]优选的,所述两个向量的相似度通过余弦相似度来表达,两个向量越相似夹角越小,余弦值越接近1。
[0018]优选的,所述余弦相似度是利用两个向量之间的夹角的余弦值来衡量两个向量之间的余弦相似度。
[0019]优选的,在n维空间中,对于向量A=(a1,a2,...an),B=(b1,b2,...,bn)A=(a1,a2,...an),B=(b1,b2,...,bn),其余弦值为:
[0020]由于采用上述技术方案,具有以下有益效果:
[0021]本专利技术为一种电商平台店铺的监测方法,该方法通过每隔一段时间,获取竞争对手的店铺网页快照,将相邻两次获取的店铺网页的商品列表进行比较,得出店铺里商品有增加,增加了哪些,把增加的相应的数据放到execl里发送给用户,这样能第一时间知晓竞争对手的店铺商品和商品价格的变化,及时知晓新商品上架发布情况,提高自己店铺竞争力。得到的图形比对也作为分析竞争对手是否有盗图,进行电商维权的手段。
附图说明
[0022]下面结合附图对本专利技术作进一步说明:
[0023]图1为本专利技术中一种电商平台店铺的监测方法的流程示意图。
具体实施方式
[0024]为使本专利技术的目的、技术方案和优点更加清楚明了,下面通过附图及实施例,对本专利技术进行进一步详细说明。但是应该理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限制本专利技术的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本专利技术的概念。
[0025]如图1所示,一种电商平台店铺的监测方法,其特征在于包括以下步骤:
[0026](a)获取店铺网页,将店家的网页内容通过网络爬虫存储至本地存储中,计算网页
内容对应的模糊哈希,以及所有的商品列表,并利用网页截图技术存储所有的网页快照;
[0027](b)设定时间间隔T,每隔时间间隔T,重复步骤(a)的步骤,重新获取该店铺网页的信息;
[0028](c)比较相邻两次的店铺网页的商品列表是否有增加,如果店铺里商品有增加,增加了哪些,把增加的相应的数据放到execl里发送给用户,如果商品有减少也给用户发送相应的通知;
[0029](d)同一店铺的商品做内容比对,通过比较相邻两次的店铺网页的商品的模糊哈希值进行比对,如果相似度的值为100,则没有变化,进入步骤(f)比对图片信息;否则,进入步骤(e)分析网页数据,比较哪些数据发生变化;
[0030](e)对相邻两次的店铺网页的html标签进行解析获取相应的参数信息,并对相邻两次的数据进行比对,看数据是否有变化,如果有变化通知用户变化前后的数据,没有则进入下一步继续比对图片信息;
[0031](f)获取相邻两次网页截图的灰度像素的比较数组和相邻两次网页截图的汉明距离,通过汉明距离计算相似度,取值范围[0.0-1.0]。如果相似度不是100%,通知用户新的图片,作为竞品分析参考。图形比对也可以作为分析竞争对手是否有盗图,进行电商维权的手段。
[0032]具体地,所述商品列表包括获取商品相应的名称、价格、主图、销量和评价。
[0033]具体地,所述模糊哈希的原理为使用一个弱哈希计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电商平台店铺的监测方法,其特征在于包括以下步骤:(a)获取店铺网页,将店家的网页内容通过网络爬虫存储至本地存储中,计算网页内容对应的模糊哈希,以及所有的商品列表,并利用网页截图技术存储所有的网页快照;(b)设定时间间隔T,每隔时间间隔T,重复步骤(a)的步骤,重新获取该店铺网页的信息;(c)比较相邻两次的店铺网页的商品列表是否有增加,如果店铺里商品有增加,增加了哪些,把增加的相应的数据放到execl里发送给用户,如果商品有减少也给用户发送相应的通知;(d)同一店铺的商品做内容比对,通过比较相邻两次的店铺网页的商品的模糊哈希值进行比对,如果相似度的值为100,则没有变化,进入步骤(f)比对图片信息;否则,进入步骤(e)分析网页数据,比较哪些数据发生变化;(e)对相邻两次的店铺网页的html标签进行解析获取相应的参数信息,并对相邻两次的数据进行比对,看数据是否有变化,如果有变化通知用户变化前后的数据,没有则进入下一步继续比对图片信息;(f)获取相邻两次网页截图的灰度像素的比较数组和相邻两次网页截图的汉明距离,通过汉明距离计算相似度,取值范围[0.0-1.0]。如果相似度不是100%,通知用户新的图片,作为竞品分析参考;图形比对作为分析竞争对手是否有盗图,进行电商维权的手段。2.根据权利要求1所述的一种电商平台店铺的监测方法,其特征在于:所述商品列表包括获取商品相应...

【专利技术属性】
技术研发人员:洪进周晓明罗水芳
申请(专利权)人:杭州拾贝知识产权服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1