【技术实现步骤摘要】
一种选品比价方法、计算机可读存储介质
:本专利技术涉及数据处理
,特别是涉及一种选品比价方法、计算机可读存储介质。
技术介绍
:消费者采购在选品的同时,一般会同时打开不同电商的网站,在每个网站输入相同商品名称,以方便比较价格。另外,随着电商的发展,市场上踊跃出很多大大小小的购物平台,如比较知名的淘宝,京东等;在大部分消费者看重价格的情况下,想在众多平台中脱颖而出则需要足够吸引消费者的东西,塑造较强的竞争力,商品的定价就显得尤为重要,电商需要尽可能的了解同类商品在别的平台的定价。目前,比价工作大都是人工进行,成本较高、操作繁琐,且容易遗漏。
技术实现思路
:为了提高比价效果、节省时间,本专利技术提供了一种选品比价方法、计算机可读存储介质。一种选品比价方法,应用于计算机设备,包括商品信息数据采集过程、商品信息数据清洗过程、比较信息展示过程;商品信息数据采集过程是采集欲要进行比价的商品的链接、解析其所在页面后并抽取有用信息放入数据库中进行保存;商品信息数据清洗过程是 ...
【技术保护点】
1.一种选品比价方法,其特征在于,包括商品信息数据采集过程、商品信息数据清洗过程、比较信息展示过程;/n商品信息数据采集过程是采集欲要进行比价的商品的链接、解析其所在页面后并抽取有用信息放入数据库中进行保存;/n商品信息数据清洗过程是利用索引引擎对所采集到的信息建立索引,并获取同时满足相似度阈值及相似度排名阈值要求的相似商品的数据;/n比较信息展示过程是根据商品信息数据清洗所获得的最终数据对应的源URL进行周期性的数据采集,实现对应商品相关信息的对比展示。/n
【技术特征摘要】
1.一种选品比价方法,其特征在于,包括商品信息数据采集过程、商品信息数据清洗过程、比较信息展示过程;
商品信息数据采集过程是采集欲要进行比价的商品的链接、解析其所在页面后并抽取有用信息放入数据库中进行保存;
商品信息数据清洗过程是利用索引引擎对所采集到的信息建立索引,并获取同时满足相似度阈值及相似度排名阈值要求的相似商品的数据;
比较信息展示过程是根据商品信息数据清洗所获得的最终数据对应的源URL进行周期性的数据采集,实现对应商品相关信息的对比展示。
2.如权利要求1所述的选品比价方法,其特征在于,商品信息数据采集过程具体为:
步骤一:将需要比价的商品的链接URL导入到待采集任务列表中;
步骤二:加载待采集的商品的链接URL放入请求池中;
步骤三:获取步骤二中对应请求并发送;
步骤四:下载步骤二中所述链接URL对应页面,返回页面信息;
步骤五:处理步骤四所述的页面并解析页面,抽取有用的信息放入列表中交由管道处理;
步骤六:将列表中的数据存入数据库中;
步骤七:重复执行步三至六,直到请求池中所有的请求处理完为止。
3.如权利要求2所述的选品比价方法,其特征在于,商品信息数据采集过程执行过程中,如果发现有新的链接,则继续将新链接的URL放入请求池中。
4.如权利要求2所述的选品比价方法,其特征在于,商品信息数据采集过程步骤...
【专利技术属性】
技术研发人员:赵晨,方前,肖建涛,
申请(专利权)人:杭州洋驼网络科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。