【技术实现步骤摘要】
一种自动比价方法及其机器人装置
本专利技术涉及信息检索
,尤其涉及一种自动比价方法及其机器人装置。
技术介绍
在互联网的网购时代,如天猫,淘宝,京东,国美,苏宁等等网店纷纷通过烧钱低价,优惠券,好友红包分享的方式大打价格战,吸引更多的用户进行购物消费。而用户在使用这些网上购物资源的时候,常常很难对价格进行比对,通常只能是分别到各大网站去检索相同的产品,而这个过程是很浪费时间的,并且也常常会因为耗费了检索的时间,造成同产品中价格最便宜的会出现售罄的情况,使用户即浪费了时间也没有买到想要的产品,因此急需一种能够对相同或者类似产品进行价格统一把握的技术来解决有技术中存在的问题。
技术实现思路
本专利技术目的是提供一种自动比价方法及其机器人装置,可以解决现有技术中无法对同一或者类似产品价格统一把握的问题。本专利技术解决技术问题采用如下技术方案:一种自动比价方法,其特征在于,至少包括以下步骤:获取购物网站信息,指定初始种子连接以及抓取深度抓取相关网页;采用正则表达式抽取导航栏连接,并对网页进行去噪,抽取标题和价格;存储抽取的标题以及价格;根据用户的查询,按照标题对各价格进行对比,生成价格比对信息。其中,使用开源工具nutch进行相关网页抓取。其中,使用开源工具BoilerPipe进行网页去噪。其中,所述抽取的标题以及价格存储在数据库Redis中。本专利技术还一种自动比价机器人装置,至少包括:购物网站获取单元,用于获取购物网站信息,指定初始种子连接以及抓取深度抓取相关网页;价格抽取单元,用于采用正则表达式抽取导航栏连接,并对网页进行去噪,抽取标题和价格;价格信息存储 ...
【技术保护点】
一种自动比价方法,其特征在于,至少包括以下步骤:获取购物网站信息,指定初始种子连接以及抓取深度抓取相关网页;采用正则表达式抽取导航栏连接,并对网页进行去噪,抽取标题和价格;存储抽取的标题以及价格;根据用户的查询,按照标题对各价格进行对比,生成价格比对信息。
【技术特征摘要】
1.一种自动比价方法,其特征在于,至少包括以下步骤:获取购物网站信息,指定初始种子连接以及抓取深度抓取相关网页;采用正则表达式抽取导航栏连接,并对网页进行去噪,抽取标题和价格;存储抽取的标题以及价格;根据用户的查询,按照标题对各价格进行对比,生成价格比对信息。2.根据权利要求1所述的自动比价方法,其特征在于,使用开源工具nutch进行相关网页抓取。3.根据权利要求1所述的自动比价方法,其特征在于,使用开源工具BoilerPipe进行网...
【专利技术属性】
技术研发人员:纪江霖,吴勇谋,
申请(专利权)人:深圳前海勇艺达机器人有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。