当前位置: 首页 > 专利查询>张翔专利>正文

网络购物的综合搜索引擎方法及其系统技术方案

技术编号:11737135 阅读:106 留言:0更新日期:2015-07-15 17:19
本发明专利技术公开了一种网络购物的综合搜索引擎方法及其系统,该方法包括以下步骤:用户输入需要查询的商品的关键信息;接收商品的关键信息的搜索请求并发送至搜索引擎;爬取该商品在不同电子购物平台上的至少三项类目排名并存储至第四方电商平台;第四方电商平台对类目排名进行整合得到综合排名名次后,将综合排名在前的作为优选卖家;用户根据得到的优选卖家信息直接在第四方电商平台或返回对应的电子购物平台进行购物交易。本发明专利技术的第四方电商平台将搜索引擎平台和电商平台系统合理的融合,使得用户可在第四方购物平台上全面的了解到想要购买的商品的多个网站多个商家的综合排名,实现货比三家式的对比购物后,达到了最佳的电子购物交易效果。

【技术实现步骤摘要】

本专利技术涉及搜索
,尤其涉及一种网络购物的综合搜索引擎方法及其系统
技术介绍
在信息时代,搜索引擎已经成为我们生活中必不可缺少的一部分,人们通过它在海量的信息海洋中实现快速定位信息、快速获取信息、快速解决问题的目的。搜索引擎包括通用搜索引擎和垂直搜索引擎。通用搜索引擎的技术是利用机器人技术通过网页抓取程序随着网页中的超链接,连续的抓取网页,然后根据搜索引擎表倒排表,即由索引项查找相应的URL。索引表也要记录索引项在文档中出现的位置,以便检索器计算索引项之间的相邻或接近的关系,并以特定的数据结构存储在硬盘上,最后供用户使用。该技术能够快速返回大量的信息给用户,但当我们在海量的网路数据查询我们特定的信息时,我们会发现这些搜索引擎返回给我们的大量信息并不是我们所需要的,而我们真正所需要的信息并非总是在第一时间以及醒目的位置出现,可见,在信息搜索方面上,通用引擎并不是满足我们的电子购物需求。垂直搜索引擎是针对一个领域或者一个行业的信息检索,它的特点是查找准确度高,使用户能够快速定位、准确的获取自己所要的信息。尤其是在电子电子购物平台上,若在淘宝网、京东商城网、这些电子电子购物平台含有大量的图片、商品种类、评价等信息,因此一个有效的垂直搜索引擎可以有助于用户的快捷购物。它所采用的技术仍是基于通用引擎的,只能在固定的一个网站能进行检索,虽然能够提供在该网站能的众多商家信息,但其无法检索其他电子购物平台的商品的关键信息,也就是说无法实现跨网站搜索。例如,顾客在淘宝搜索一款手机,返回的信息是在淘宝网上的信息,无法获得京东商城上的同一款手机的商品的关键信息,即无法提供顾客全面又能对比的信息,无法实现货比三家式的对比购物。
技术实现思路
针对上述技术中存在的不足之处,本专利技术提供一种网络购物的综合搜索引擎方法及其系统,用户可在第四方购物平台上全面的了解到想要购买的商品的综合排名,提供用户全面又能对比的信息,实现货比三家式的对比购物。为实现上述目的,本专利技术提供一种网络购物的综合搜索引擎方法,包括以下步骤: 步骤1,用户输入需要查询的商品的关键信息; 步骤2,接收商品的关键信息的搜索请求并发送至搜索引擎; 步骤3,爬取该商品在不同电子购物平台上的至少三项类目排名并存储至第四方电商平台;步骤4,第四方电商平台对类目排名进行整合得到综合排名名次后,将综合排名在前的作为优选卖家; 步骤5,用户根据得到的优选卖家信息直接在第四方电商平台或返回对应的电子购物平台进行购物交易。其中,所述类目排名至少包括价格排名、销量排名和好评排名三项。其中,所述步骤3的具体步骤为: 步骤31,利用Heritrix爬虫技术获取包含该商品的不同电子购物平台的网页; 步骤32,把爬取出来的商品的类目排名关联信息存储到第四方电商平台; 步骤33,在第四方电商平台建立索引,并初步对商品的价格、销量和好评类目进行单独排名。其中,所述步骤4的具体步骤为:给予销量、好评排名为先的类目以较高优先级,给予价格为先的类目以较低优先级;对价格、销量和好评的三个类目整合得到优化的综合排名在前100名的卖家展示在第四方电商平台上并自动成为该第四方电商平台的优选卖家。其中,所述索引建立的具体步骤为:首先,构建类目名称的信息词库,需要遍历所有不同电子购物平台上的商品,写入制定的商品词库文件中,完成词库的提取;其次,存储不同电子购物平台上的商品,实现商品在第四方电商平台上进行存储关联,作为用户查询的原始数据;最后,建立Lucene索引。其中,所述步骤31的具体步骤为利用Heritrix爬虫技术获得该商品的不同电子购物平台的网页,作为垂直搜索引擎检索的原始数据,爬取过程中以电子购物平台为单位,因此在试下检索一个网站,其他网站按照同等技术依次爬取,最后在第四方电商平台上进行存储整合。其中,所述步骤32的具体步骤为把爬取出来的网页解析成文本文件,把解析后的商品的海量信息中的类目排名信息存储到第四方电商平台。其中,所述类目排名还包括信用排名、售后服务排名、营销时间排名或退货率排名中的一项或多项组合。其中,所述商品的关键信息必须包括名称,还可以包括规格型号、商品品牌、商品所属分类中的一种或多种的组合。为实现上述目的,本专利技术还提供一种网络购物的综合搜索引擎系统,包括浏览器,用于输入需要查询的商品的关键信息; 搜索模块,搜索模块用于接收搜索请求并发送给至搜索引擎; 网页爬取模块,根据搜索引擎上的搜索请求爬取不同电子购物平台上的该商品的海量信息; 网页解析模块,将商品的海量信息解析成文本文件,并提取该商品在不同电子购物平台上的至少三项类目排名; 第四方电商平台,用于存储该商品在不同电子购物平台上的至少三项类目排名,且第四方电商平台对类目排名进行整合得到综合排名名次后,将综合排名在前的作为优选卖家;用户根据得到的优选卖家信息直接在第四方电商平台或返回对应的电子购物平台进行购物交易。本专利技术的有益效果是:与现有技术相比,本专利技术提供的网络购物的综合搜索引擎方法及其系统,若是用户需要购买某种商品,对该商品进行查询搜索,搜索引擎会爬取该商品在不同购物平台上的海量信息,然后再将所需要的关联信息即至少三项类目排名并存储至第四方电商平台;再由第四方电商平台对该商品的类目排名进行综合排名;最后综合排名在前的卖家可自动成为该第四方电商平台的优选卖家,用户既可根据卖家综合排名信息,直接在本电商平台进行购物交易交易,也可返回原电子购物平台进行购物交易交易。本专利技术的第四方电商平台将搜索引擎平台和电商平台系统合理的融合,使得用户可在第四方购物平台上全面的了解到想要购买的商品的多个网站多个商家的综合排名,提供用户全面又能对比的信息,实现货比三家式的对比购物后,达到了最佳的电子购物交易效果。【附图说明】图1为本专利技术的网络购物的综合搜索引擎方法的流程图; 图2为本专利技术的网络购物的综合搜索引擎方法中的一个具体实施例; 图3为本专利技术的网络购物的综合搜索引擎系统的方框图。主要元件符号说明如下: 10、浏览器11、搜索模块 12、网页爬取模块13、网页解析模块 14、第四方电商平台。【具体实施方式】为了更清楚地表述本专利技术,下面结合附图对本专利技术作进一步地描述。请参阅图1,本专利技术的网络购物的综合搜索引擎方法,包括以下步骤: 步骤Si,用户输入需要查询的商品的关键信息;该关键信息必须包括名称,还可以包括规格型号、商品品牌、商品所属分类中的一种或多种的组合。当然,还可以是有关商品的其他信息,如生产日期、内存量等等。步骤S2,接收商品的关键信息的搜索请求并发送至搜索引擎; 步骤S3,爬取该商品在不同电子购物平台上的至少三项类目排名并存储至第四方电商平台;类目排名至少包括价格排名、销量排名和好评排名三项;该步骤的具体步骤如下:第一步,利用Heritrix爬虫技术获取包含该商品的不同电子购物平台的网页,如淘宝、京东、天猫等各个电子购物平台;第二步,把爬取出来的商品的类目排名关联信息存储到第四方电商平台;第三步,在第四方电商平台建立索引,并初步对商品的价格、销量和好评类目进行单独排名。步骤S4,第四方电商平台对类目排名进行整合得到综合排名名次后,将综合排名在前的作为优选卖家;该步骤的具体步骤为:给予销本文档来自技高网
...

【技术保护点】
一种网络购物的综合搜索引擎方法,其特征在于,包括以下步骤:步骤1,用户输入需要查询的商品的关键信息;步骤2,接收商品的关键信息的搜索请求并发送至搜索引擎;步骤3,爬取该商品在不同电子购物平台上的至少三项类目排名并存储至第四方电商平台;步骤4,第四方电商平台对类目排名进行整合得到综合排名名次后,将综合排名在前的作为优选卖家;步骤5,用户根据得到的优选卖家信息直接在第四方电商平台或返回对应的电子购物平台进行购物交易。

【技术特征摘要】

【专利技术属性】
技术研发人员:张翔
申请(专利权)人:张翔
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1