根据终端的统一资源定位符确定商品信息的方法及装置制造方法及图纸

技术编号:15763052 阅读:139 留言:0更新日期:2017-07-05 23:50
本发明专利技术实施例公开了一种根据终端的统一资源定位符确定商品信息的方法,包括:利用网络爬虫技术获取至少一个电商的商品库,得到每个商品的商品信息;通过标签体系整合算法将所述每个商品的商品信息整合成自有商品库;接收终端发送来的包含有所述终端利用应用抓包技术获取所述终端上的应用所访问的统一资源定位符URL的网络封包;利用网络封包分析技术解析所述网络封包,得到所述URL的特征;在所述URL的特征与所述自有商品库的特征匹配时,在所述自有商品库中确定所述URL的特征所对应的商品的商品信息。本发明专利技术实施例还同时公开了一种根据终端的统一资源定位符确定商品信息的装置。

Method and device for determining commodity information based on uniform resource locator of terminal

The embodiment of the invention discloses a method for determining the character of commodity information, according to the uniform resource locator terminal: obtaining at least one electricity supplier by web crawler commodity base, each commodity information system; through the integration of the algorithm labels each goods commodity information into its own goods receiving base; the terminal includes the terminal to send the application packet capture technology to obtain uniform resource locator to access the application of the terminal on the URL network packet; using network packet analysis the network packets, get the feature of the URL; in the URL, the feature and the private library of goods when determining the corresponding characteristics of the URL of the commodity information in the private goods library. The embodiment of the invention also discloses a device for determining the commodity information according to the uniform resource locator of the terminal.

【技术实现步骤摘要】
根据终端的统一资源定位符确定商品信息的方法及装置
本专利技术涉及数据分析和挖掘技术,尤其涉及一种根据终端的统一资源定位符确定商品信息的方法及装置。
技术介绍
在移动互联网时代,网络运营商有针对性地解析用户具体的上网行为,具有巨大的理论研究和商业应用价值;在终端上网产生的统一资源定位符(UniformResourceLocator,URL)中,有一部分由用户在网上购物所产生,而在现有的方案中,网络运营商并没有对这些网上购物所产生的URL进行深入解析,无法得到用户感兴趣的商品及商品的详细信息,无法有针对性的开展后续的数据分析和数据挖掘,降低了工作效率。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种根据终端的统一资源定位符确定商品信息的方法及装置,以实现网络运营商可以及时得到用户感兴趣的商品信息,可以针对性的开展后续的数据分析和数据挖掘,提高工作效率。为达到上述目的,本专利技术的技术方案是这样实现的:本专利技术提供一种根据终端的统一资源定位符确定商品信息的方法,所述方法包括:利用网络爬虫技术获取至少一个电商的商品库,得到每个商品的商品信息;通过标签体系整合算法将所述每个商品的商品信息整合成自有商品库;接收终端发送来的包含有所述终端利用应用抓包技术获取所述终端上的应用所访问的统一资源定位符URL的网络封包;利用网络封包分析技术解析所述网络封包,得到所述URL的特征;在所述URL的特征与所述自有商品库的特征匹配时,在所述自有商品库中确定所述URL的特征所对应的商品的商品信息。上述方案中,在所述得到所述URL的特征之后,所述方法还包括:判断所述URL的特征是否与所述自有商品库中的特征匹配;在所述URL的特征与所述自有商品库中的特征不匹配时,结束处理。上述方案中,所述URL的特征包括:第一电商名称、第一动作行为、第一商品参数;所述自有商品库的特征包括:第二电商名称、第二动作行为、第二商品参数。上述方案中,所述判断所述URL的特征是否与所述自有商品库中的特征匹配,包括:判断所述URL的特征中的第一电商名称是否与所述自有商品库的特征中的第二电商名称匹配,如果所述第一电商名称与所述第二电商名称不匹配,则结束处理;如果所述第一电商名称与所述第二电商名称匹配,则判断所述URL的特征中的第一动作行为是否与所述自有商品库的特征中的第二动作行为匹配,如果所述第一动作行为与所述第二动作行为不匹配,则结束处理;如果所述第一动作行为与所述第二动作行为匹配,则判断所述URL的特征中的第一商品参数是否与所述自有商品库的特征中的第二商品参数匹配,如果所述第一商品参数与所述第二商品参数不匹配,则结束处理;如果所述第一商品参数与所述第二商品参数匹配,则在所述自有商品库中确定所述第二商品参数所对应的商品信息。上述方案中,所述商品信息包括:商品名称、商品价格、商品品牌、商品分类、商品属性、商品产地。本专利技术还提供一种根据终端的统一资源定位符确定商品信息的装置,所述装置包括:获取模块,用于利用网络爬虫技术获取至少一个电商的商品库,得到每个商品的商品信息;整合模块,用于通过标签体系整合算法将所述每个商品的商品信息整合成自有商品库;接收模块,用于接收终端发送来的包含有所述终端利用应用抓包技术获取所述终端上的应用所访问的统一资源定位符URL的网络封包;解析模块,用于利用网络封包分析技术解析所述网络封包,得到所述URL的特征;确定模块,用于在所述URL的特征与所述自有商品库的特征匹配时,在所述自有商品库中确定所述URL的特征所对应的商品的商品信息。上述方案中,所述装置还包括:判断模块,用于判断所述URL的特征是否与所述自有商品库中的特征匹配;所述确定模块,还用于在所述URL的特征与所述自有商品库中的特征不匹配时,结束处理。上述方案中,所述URL的特征包括:第一电商名称、第一动作行为、第一商品参数;所述自有商品库的特征包括:第二电商名称、第二动作行为、第二商品参数。上述方案中,所述判断模块,具体用于判断所述URL的特征中的第一电商名称是否与所述自有商品库的特征中的第二电商名称匹配,如果所述第一电商名称与所述第二电商名称不匹配,则结束处理;如果所述第一电商名称与所述第二电商名称匹配,则判断所述URL的特征中的第一动作行为是否与所述自有商品库的特征中的第二动作行为匹配,如果所述第一动作行为与所述第二动作行为不匹配,则结束处理;如果所述第一动作行为与所述第二动作行为匹配,则判断所述URL的特征中的第一商品参数是否与所述自有商品库的特征中的第二商品参数匹配,如果所述第一商品参数与所述第二商品参数不匹配,则结束处理;如果所述第一商品参数与所述第二商品参数匹配,则在所述自有商品库中确定所述第二商品参数所对应的商品信息。上述方案中,所述商品信息包括:商品名称、商品价格、商品品牌、商品分类、商品属性、商品产地。本专利技术实施例提供的根据终端的统一资源定位符URL确定商品信息的方法,网络运营商的根据终端的URL确定商品信息的装置利用网络爬虫技术获取至少一个电商的商品库,得到每个商品的商品信息;通过标签体系整合算法将所述每个商品的商品信息整合成自有商品库;接收终端发送来的包含有所述终端利用应用抓包技术获取所述终端上的应用所访问的URL的网络封包;利用网络封包分析技术解析所述网络封包,得到所述URL的特征;判断所述URL的特征是否与所述自有商品库中的特征匹配;当匹配时,在所述自有商品库中确定所述URL的特征所对应的商品的商品信息;网络运营商可以及时得到用户感兴趣的商品信息,可以针对性的开展后续的数据分析和数据挖掘,提高工作效率。附图说明图1为本专利技术根据终端的统一资源定位符确定商品信息的方法实施例的流程图;图2为本专利技术根据终端的统一资源定位符确定商品信息的装置实施例的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。图1为本专利技术根据终端的统一资源定位符确定商品信息的方法实施例的流程图,如图1所示,本专利技术的方法可以包括如下步骤:步骤101、利用网络爬虫技术获取至少一个电商的商品库,得到每个商品的商品信息。网络运营商的根据终端的URL确定商品信息的装置利用网络爬虫技术获取至少一个电商的商品库,得到每个电商的商品库的标签体系和每个商品的商品信息;其中,在一个电商的商品库中某个商品的商品参数是唯一的,所以每个商品参数对应的商品信息包括了每个商品的商品名称、商品价格、商品品牌等信息。所述网络爬虫技术是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。例如,以获取电商A的商品库为例进行说明;电商A会对商品进行分类,一般是3级分类,每级类别分别用不同的标签值表示不同的类,比如在电商A商品库体系中,“手机数码-手机通讯-手机”就是一个具体的3级标签,“手机数码”是1级标签,“手机通讯”是2级标签,“手机”是3级标签,每个3级标签下面包含众多的商品,用商品参数唯一确定某一款商品,这套3级标签体系和所有的商品就构成了一棵树,通过遍历这颗树,利用网络爬虫爬取每个商品参数所在网页上的商品信息,可以得到商品名称、商品价格、商品品牌等信息,这个标签体系和这些具体的商品信息便是电商A的商品库的内容。在本实施例中,获取多少个电商的商品库可以根据实本文档来自技高网...
根据终端的统一资源定位符确定商品信息的方法及装置

【技术保护点】
一种根据终端的统一资源定位符确定商品信息的方法,其特征在于,所述方法包括:利用网络爬虫技术获取至少一个电商的商品库,得到每个商品的商品信息;通过标签体系整合算法将所述每个商品的商品信息整合成自有商品库;接收终端发送来的包含有所述终端利用应用抓包技术获取所述终端上的应用所访问的统一资源定位符URL的网络封包;利用网络封包分析技术解析所述网络封包,得到所述URL的特征;在所述URL的特征与所述自有商品库的特征匹配时,在所述自有商品库中确定所述URL的特征所对应的商品的商品信息。

【技术特征摘要】
1.一种根据终端的统一资源定位符确定商品信息的方法,其特征在于,所述方法包括:利用网络爬虫技术获取至少一个电商的商品库,得到每个商品的商品信息;通过标签体系整合算法将所述每个商品的商品信息整合成自有商品库;接收终端发送来的包含有所述终端利用应用抓包技术获取所述终端上的应用所访问的统一资源定位符URL的网络封包;利用网络封包分析技术解析所述网络封包,得到所述URL的特征;在所述URL的特征与所述自有商品库的特征匹配时,在所述自有商品库中确定所述URL的特征所对应的商品的商品信息。2.根据权利要求1所述的方法,其特征在于,在所述得到所述URL的特征之后,所述方法还包括:判断所述URL的特征是否与所述自有商品库中的特征匹配;在所述URL的特征与所述自有商品库中的特征不匹配时,结束处理。3.根据权利要求2所述的方法,其特征在于,所述URL的特征包括:第一电商名称、第一动作行为、第一商品参数;所述自有商品库的特征包括:第二电商名称、第二动作行为、第二商品参数。4.根据权利要求3所述的方法,其特征在于,所述判断所述URL的特征是否与所述自有商品库中的特征匹配,包括:判断所述URL的特征中的第一电商名称是否与所述自有商品库的特征中的第二电商名称匹配,如果所述第一电商名称与所述第二电商名称不匹配,则结束处理;如果所述第一电商名称与所述第二电商名称匹配,则判断所述URL的特征中的第一动作行为是否与所述自有商品库的特征中的第二动作行为匹配,如果所述第一动作行为与所述第二动作行为不匹配,则结束处理;如果所述第一动作行为与所述第二动作行为匹配,则判断所述URL的特征中的第一商品参数是否与所述自有商品库的特征中的第二商品参数匹配,如果所述第一商品参数与所述第二商品参数不匹配,则结束处理;如果所述第一商品参数与所述第二商品参数匹配,则在所述自有商品库中确定所述第二商品参数所对应的商品信息。5.根据权利要求1至4任一项所述的方法,其特征在于,所述商品信息包括:商品名称、商品价格、商品品牌、商品分类、商品属性、商品产地。6.一种根据终端的统...

【专利技术属性】
技术研发人员:于蓉蓉许大虎梅铮鲁银冰柯于皇
申请(专利权)人:中移杭州信息技术有限公司中国移动通信集团公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1