The embodiment of the invention discloses a method for determining the character of commodity information, according to the uniform resource locator terminal: obtaining at least one electricity supplier by web crawler commodity base, each commodity information system; through the integration of the algorithm labels each goods commodity information into its own goods receiving base; the terminal includes the terminal to send the application packet capture technology to obtain uniform resource locator to access the application of the terminal on the URL network packet; using network packet analysis the network packets, get the feature of the URL; in the URL, the feature and the private library of goods when determining the corresponding characteristics of the URL of the commodity information in the private goods library. The embodiment of the invention also discloses a device for determining the commodity information according to the uniform resource locator of the terminal.
【技术实现步骤摘要】
根据终端的统一资源定位符确定商品信息的方法及装置
本专利技术涉及数据分析和挖掘技术,尤其涉及一种根据终端的统一资源定位符确定商品信息的方法及装置。
技术介绍
在移动互联网时代,网络运营商有针对性地解析用户具体的上网行为,具有巨大的理论研究和商业应用价值;在终端上网产生的统一资源定位符(UniformResourceLocator,URL)中,有一部分由用户在网上购物所产生,而在现有的方案中,网络运营商并没有对这些网上购物所产生的URL进行深入解析,无法得到用户感兴趣的商品及商品的详细信息,无法有针对性的开展后续的数据分析和数据挖掘,降低了工作效率。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种根据终端的统一资源定位符确定商品信息的方法及装置,以实现网络运营商可以及时得到用户感兴趣的商品信息,可以针对性的开展后续的数据分析和数据挖掘,提高工作效率。为达到上述目的,本专利技术的技术方案是这样实现的:本专利技术提供一种根据终端的统一资源定位符确定商品信息的方法,所述方法包括:利用网络爬虫技术获取至少一个电商的商品库,得到每个商品的商品信息;通过标签体系整合算法将所述每个商品的商品信息整合成自有商品库;接收终端发送来的包含有所述终端利用应用抓包技术获取所述终端上的应用所访问的统一资源定位符URL的网络封包;利用网络封包分析技术解析所述网络封包,得到所述URL的特征;在所述URL的特征与所述自有商品库的特征匹配时,在所述自有商品库中确定所述URL的特征所对应的商品的商品信息。上述方案中,在所述得到所述URL的特征之后,所述方法还包括:判断所述URL的特征是否与所 ...
【技术保护点】
一种根据终端的统一资源定位符确定商品信息的方法,其特征在于,所述方法包括:利用网络爬虫技术获取至少一个电商的商品库,得到每个商品的商品信息;通过标签体系整合算法将所述每个商品的商品信息整合成自有商品库;接收终端发送来的包含有所述终端利用应用抓包技术获取所述终端上的应用所访问的统一资源定位符URL的网络封包;利用网络封包分析技术解析所述网络封包,得到所述URL的特征;在所述URL的特征与所述自有商品库的特征匹配时,在所述自有商品库中确定所述URL的特征所对应的商品的商品信息。
【技术特征摘要】
1.一种根据终端的统一资源定位符确定商品信息的方法,其特征在于,所述方法包括:利用网络爬虫技术获取至少一个电商的商品库,得到每个商品的商品信息;通过标签体系整合算法将所述每个商品的商品信息整合成自有商品库;接收终端发送来的包含有所述终端利用应用抓包技术获取所述终端上的应用所访问的统一资源定位符URL的网络封包;利用网络封包分析技术解析所述网络封包,得到所述URL的特征;在所述URL的特征与所述自有商品库的特征匹配时,在所述自有商品库中确定所述URL的特征所对应的商品的商品信息。2.根据权利要求1所述的方法,其特征在于,在所述得到所述URL的特征之后,所述方法还包括:判断所述URL的特征是否与所述自有商品库中的特征匹配;在所述URL的特征与所述自有商品库中的特征不匹配时,结束处理。3.根据权利要求2所述的方法,其特征在于,所述URL的特征包括:第一电商名称、第一动作行为、第一商品参数;所述自有商品库的特征包括:第二电商名称、第二动作行为、第二商品参数。4.根据权利要求3所述的方法,其特征在于,所述判断所述URL的特征是否与所述自有商品库中的特征匹配,包括:判断所述URL的特征中的第一电商名称是否与所述自有商品库的特征中的第二电商名称匹配,如果所述第一电商名称与所述第二电商名称不匹配,则结束处理;如果所述第一电商名称与所述第二电商名称匹配,则判断所述URL的特征中的第一动作行为是否与所述自有商品库的特征中的第二动作行为匹配,如果所述第一动作行为与所述第二动作行为不匹配,则结束处理;如果所述第一动作行为与所述第二动作行为匹配,则判断所述URL的特征中的第一商品参数是否与所述自有商品库的特征中的第二商品参数匹配,如果所述第一商品参数与所述第二商品参数不匹配,则结束处理;如果所述第一商品参数与所述第二商品参数匹配,则在所述自有商品库中确定所述第二商品参数所对应的商品信息。5.根据权利要求1至4任一项所述的方法,其特征在于,所述商品信息包括:商品名称、商品价格、商品品牌、商品分类、商品属性、商品产地。6.一种根据终端的统...
【专利技术属性】
技术研发人员:于蓉蓉,许大虎,梅铮,鲁银冰,柯于皇,
申请(专利权)人:中移杭州信息技术有限公司,中国移动通信集团公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。