数据处理方法及装置制造方法及图纸

技术编号:15639340 阅读:80 留言:0更新日期:2017-06-15 22:55
本申请提供一种数据处理方法及装置。数据处理方法包括:从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,资源数据用于实现用户的业务需求;从初始数据对象中,获取对第一数据对象具有业务分流作用的候选数据对象;根据候选数据对象对第一数据对象的业务分流量,确定与第一数据对象存在竞争关系的数据对象。本申请可以从数据对象的角度考虑,发现存在竞争关系的数据对象。

【技术实现步骤摘要】
数据处理方法及装置
本申请涉及互联网
,尤其涉及一种数据处理方法及装置。
技术介绍
随着互联网技术的发展,用户可以从网站上获取的资源数据越来越多,相应的,提供资源数据的数据对象(例如网店等)的数量也越来越多。各大网站除了可以向用户推荐资源数据之外,还可以向用户推荐提供相似资源数据的数据对象,以便于用户获取更多更好的资源数据。可见,数据对象之间存在着竞争关系。对于数据对象来说,一定程度上希望能够获得与其存在一定竞争关系的其它数据对象的信息。在现有技术中,各大网站主要是将数据对象所提供的资源数据进行相似度计算,通过判断两个数据对象所提供的资源数据是否相似来判断两个数据对象是否相似。对用户来说,这种判断方法可以帮助用户发现更多相近的资源数据,但是从数据对象的角度来看,提供相似资源数据的数据对象不一定存在竞争关系,资源数据并不是决定两个数据对象之间是否存在竞争的唯一因素,所以现有方法并不适用于发现存在竞争关系的数据对象。
技术实现思路
本申请的多个方面提供一种数据处理方法及装置,用以发现存在竞争关系的数据对象。本申请的一方面,提供一种数据处理方法,包括:从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,所述资源数据用于实现用户的业务需求;从所述初始数据对象中,获取对所述第一数据对象具有业务分流作用的候选数据对象;根据所述候选数据对象对所述第一数据对象的业务分流量,确定与所述第一数据对象存在竞争关系的数据对象。本申请的另一方面,提供一种数据处理装置,包括:初始获取模块,用于从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,所述资源数据用于实现用户的业务需求;候选获取模块,用于从所述初始数据对象中,获取对所述第一数据对象具有业务分流作用的候选数据对象;确定模块,用于根据所述候选数据对象对所述第一数据对象的业务分流量,确定与所述第一数据对象存在竞争关系的数据对象。在本申请中,首先从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,然后再从初始数据对象中,获取对第一数据对象具有业务分流作用的候选数据对象,进而根据候选数据对象对第一数据对象的业务分流量,确定与第一数据对象具有竞争关系的数据对象。本申请不仅考虑数据对象所提供资源数据的相似度,而且从业务上考虑,将资源数据相似且相互之间具有业务分流作用的数据对象作为存在竞争关系的数据对象,解决了现有技术无法发现存在竞争关系的数据对象的问题,而且所发现的存在竞争关系的数据对象的精准度较高。【附图说明】为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请一实施例提供的数据处理方法的流程示意图;图2为本申请另一实施例提供的数据处理装置的结构示意图。【具体实施方式】为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。图1为本申请一实施例提供的数据处理方法的流程示意图。如图1所示,该方法包括:101、从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,这里的资源数据用于实现用户的业务需求。102、从上述初始数据对象中,获取对第一数据对象具有业务分流作用的候选数据对象。103、根据上述候选数据对象对第一数据对象的业务分流量,确定与第一数据对象存在竞争关系的数据对象。本实施例提供一种数据处理方法,可由数据处理装置来执行,用以发现存在竞争关系的数据对象,并且保证所发现的存在竞争关系的数据对象的精准度。本实施例提供的方法可用于任何需要发现存在竞争关系的数据对象的应用场景。举例说明,采用本实施例提供的方法可以发现电商平台上存在竞争关系的网络店铺。又例如,采用本实施例提供的方法可以发现资源下载网站上存在竞争关系的视频资源发布者。又例如,采用本实施例提供的方法可以基于用户终端(例如手机或电脑)上安装的各外卖提供商的客户端发现存在竞争关系的外卖提供商。根据应用场景的不同,本实施例的网络系统、网络系统中的用户、数据对象以及数据对象提供的资源数据等均会有所不同。本实施例不对网络系统、网络系统中的用户、数据对象及数据对象提供的资源数据等的实现形式进行限定。例如,网络系统可以是以各电商网站为核心的网络系统;相应的,网络系统中的数据对象可以是电商网站上的网络服务提供商,例如店铺;相应的,数据对象提供的资源数据可以是各网络服务提供商提供的商品对象数据,例如店铺内销售的衣服、食品、电子产品等数据;相应的,网络系统中用户的网络行为可以包括浏览、收藏、加购物车、购买、支付以及评论中的至少一种。又例如,网络系统可以是以资源下载网站为核心的网络系统;相应的,网络系统中的数据对象可以是资源发布/上传者;相应的,数据对象提供的资源数据可以是具体的资源,例如视频资源、文本资源等;相应的,网络系统中用户的网络行为可以包括预览、下载、播放等中的至少一种。由上述举例可见,本实施例中的数据对象主要是指一些通过网络面向用户提供服务的服务提供者,可以是电子商务、电子政务、公司业务流程电子化等各应用领域中的服务提供者。相应的,数据对象提供的资源数据主要用于实现用户的业务需求。采用本实施例提供的方法,可以发现网络系统中任何存在竞争关系的数据对象。为了便于描述和区分,本实施例以发现与第一数据对象存在竞争关系的数据对象为例进行说明。第一数据对象可以是网络系统中的任意数据对象。当确定需要发现与第一数据对象存在竞争关系的数据对象时,例如可以周期性的确定与第一数据对象存在竞争关系的数据对象,因此可以在每个后期达到时时或者在接收到第一数据对象的请求时,数据处理装置可以执行本实施例提供的方法流程,以确定与第一数据对象存在竞争关系的数据对象。在实际应用中,每个数据对象提供多种资源数据,不同资源数据用于实现用户的不同业务需求。举例说明,对于店铺,店铺内可能同时提供服装、母婴用品、休闲零食等多种商品对象,而服装下面又包括上衣、裤子、鞋子,上衣又会分为风衣、卫衣、毛衣、打底衫等等。为了便于对资源数据进行管理,数据对象一般会通过资源类目对各种资源数据进行分级管理,例如可以包括一级资源类目、二级资源类目、三级资源类目以及叶子资源类目等,不同级别的资源类目下包括不同的资源数据。例如,上面的服装、母婴用品、休闲零食等可以作为一级资源类目,而服装下面的上衣、裤子、鞋子可以作为二级资源类目,等等。如果两个数据对象提供的资源数据相差较大,则不易形成竞争关系。例如一个店铺售卖服务,另一店铺售卖电子产品,由于这两个店铺面向的用户群体不太相同,所以两者之间不太容易形成竞争关系。相反,如果两个数据对象提供的资源数据比较相近,则容易形成竞争关系。例如,若一个店铺销售毛衣,另一店铺也销售毛衣,则这两个店铺面向的用户群体相同,都是从购买毛衣的用户中争取用户本文档来自技高网...
数据处理方法及装置

【技术保护点】
一种数据处理方法,其特征在于,包括:从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,所述资源数据用于实现用户的业务需求;从所述初始数据对象中,获取对所述第一数据对象具有业务分流作用的候选数据对象;根据所述候选数据对象对所述第一数据对象的业务分流量,确定与所述第一数据对象存在竞争关系的数据对象。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,所述资源数据用于实现用户的业务需求;从所述初始数据对象中,获取对所述第一数据对象具有业务分流作用的候选数据对象;根据所述候选数据对象对所述第一数据对象的业务分流量,确定与所述第一数据对象存在竞争关系的数据对象。2.根据权利要求1所述的方法,其特征在于,所述从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,包括:根据所述第一数据对象在指定时间段内各一级资源类目下的业务量数据,确定所述第一数据对象的主营一级资源类目;根据所述网络系统中除所述第一数据对象之外的其它数据对象在所述指定时间段内在各一级资源类目下的业务量数据,确定所述其它数据对象的主营一级资源类目;从所述其它数据对象中,选择主营一级资源类目与所述第一数据对象相同,且业务量数据与所述第一数据对象的业务量数据位于同一层级的数据对象作为所述初始数据对象。3.根据权利要求2所述的方法,其特征在于,所述从所述初始数据对象中,获取对所述第一数据对象具有业务分流作用的候选数据对象之前,还包括:根据预设的黑名单过滤规则,去除所述初始数据对象中指定业务指标存在异常的数据对象。4.根据权利要求3所述的方法,其特征在于,所述根据预设的黑名单过滤规则,去除所述初始数据对象中指定业务指标存在异常的数据对象,包括:根据所述黑名单过滤规则中定义的虚假业务,确定所述初始数据对象中存在虚假业务的可疑数据对象;判断所述可疑数据对象的虚假业务产生的业务量数据是否满足所述黑名单过滤规则中定义的过滤要求;若判断结果为是,则将所述可疑数据对象从所述初始数据对象中去除。5.根据权利要求1所述的方法,其特征在于,所述从所述初始数据对象中,获取对所述第一数据对象具有业务分流作用的候选数据对象,包括:从关键词引流角度、用户流失角度和业务量相似角度中的至少一种角度,针对所述第一数据对象和所述初始数据对象进行业务分流分析,以获得所述候选数据对象。6.根据权利要求5所述的方法,其特征在于,所述从关键词引流角度,针对所述第一数据对象和所述初始数据对象进行业务分流分析,以获得所述候选数据对象,包括:根据所述第一数据对象面向用户提供的关键词和所述初始数据对象面向对象提供的关键词,从所述初始数据对象中,获取与所述第一数据对象共用至少一个关键词的数据对象作为所述候选数据对象。7.根据权利要求6所述的方法,其特征在于,所述根据所述候选数据对象对所述第一数据对象的业务分流量,确定与所述第一数据对象存在竞争关系的数据对象,包括:对于所述第一数据对象面向用户提供的每个关键词,从所述候选数据对象中,获取与所述第一数据对象在所述关键词下的用户访问量最接近的至少一个目标数据对象;根据所述第一数据对象在所述关键词下的用户访问量和所述至少一个目标数据对象在所述关键词下的用户访问量,计算所述第一数据对象与所述至少一个目标数据对象之间的用户引流相似度;根据所述第一数据对象与所述至少一个目标数据对象之间的用户引流相似度,从所述至少一个目标数据对象中确定与所述第一数据对象存在竞争关系的数据对象。8.根据权利要求7所述的方法,其特征在于,所述从所述至少一个候选数据对象中,获取与所述第一数据对象在所述关键词下的用户访问量最接近的至少一个目标数据对象,包括:按照所述第一数据对象在所述关键词下的用户访问量和所述候选数据对象在所述关键词下的用户访问量,对所述第一数据对象和所述候选数据对象进行排序,对排序结果进行分片,确定所述第一数据对象所在的目标分片,获取所述目标分片以及所述目标分片的相邻分片中的候选数据对象作为所述至少一个目标数据对象。9.根据权利要求5所述的方法,其特征在于,所述从用户流失角度,针对所述第一数据对象和所述初始数据对象进行业务分流分析,以获得所述候选数据对象,包括:根据所述第一数据对象的用户群体中各用户的网络行为数据,从所述第一数据对象的用户群体中确定符合预设的流失用户定义的流失用户,从所述初始数据对象中,获取用户群体中包括所述流失用户的数据对象作为所述候选数据对象。10.根据权利要求9所述的方法,其特征在于,所述根据所述候选数据对象对所述第一数据对象的业务分流量,确定与所述第一数据对象存在竞争关系的数据对象,包括:计算由所述候选数据对象引起的所述第一数据对象的业务总流失量;根据由所述候选数据对象引起的所述第一数据对象的业务总流失量,从所述候选数据对象中确定与所述第一数据对象存在竞争关系的数据对象。11.根据权利要求10所述的方法,其特征在于,所述流失用户定义为在指定时间范围内访问数据对象A下的资源数据后直接跳转到另一数据对象B下并获取所述数据对象B下的资源数据的用户;所述计算由所述候选数据对象引起的所述第一数据对象的业务总流失量,包括:计算由所述流失用户在从所述第一数据对象跳转到所述候选数据对象下并因获取所述候选数据对象下的资源数据产生的业务量总和。12.根据权利要求5所述的方法,其特征在于,所述从业务量相似角度,针对所述第一数据对象和所述初始数据对象进行业务分流分析,以获得所述候选数据对象,包括:根据所述第一数据对象在第二指定资源类目下的业务量数据,从所述初始数据对象中,获取在所述第二指定资源类目下与所述第一数据对象的业务量数据最接近的至少一个数据对象作为所述候选数据对象。13.根据权利要求12所述的方法,其特征在于,所述根据...

【专利技术属性】
技术研发人员:应倩岚郑苏杭徐萧萧
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1