【技术实现步骤摘要】
数据处理方法及装置
本申请涉及互联网
,尤其涉及一种数据处理方法及装置。
技术介绍
随着互联网技术的发展,用户可以从网站上获取的资源数据越来越多,相应的,提供资源数据的数据对象(例如网店等)的数量也越来越多。各大网站除了可以向用户推荐资源数据之外,还可以向用户推荐提供相似资源数据的数据对象,以便于用户获取更多更好的资源数据。可见,数据对象之间存在着竞争关系。对于数据对象来说,一定程度上希望能够获得与其存在一定竞争关系的其它数据对象的信息。在现有技术中,各大网站主要是将数据对象所提供的资源数据进行相似度计算,通过判断两个数据对象所提供的资源数据是否相似来判断两个数据对象是否相似。对用户来说,这种判断方法可以帮助用户发现更多相近的资源数据,但是从数据对象的角度来看,提供相似资源数据的数据对象不一定存在竞争关系,资源数据并不是决定两个数据对象之间是否存在竞争的唯一因素,所以现有方法并不适用于发现存在竞争关系的数据对象。
技术实现思路
本申请的多个方面提供一种数据处理方法及装置,用以发现存在竞争关系的数据对象。本申请的一方面,提供一种数据处理方法,包括:从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,所述资源数据用于实现用户的业务需求;从所述初始数据对象中,获取对所述第一数据对象具有业务分流作用的候选数据对象;根据所述候选数据对象对所述第一数据对象的业务分流量,确定与所述第一数据对象存在竞争关系的数据对象。本申请的另一方面,提供一种数据处理装置,包括:初始获取模块,用于从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,所述资 ...
【技术保护点】
一种数据处理方法,其特征在于,包括:从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,所述资源数据用于实现用户的业务需求;从所述初始数据对象中,获取对所述第一数据对象具有业务分流作用的候选数据对象;根据所述候选数据对象对所述第一数据对象的业务分流量,确定与所述第一数据对象存在竞争关系的数据对象。
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,所述资源数据用于实现用户的业务需求;从所述初始数据对象中,获取对所述第一数据对象具有业务分流作用的候选数据对象;根据所述候选数据对象对所述第一数据对象的业务分流量,确定与所述第一数据对象存在竞争关系的数据对象。2.根据权利要求1所述的方法,其特征在于,所述从网络系统中获取与第一数据对象具有相似资源数据的初始数据对象,包括:根据所述第一数据对象在指定时间段内各一级资源类目下的业务量数据,确定所述第一数据对象的主营一级资源类目;根据所述网络系统中除所述第一数据对象之外的其它数据对象在所述指定时间段内在各一级资源类目下的业务量数据,确定所述其它数据对象的主营一级资源类目;从所述其它数据对象中,选择主营一级资源类目与所述第一数据对象相同,且业务量数据与所述第一数据对象的业务量数据位于同一层级的数据对象作为所述初始数据对象。3.根据权利要求2所述的方法,其特征在于,所述从所述初始数据对象中,获取对所述第一数据对象具有业务分流作用的候选数据对象之前,还包括:根据预设的黑名单过滤规则,去除所述初始数据对象中指定业务指标存在异常的数据对象。4.根据权利要求3所述的方法,其特征在于,所述根据预设的黑名单过滤规则,去除所述初始数据对象中指定业务指标存在异常的数据对象,包括:根据所述黑名单过滤规则中定义的虚假业务,确定所述初始数据对象中存在虚假业务的可疑数据对象;判断所述可疑数据对象的虚假业务产生的业务量数据是否满足所述黑名单过滤规则中定义的过滤要求;若判断结果为是,则将所述可疑数据对象从所述初始数据对象中去除。5.根据权利要求1所述的方法,其特征在于,所述从所述初始数据对象中,获取对所述第一数据对象具有业务分流作用的候选数据对象,包括:从关键词引流角度、用户流失角度和业务量相似角度中的至少一种角度,针对所述第一数据对象和所述初始数据对象进行业务分流分析,以获得所述候选数据对象。6.根据权利要求5所述的方法,其特征在于,所述从关键词引流角度,针对所述第一数据对象和所述初始数据对象进行业务分流分析,以获得所述候选数据对象,包括:根据所述第一数据对象面向用户提供的关键词和所述初始数据对象面向对象提供的关键词,从所述初始数据对象中,获取与所述第一数据对象共用至少一个关键词的数据对象作为所述候选数据对象。7.根据权利要求6所述的方法,其特征在于,所述根据所述候选数据对象对所述第一数据对象的业务分流量,确定与所述第一数据对象存在竞争关系的数据对象,包括:对于所述第一数据对象面向用户提供的每个关键词,从所述候选数据对象中,获取与所述第一数据对象在所述关键词下的用户访问量最接近的至少一个目标数据对象;根据所述第一数据对象在所述关键词下的用户访问量和所述至少一个目标数据对象在所述关键词下的用户访问量,计算所述第一数据对象与所述至少一个目标数据对象之间的用户引流相似度;根据所述第一数据对象与所述至少一个目标数据对象之间的用户引流相似度,从所述至少一个目标数据对象中确定与所述第一数据对象存在竞争关系的数据对象。8.根据权利要求7所述的方法,其特征在于,所述从所述至少一个候选数据对象中,获取与所述第一数据对象在所述关键词下的用户访问量最接近的至少一个目标数据对象,包括:按照所述第一数据对象在所述关键词下的用户访问量和所述候选数据对象在所述关键词下的用户访问量,对所述第一数据对象和所述候选数据对象进行排序,对排序结果进行分片,确定所述第一数据对象所在的目标分片,获取所述目标分片以及所述目标分片的相邻分片中的候选数据对象作为所述至少一个目标数据对象。9.根据权利要求5所述的方法,其特征在于,所述从用户流失角度,针对所述第一数据对象和所述初始数据对象进行业务分流分析,以获得所述候选数据对象,包括:根据所述第一数据对象的用户群体中各用户的网络行为数据,从所述第一数据对象的用户群体中确定符合预设的流失用户定义的流失用户,从所述初始数据对象中,获取用户群体中包括所述流失用户的数据对象作为所述候选数据对象。10.根据权利要求9所述的方法,其特征在于,所述根据所述候选数据对象对所述第一数据对象的业务分流量,确定与所述第一数据对象存在竞争关系的数据对象,包括:计算由所述候选数据对象引起的所述第一数据对象的业务总流失量;根据由所述候选数据对象引起的所述第一数据对象的业务总流失量,从所述候选数据对象中确定与所述第一数据对象存在竞争关系的数据对象。11.根据权利要求10所述的方法,其特征在于,所述流失用户定义为在指定时间范围内访问数据对象A下的资源数据后直接跳转到另一数据对象B下并获取所述数据对象B下的资源数据的用户;所述计算由所述候选数据对象引起的所述第一数据对象的业务总流失量,包括:计算由所述流失用户在从所述第一数据对象跳转到所述候选数据对象下并因获取所述候选数据对象下的资源数据产生的业务量总和。12.根据权利要求5所述的方法,其特征在于,所述从业务量相似角度,针对所述第一数据对象和所述初始数据对象进行业务分流分析,以获得所述候选数据对象,包括:根据所述第一数据对象在第二指定资源类目下的业务量数据,从所述初始数据对象中,获取在所述第二指定资源类目下与所述第一数据对象的业务量数据最接近的至少一个数据对象作为所述候选数据对象。13.根据权利要求12所述的方法,其特征在于,所述根据...
【专利技术属性】
技术研发人员:应倩岚,郑苏杭,徐萧萧,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。