获取目标对象的方法及装置制造方法及图纸

技术编号:24209698 阅读:14 留言:0更新日期:2020-05-20 16:17
本发明专利技术公开了一种获取目标对象的方法及装置。其中,该方法包括:根据预设的多个种子用户的行为特征数据确定正样本,并从大盘用户中选取与种子用户数量相同的多个非种子用户,根据多个非种子用户的行为特征数据确定负样本,其中,种子用户为行为特征数据满足获取条件的用户,大盘用户为包括目标对象的待选取用户的集合;根据正样本和负样本对二分类模型进行训练,根据训练后的二分类模型对所有的大盘用户打分;根据大盘用户的分数,从多个大盘用户中排名在预设范围内的用户作为目标对象进行获取。本发明专利技术解决了相关技术中通过预测数据对潜客进行挖掘的方式不准确,效果差的技术问题。

Method and device of acquiring target object

【技术实现步骤摘要】
获取目标对象的方法及装置
本专利技术涉及广告投放领域,具体而言,涉及一种获取目标对象的方法及装置。
技术介绍
广告投放中经常会遇到潜客挖掘的场景:给定一批被认为是高价值的种子人群,为了提高广告投放的效益,就需要从大盘所用户中挖掘出潜在的高价值客户去定向的投广告,从而带来比普投更好的收益。业界主要基于人群标签的方式。通过匹配种子人群的标签,比如性别年龄,收入,兴趣爱好,购买倾向等。然后计算大盘人群与种子人群的余弦相似度,选取相似度最高的前N个用户来作为潜客。对于广告公司,并不会收集用户的真实的性别年龄收入以及兴趣爱好等标签,这些标签都是通过一些方式预测来的,所以这些标签本身并不准确,基于这些标签的潜客挖掘方法也就不太准确。这些潜客在实际投放中的效果也确实不好。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种获取目标对象的方法及装置,以至少解决相关技术中通过预测数据对潜客进行挖掘的方式不准确,效果差的技术问题。根据本专利技术实施例的一个方面,提供了一种获取目标对象的方法,包括:根据预设的多个种子用户的行为特征数据确定正样本,并从大盘用户中选取与所述种子用户数量相同的多个非种子用户,根据多个所述非种子用户的行为特征数据确定负样本,其中,所述种子用户为行为特征数据满足获取条件的用户,所述大盘用户为包括所述目标对象的待选取用户的集合;根据正样本和负样本对二分类模型进行训练,根据训练后的所述二分类模型对所有的大盘用户打分;根据所述大盘用户的分数,从多个所述大盘用户中排名在预设范围内的用户作为目标对象进行获取。可选的,根据预设的多个种子用户的行为特征数据确定正样本,并从大盘用户中选取与所述种子用户数量相同的多个非种子用户,根据多个所述非种子用户的行为特征数据确定负样本之前,包括:获取多个大盘用户的历史数据;接收多个所述种子用户的行为特征数据。可选的,获取多个大盘用户的历史数据包括:获取在预设时间内的多个所述大盘用户的历史日志,其中,所述历史日志包括下列至少之一:行为时间,具体使用的应用程序,所属终端,地理位置;根据所述历史日志,获取所述历史数据。可选的,根据多个种子用户的行为特征数据确定正样本包括:确定多个种子用户的行为特征数据;对多个所述种子用户的行为特征数据进行聚类,去除多个所述种子用户中行为特征数据包括离群数据的种子用户;从去除后的多个种子用户中选取预设数量的种子用户,并确定选取的种子用户的行为特征数据为所述正样本。可选的,根据多个非种子用户的行为特征数据确定负样本包括:从多个所述非种子用户中,确定所述非种子用户的行为特征数据;将所述非种子用户的行为特征数据作为负样本,其中,所述正样本和所述负样本的用户均不同。可选的,从多个所述非种子用户中,确定所述非种子用户的行为特征数据包括:对所述非种子用户的所述历史日志进行清洗,去除所述历史日志中的应用程序流量数据异常的历史日志,生成按照流量数据排序的应用程序列表,其中,所述历史日志还包括所述行为特征数据所使用的应用程序流量数据;合并清洗过的历史日志,确定每个所述非种子用户的行为数据,其中,所述行为数据包括下列至少之一:预设时间内的行为数量,所使用的应用程序的操作行为的数量,操作行为数量最大的应用程序的类别,出现频率最高的地理位置,使用频率最高的终端;根据所述行为数据生成特征矩阵,对所述特征矩阵的数值特征进行归一化,对所述特征矩阵的类别特征进行编码,以确定所述非种子用户的所述行为特征数据。可选的,根据所述大盘用户的分数,从多个所述大盘用户中排名在预设范围内的用户作为目标对象进行获取之后包括:向所述目标对象进行内容定向投放。根据本专利技术实施例的另一方面,还提供了一种获取目标对象的装置,包括:确定模块,用于根据预设的多个种子用户的行为特征数据确定正样本,并从大盘用户中选取与所述种子用户数量相同的多个非种子用户,根据多个所述非种子用户的行为特征数据确定负样本,其中,所述种子用户为行为特征数据满足获取条件的用户,所述大盘用户为包括所述目标对象的待选取用户的集合;打分模块,用于根据正样本和负样本对二分类模型进行训练,根据训练后的所述二分类模型对所有的大盘用户打分;获取模块,用于根据所述大盘用户的分数,从多个所述大盘用户中排名在预设范围内的用户作为目标对象进行获取。根据本专利技术实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的获取目标对象的方法。根据本专利技术实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项的获取目标对象的方法。在本专利技术实施例中,采用根据多个种子用户的行为特征数据确定正样本,根据多个非种子用户的行为特征数据确定负样本,其中,种子用户为特征数据满足获取条件的用户;根据正样本和负样本对二分类模型进行训练;根据训练后的二分类模型对待获取用户打分;根据待获取用户的分数,从多个待获取用户中获取排名在预设范围内的用户的方式,通过种子用户和非种子用户的行为特征数据对待获取用户进行打分,从而对待获取用户的行为特征进行预测,将分数在预设范围内的用户作为潜客,达到了准确挖掘潜客的目的,从而实现了提高潜客挖掘的准确率的技术效果,进而解决了相关技术中通过预测数据对潜客进行挖掘的方式不准确,效果差的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种获取目标对象的方法的流程图;图2是根据本专利技术实施方式的潜客挖掘的流程图;图3是根据本专利技术实施例的一种获取目标对象的装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。根据本专利技术实施例,提供了一种获取目标对象方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程本文档来自技高网
...

【技术保护点】
1.一种获取目标对象的方法,其特征在于,包括:/n根据预设的多个种子用户的行为特征数据确定正样本,并从大盘用户中选取与所述种子用户数量相同的多个非种子用户,根据多个所述非种子用户的行为特征数据确定负样本,其中,所述种子用户为行为特征数据满足获取条件的用户,所述大盘用户为包括所述目标对象的待选取用户的集合;/n根据正样本和负样本对二分类模型进行训练;/n根据训练后的所述二分类模型对所有的大盘用户打分;/n根据所述大盘用户的分数,从多个所述大盘用户中排名在预设范围内的用户作为目标对象进行获取。/n

【技术特征摘要】
1.一种获取目标对象的方法,其特征在于,包括:
根据预设的多个种子用户的行为特征数据确定正样本,并从大盘用户中选取与所述种子用户数量相同的多个非种子用户,根据多个所述非种子用户的行为特征数据确定负样本,其中,所述种子用户为行为特征数据满足获取条件的用户,所述大盘用户为包括所述目标对象的待选取用户的集合;
根据正样本和负样本对二分类模型进行训练;
根据训练后的所述二分类模型对所有的大盘用户打分;
根据所述大盘用户的分数,从多个所述大盘用户中排名在预设范围内的用户作为目标对象进行获取。


2.根据权利要求1所述的方法,其特征在于,根据预设的多个种子用户的行为特征数据确定正样本,并从大盘用户中选取与所述种子用户数量相同的多个非种子用户,根据多个所述非种子用户的行为特征数据确定负样本之前,包括:
获取多个大盘用户的历史数据;
接收多个所述种子用户的行为特征数据。


3.根据权利要求2所述的方法,其特征在于,获取多个大盘用户的历史数据包括:
获取在预设时间内的多个所述大盘用户的历史日志,其中,所述历史日志包括下列至少之一:行为时间,具体使用的应用程序,所属终端,地理位置;
根据所述历史日志,获取所述历史数据。


4.根据权利要求3所述的方法,其特征在于,根据多个种子用户的行为特征数据确定正样本包括:
确定多个种子用户的行为特征数据;
对多个所述种子用户的行为特征数据进行聚类,去除多个所述种子用户中行为特征数据包括离群数据的种子用户;
从去除后的多个种子用户中选取预设数量的种子用户,并确定选取的种子用户的行为特征数据为所述正样本。


5.根据权利要求4所述的方法,其特征在于,根据多个非种子用户的行为特征数据确定负样本包括:
从多个所述非种子用户中,确定所述非种子用户的行为特征数据;
将所述非种子用户的行为特征数据作为负样本,其中,所述正样本和所述负样本的用户均不同。


6.根据权利要求5所述的方法,其...

【专利技术属性】
技术研发人员:杨同洲欧阳辰孙冠伦
申请(专利权)人:北京深演智能科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1