信息投放方法及装置制造方法及图纸

技术编号:18732349 阅读:16 留言:0更新日期:2018-08-22 03:00
本发明专利技术实施例提供信息投放方法及装置。该方法包括:根据初始种子人群及第k‑1轮投放人群的反馈数据,生成第k轮扩散训练集;上述第k轮扩散训练集中的每一个体样本具有特征向量,上述特征向量包括上述个体样本的多个属性及相应的属性值;使用上述第k轮扩散训练集中所有个体样本的特征向量进行第k轮迭代训练,得到第k轮扩散模型;使用上述第k轮扩散模型从整体人群中筛选出第k轮投放人群,第k轮投放人群用于第k轮信息投放。在本发明专利技术实施例中基于前一轮投放人群的反馈数据对第k轮扩散训练集做调整,这样即使初始种子人群质量差,也可通过反馈数据及多次迭代来调整样本,使投放人群与信息的匹配度越来越高,提高了投放人群的精准度。

Information input method and device

The embodiment of the invention provides information input method and device. The method includes: generating the k-th round diffusion training set according to the feedback data of the initial seed population and the k_1 round population; each individual sample in the k-th round diffusion training set has the eigenvector, and the eigenvector includes multiple attributes and corresponding attribute values of the individual sample; and using the k-th round diffusion training set. The eigenvectors of all individual samples were trained by the k-th iteration training, and the k-th iteration diffusion model was obtained. The k-th iteration diffusion model was used to select the k-th iteration population from the whole population, and the k-th iteration population was used for the k-th iteration. In the embodiment of the invention, the k-th round diffusion training set is adjusted based on the feedback data of the previous round of population, so that even if the initial seed population is of poor quality, the sample can be adjusted by feedback data and multiple iterations, so that the matching degree between the population and the information is higher and higher, and the precision of the population is improved.

【技术实现步骤摘要】
信息投放方法及装置
本专利技术涉及计算机
,具体涉及信息投放方法及装置。
技术介绍
目前很多领域都需要进行信息投放。例如,微信朋友圈的广告推送,或者,论文搜索网站的论文推荐等。现有的信息投放方式可基于种子人群进行人群扩散,得到投放人群,再对投放人群群进行信息投放。所谓的种子人群是指在特定应用场景下,对产品或服务具有相同需求和兴趣的人群。投放人群理论上应与种子人群具有相同需求和兴趣,但数量是种子人群的几倍、几十倍乃至上百上千倍。由种子人群扩散出的投放人群的精准性,决定了信息投放的准确性,因此,如何精准扩散出投放人群,是目前研发的热门。
技术实现思路
有鉴于此,本专利技术实施例提供信息投放及装置,以提高扩散投放人群的准确度,进而提高信息投放的准确性。为实现上述目的,本专利技术实施例提供如下技术方案:一种信息投放方法,包括:根据初始种子人群及第k-1轮投放人群的反馈数据,生成第k轮扩散训练集;所述k为整数;所述第k轮扩散训练集中的每一个体具有特征向量,所述特征向量包括所述个体的多个属性及相应的属性值;使用所述第k轮扩散训练集中所有个体的特征向量进行第k轮迭代训练,得到第k轮扩散模型;使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群;所述第k轮投放人群用于第k轮信息投放。一种信息投放装置,包括:扩散训练集生成单元,用于根据初始种子人群及第k-1轮投放人群的反馈数据,生成第k轮扩散训练集;所述k为整数;所述扩散训练集中的每一个体具有特征向量,所述特征向量包括所述个体的多个属性及相应的属性值;训练单元,用于使用所述第k轮扩散训练集中所有个体的特征向量进行第k轮迭代训练,得到第k轮扩散模型;筛选单元,用于使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群;所述第k轮投放人群用于进行第k轮信息投放。在本专利技术实施例中,是基于前一轮(k-1)的投放人群的反馈数据对第k轮扩散训练集做调整,这样即使初始种子人群的质量差,也可通过反馈数据及多次迭代来调整样本,从而使得投放人群与信息的匹配度越来越高,进而提高了扩散出的投放人群的精准度。同时,在进行迭代训练时,引入了第k轮扩散训练集中所有个体的特征向量进行模型训练,并根据训练出的模型筛选出第k轮投放人群,这样,可保证训练出的模型可以精确区分与正样本子集相似的人群,这样也提高了扩散出的投放人群的精准度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为应用场景示意图;图2为本专利技术实施例提供的信息投放平台或服务器的计算机架构示例图;图3-5为本专利技术实施例提供的信息投放方法示例性流程图;图6为本专利技术实施例提供的信息投放装置的示例性结构图。具体实施方式本专利技术提供了信息投放方法及装置,上述信息投放方法及装置可应用于各种需要进行人群扩散的应用领域,例如,可应用于微信朋友圈的人群扩散及广告投放领域。图1示出了上述信息投放装置的一种应用场景,在该应用场景中可包括:信息投放平台101和数据库102。信息投放平台101的功能可由一台或多台信息投放服务器实现。在本专利技术中,信息投放平台101主要负责基于初始种子人群进行扩散得到投放人群,及向投放人群的客户端进行信息投放。上述信息投放装置可以软件的形式应用于上述信息投放服务器中,或以硬件(例如具体可为信息投放服务器的控制器/处理器)的形式作为信息投放服务器的组成部分。当以软件形式存在时,上述信息投放装置具体可为一应用程序,例如终端应用程序等,也可作为某应用程序或操作系统的组件或插件。上述数据库102可用于存储信息投放平台下所有用户的用户唯一标识(ID)、基础信息,以及每一用户的各种属性及属性值。其中,基础信息可包括手机号、邮箱等,属性示例性得可包括:所在区域、性别、年龄、身高等的一种或多种。在一些应用场景下,属性还可包括:兴趣标签(兴趣标签是用于反映用户兴趣的信息)、购买次数等等,在此不作一一赘述。数据库102的功能可由一台或多台数据库节点实现。在实际中,信息投放平台101和数据库102的功能也可由同一台服务器实现。此外,在某些应用场景下,数据库102也可用于提供初始种子人群。当然,初始种子人群也可由诸如广告主等信息发布者来提供。由于数据库102所提供信息的不同,数据库102可进一步由一个或多个服务器构成。例如,数据库102可包括基础信息服务器、用户画像引擎(可查询兴趣标签)等。图2示出了上述信息投放平台/服务器/装置的一种通用计算机系统结构。上述计算机系统可包括总线、处理器1、存储器2、通信接口3、输入设备4和输出设备5。处理器1、存储器2、通信接口3、输入设备4和输出设备5通过总线相互连接。其中:总线可包括一通路,在计算机系统各个挂件之间传送信息。处理器1可以是通用处理器,例如通用中央处理器(CPU)、网络处理器(NetworkProcessor,简称NP)、微处理器等,也可以是特定应用集成电路(application-specificintegratedcircuit,ASIC),或一个或多个用于控制本专利技术方案程序执行的集成电路,还可以是数字信号处理器(DSP)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。存储器2中保存有执行本专利技术技术方案的程序,还可以保存有操作系统和其他关键业务。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。更具体的,存储器2可以包括只读存储器(read-onlymemory,ROM)、可存储静态信息和指令的其他类型的静态存储设备、随机存取存储器(randomaccessmemory,RAM)、可存储信息和指令的其他类型的动态存储设备、磁盘存储器、flash等等。输入设备4可包括接收用户输入的数据和信息的装置,例如键盘、鼠标、摄像头、扫描仪、光笔、语音输入装置、触摸屏、计步器或重力感应器等。输出设备5可包括允许输出信息给用户的装置,例如显示屏、打印机、扬声器等。通信接口3可包括使用任何收发器一类的装置,以便与其他设备或通信网络通信,如以太网,无线接入网(RAN),无线局域网(WLAN)等。处理器1执行存储器2中所存放的程序,以及调用其他设备,可用于实现本专利技术实施例所提供的信息投放方法中的各个步骤。下面将基于上面的本专利技术涉及的共性方面,对本专利技术实施例进一步详细说明。图3示出了上述信息投放方法的一种示例性流程。图3所示的方法应用于图1提及的领域或应用场景中,由图2所示的信息投放平台(或服务器)的处理器1与其他设备交互完成。上述示例性流程包括:在301部分:信息投放平台(或服务器)的处理器1根据初始种子人群及第k-1轮投放人群的反馈数据,生成第k轮扩散训练集。K为从0开始逐一递增的整数。上述初始种子人群是指在特定应用场景下(例如微信朋友圈),对产品或服务具有相同需求和兴趣的人群。在广告投放场景,初始种子人群可由广告主提供。广告主可上传初始种子人群包以实现初始种子人群的提供。初始种子人群包的内容可包括电话号码、账号、邮箱、用户唯一身份标识(ID)等的至本文档来自技高网...

【技术保护点】
1.一种信息投放方法,其特征在于,包括:根据初始种子人群及第k‑1轮投放人群的反馈数据,生成第k轮扩散训练集;所述k为整数;所述第k轮扩散训练集中的每一个体具有特征向量,所述特征向量包括所述个体的多个属性及相应的属性值;使用所述第k轮扩散训练集中所有个体的特征向量进行第k轮迭代训练,得到第k轮扩散模型;使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群;所述第k轮投放人群用于第k轮信息投放。

【技术特征摘要】
1.一种信息投放方法,其特征在于,包括:根据初始种子人群及第k-1轮投放人群的反馈数据,生成第k轮扩散训练集;所述k为整数;所述第k轮扩散训练集中的每一个体具有特征向量,所述特征向量包括所述个体的多个属性及相应的属性值;使用所述第k轮扩散训练集中所有个体的特征向量进行第k轮迭代训练,得到第k轮扩散模型;使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群;所述第k轮投放人群用于第k轮信息投放。2.如权利要求1所述方法,其特征在于,所述第k轮扩散训练集包括第一正样本子集和第一负样本子集;所述第一正样本子集中的个体作为正样本,所述第一负样本子集中的个体作为负样本;所述使用所述第k轮扩散训练集中所有个体的特征向量进行第k轮迭代训练,得到第k轮扩散模型包括:将所述第一正样本子集和第一负样本子集中每一个体的特征向量导入第一预设模型进行训练学习,得到所述第k轮扩散模型。3.如权利要求1或2所述的方法,其特征在于,当k=0时,所述生成第k轮扩散训练集包括:获取所述初始种子人群作为第一正样本子集;从所述整体人群中随机选取与所述初始种子人群等量的人群,作为第一负样本子集;获取所述第k轮扩散训练集中每一个体的特征向量。4.如权利要求1或2所述的方法,其特征在于,当k≠0时,所述生成第k轮扩散训练集包括:根据第k-1轮投放人群的反馈数据,生成第k轮投放训练集;所述第k轮投放训练集中的每一个体具有特征向量;将所述第k轮投放训练集中所有个体的特征向量导入第二预设模型进行训练学习,得到第k轮投放模型;使用所述第k轮投放模型,从所述第k轮投放训练集和所述初始种子人群中筛选出所述第k轮扩散训练集。5.如权利要求1所述的方法,其特征在于,所述第k轮投放训练集包括第二正样本子集和第二负样本子集;所述第二正样本子集中的个体作为正样本,所述第二负样本子集中的个体作为负样本;所述生成第k轮投放训练集包括:获取第k-1轮投放人群的反馈数据;所述反馈数据包括所述第k-1轮投放人群的反馈统计数据,以及所述第k-1轮投放人群中每一个体的行为数据;所述反馈统计数据是根据所述第k-1轮投放人群所有个体的行为数据计算得到的;从所述第k-1轮投放人群中筛选出所述第二正样本子集;所述第二正样本子集中个体的行为数据与所述反馈统计数据之间具有正向关联关系,并且,所述第二正样本子集中的每一个体均具有特征向量;从所述第k-1轮投放人群中筛选出所述第二负样本子集;所述第二负样本子集中的每一个体均具有特征向量。6.如权利要求5所述的方法,其特征在于,所述第二负样本子集包括所述第k-1轮投放人群中剔除了所述第二正样本子集后的其他个体;或者,所述第二负样本子集包含所述第k-1轮投放人群。7.如权利要求6所述方法,其特征在于,所述使用所述第k轮投放模型,从所述第k轮投放训练集和所述初始种子人群中筛选出所述第k轮扩散训练集包括:使用所述第k轮投放模型对所述初始种子人群中的每一个体进行评分,并过滤掉所述初始种子人群中得分小于第一阈值的个体,得到过滤后的种子人群;使用所述第k轮投放模型对所述第二正样本子集中的每一个体进行评分,并过滤掉所述第二正样本子集中得分小于第二阈值的个体,得到过滤后的第二正样本子集;将过滤后的种子人群和过滤后的第二正样本子集的并集,作为所述第k轮扩散训练集的第一正样本子集。8.如权利要求7所述方法,其特征在于,所述使用所述第k轮投放模型,从所述第k轮投放训练集和所述初始种子人群中筛选出所述第k轮扩散训练集还包括:使用所述第k轮投放模型对所述第二负样本子集中的第i个个体进行评分;基于所述第i个个体的得分,计算所述第i个个体作为负样本的概率p(i);针对所述第i个个体随...

【专利技术属性】
技术研发人员:肖映鹏朱张斌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1