The embodiment of the invention provides information input method and device. The method includes: generating the k-th round diffusion training set according to the feedback data of the initial seed population and the k_1 round population; each individual sample in the k-th round diffusion training set has the eigenvector, and the eigenvector includes multiple attributes and corresponding attribute values of the individual sample; and using the k-th round diffusion training set. The eigenvectors of all individual samples were trained by the k-th iteration training, and the k-th iteration diffusion model was obtained. The k-th iteration diffusion model was used to select the k-th iteration population from the whole population, and the k-th iteration population was used for the k-th iteration. In the embodiment of the invention, the k-th round diffusion training set is adjusted based on the feedback data of the previous round of population, so that even if the initial seed population is of poor quality, the sample can be adjusted by feedback data and multiple iterations, so that the matching degree between the population and the information is higher and higher, and the precision of the population is improved.
【技术实现步骤摘要】
信息投放方法及装置
本专利技术涉及计算机
,具体涉及信息投放方法及装置。
技术介绍
目前很多领域都需要进行信息投放。例如,微信朋友圈的广告推送,或者,论文搜索网站的论文推荐等。现有的信息投放方式可基于种子人群进行人群扩散,得到投放人群,再对投放人群群进行信息投放。所谓的种子人群是指在特定应用场景下,对产品或服务具有相同需求和兴趣的人群。投放人群理论上应与种子人群具有相同需求和兴趣,但数量是种子人群的几倍、几十倍乃至上百上千倍。由种子人群扩散出的投放人群的精准性,决定了信息投放的准确性,因此,如何精准扩散出投放人群,是目前研发的热门。
技术实现思路
有鉴于此,本专利技术实施例提供信息投放及装置,以提高扩散投放人群的准确度,进而提高信息投放的准确性。为实现上述目的,本专利技术实施例提供如下技术方案:一种信息投放方法,包括:根据初始种子人群及第k-1轮投放人群的反馈数据,生成第k轮扩散训练集;所述k为整数;所述第k轮扩散训练集中的每一个体具有特征向量,所述特征向量包括所述个体的多个属性及相应的属性值;使用所述第k轮扩散训练集中所有个体的特征向量进行第k轮迭代训练,得到第k轮扩散模型;使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群;所述第k轮投放人群用于第k轮信息投放。一种信息投放装置,包括:扩散训练集生成单元,用于根据初始种子人群及第k-1轮投放人群的反馈数据,生成第k轮扩散训练集;所述k为整数;所述扩散训练集中的每一个体具有特征向量,所述特征向量包括所述个体的多个属性及相应的属性值;训练单元,用于使用所述第k轮扩散训练集中所有个体的特征向量进行第k轮 ...
【技术保护点】
1.一种信息投放方法,其特征在于,包括:根据初始种子人群及第k‑1轮投放人群的反馈数据,生成第k轮扩散训练集;所述k为整数;所述第k轮扩散训练集中的每一个体具有特征向量,所述特征向量包括所述个体的多个属性及相应的属性值;使用所述第k轮扩散训练集中所有个体的特征向量进行第k轮迭代训练,得到第k轮扩散模型;使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群;所述第k轮投放人群用于第k轮信息投放。
【技术特征摘要】
1.一种信息投放方法,其特征在于,包括:根据初始种子人群及第k-1轮投放人群的反馈数据,生成第k轮扩散训练集;所述k为整数;所述第k轮扩散训练集中的每一个体具有特征向量,所述特征向量包括所述个体的多个属性及相应的属性值;使用所述第k轮扩散训练集中所有个体的特征向量进行第k轮迭代训练,得到第k轮扩散模型;使用所述第k轮扩散模型从整体人群中筛选出第k轮投放人群;所述第k轮投放人群用于第k轮信息投放。2.如权利要求1所述方法,其特征在于,所述第k轮扩散训练集包括第一正样本子集和第一负样本子集;所述第一正样本子集中的个体作为正样本,所述第一负样本子集中的个体作为负样本;所述使用所述第k轮扩散训练集中所有个体的特征向量进行第k轮迭代训练,得到第k轮扩散模型包括:将所述第一正样本子集和第一负样本子集中每一个体的特征向量导入第一预设模型进行训练学习,得到所述第k轮扩散模型。3.如权利要求1或2所述的方法,其特征在于,当k=0时,所述生成第k轮扩散训练集包括:获取所述初始种子人群作为第一正样本子集;从所述整体人群中随机选取与所述初始种子人群等量的人群,作为第一负样本子集;获取所述第k轮扩散训练集中每一个体的特征向量。4.如权利要求1或2所述的方法,其特征在于,当k≠0时,所述生成第k轮扩散训练集包括:根据第k-1轮投放人群的反馈数据,生成第k轮投放训练集;所述第k轮投放训练集中的每一个体具有特征向量;将所述第k轮投放训练集中所有个体的特征向量导入第二预设模型进行训练学习,得到第k轮投放模型;使用所述第k轮投放模型,从所述第k轮投放训练集和所述初始种子人群中筛选出所述第k轮扩散训练集。5.如权利要求1所述的方法,其特征在于,所述第k轮投放训练集包括第二正样本子集和第二负样本子集;所述第二正样本子集中的个体作为正样本,所述第二负样本子集中的个体作为负样本;所述生成第k轮投放训练集包括:获取第k-1轮投放人群的反馈数据;所述反馈数据包括所述第k-1轮投放人群的反馈统计数据,以及所述第k-1轮投放人群中每一个体的行为数据;所述反馈统计数据是根据所述第k-1轮投放人群所有个体的行为数据计算得到的;从所述第k-1轮投放人群中筛选出所述第二正样本子集;所述第二正样本子集中个体的行为数据与所述反馈统计数据之间具有正向关联关系,并且,所述第二正样本子集中的每一个体均具有特征向量;从所述第k-1轮投放人群中筛选出所述第二负样本子集;所述第二负样本子集中的每一个体均具有特征向量。6.如权利要求5所述的方法,其特征在于,所述第二负样本子集包括所述第k-1轮投放人群中剔除了所述第二正样本子集后的其他个体;或者,所述第二负样本子集包含所述第k-1轮投放人群。7.如权利要求6所述方法,其特征在于,所述使用所述第k轮投放模型,从所述第k轮投放训练集和所述初始种子人群中筛选出所述第k轮扩散训练集包括:使用所述第k轮投放模型对所述初始种子人群中的每一个体进行评分,并过滤掉所述初始种子人群中得分小于第一阈值的个体,得到过滤后的种子人群;使用所述第k轮投放模型对所述第二正样本子集中的每一个体进行评分,并过滤掉所述第二正样本子集中得分小于第二阈值的个体,得到过滤后的第二正样本子集;将过滤后的种子人群和过滤后的第二正样本子集的并集,作为所述第k轮扩散训练集的第一正样本子集。8.如权利要求7所述方法,其特征在于,所述使用所述第k轮投放模型,从所述第k轮投放训练集和所述初始种子人群中筛选出所述第k轮扩散训练集还包括:使用所述第k轮投放模型对所述第二负样本子集中的第i个个体进行评分;基于所述第i个个体的得分,计算所述第i个个体作为负样本的概率p(i);针对所述第i个个体随...
【专利技术属性】
技术研发人员:肖映鹏,朱张斌,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。