基于商业兴趣的目标人群确定及信息推送方法和系统技术方案

技术编号:20820091 阅读:49 留言:0更新日期:2019-04-10 05:58
本发明专利技术涉及一种基于商业兴趣的目标人群确定及信息推送方法和系统,属于互联网技术领域。目标人群确定方法包括:对已有的商业兴趣分类标签进一步分类标注,得到创意分类标签,作为所属商业兴趣二级类目的训练数据;并进行机器学习,得到基于所述的商业兴趣分类标签的相关度分值;确定具有信息推送价值的目标人群;推送方法包括:一服务器利用上述的确定方法确定目标人群后,该终端向目标人群推送信息;系统包括:服务器和信息接收终端,其中服务器包括处理器和存储器,存储器上存储有计算机程序,该计算机程序被处理器执行时,实现上述的目标人群确定方法。与现有技术相比,本发明专利技术具有无需自定义特征关键词组、自动化程度高以及易于实现等优点。

【技术实现步骤摘要】
基于商业兴趣的目标人群确定及信息推送方法和系统
本专利技术涉及互联网
,特别涉及信息推送领域,具体是指一种基于商业兴趣的目标人群确定及信息推送方法和系统。
技术介绍
用户在数据源上注册后,用户在数据源上会进行各种行为,为了准确描述用户在数据源中进行的相关行为,需要对用户行为进行分析,广告商可以根据分析出的用户行为向符合广告商要求的用户推送广告,以宣传产品或服务。常用的技术手段可以是将提取出的用户标签与设定的标准兴趣进行相似性匹配计算,以将用户标签归类到最准确的兴趣类别下,从而分析出用户行为,进而根据分析出的用户行为向符合广告商要求的兴趣类型的用户推送广告。但是现有技术中商业兴趣对应的用户标签是人工指定的,自动化程度不高,不能自动捕捉用户的兴趣动态并调整商业兴趣定向人群。专利CN104090888A提出了一种用户行为数据的分析方法和装置方法,通过综合多渠道数据提取用户的关键词作为基础,然后定义定向类目的特征关键词组,匹配定向类目的特征关键词与用户的关键词,匹配分值超过一定阈值的用户即为定向类目的人群。然而这种方法在实际应用时,需要人工定义定向类目的特征关键词组,且实际广告投放环节作为用户的行为定向使用时需要不断调整特征关键词组已达到更好的效果,人工调整环节较多,自动化程度不高。
技术实现思路
本专利技术的目的是针对上述问题提供一种自动化程度高以及易于实现的基于商业兴趣的目标人群确定及信息推送方法和系统。本专利技术的目的可以通过以下技术方案来实现:一种基于商业兴趣的目标人群确定方法,所述的方法包括以下步骤:(1)对已有的商业兴趣分类标签进一步分类标注,得到创意分类标签;(2)根据所述的创意分类标签,获取训练数据并进行机器学习,得到基于所述的商业兴趣分类标签的相关度分值;(3)根据所述的相关度分值,确定具有信息推送价值的目标人群。优选地,所述步骤(1)具体为:根据已有的商业兴趣分类标签的结构类型,按照相应的创意分类内容进行结构延伸和类目划分,得到创意分类标签。优选地,所述商业兴趣分类标签为二级结构,所述创意分类标签为三级结构,所述创意分类标签的上二级结构与商业兴趣分类标签一致。优选地,所述步骤(2)具体包括以下步骤:(21)根据所述的创意分类标签,获取历史用户的操作日志;(22)根据所述的操作日志,得到训练数据;(23)根据所述的训练数据进行机器学习,得到基于所述的创意分类标签对应的商业兴趣分类标签的相关度分值。优选地,所述步骤(22)具体包括以下步骤:(221)根据所述的操作日志,通过样本划分得到用于机器学习的样本数据;(222)根据所述的操作日志,提取分类特征,构造特征字典;(223)将所述的样本数据与所述的分类特征进行关联,得到所述的训练数据。优选地,所述步骤(221)具体为:遍历所述的操作日志,将其中被点击的广告日志确定为正样本,曝光未点击的广告日志确定为负样本,得到用于机器学习的样本数据。优选地,所述步骤(221)还包括:将所述的操作日志中的异常数据进行清洗过滤。优选地,所述步骤(222)具体为:根据所述的操作日志中的具体行为提取用户对应的分类特征,并对所述的分类特征进行编号,得到所述的特征字典。优选地,所述具体行为包括:搜索、播放、分享、收藏和投币。优选地,所述步骤(23)具体包括以下步骤:(231)判断所述的操作日志数量是否达到训练阈值,若是则进入步骤(232),若否则返回步骤(21);(232)根据机器学习的需求,划分训练数据,得到训练集、测试集和验证集,并选择训练算法进行机器学习;(233)将机器学习得到的分数结果通过归一化划分到0至1之间,得到基于所述的创意分类标签对应的商业兴趣分类标签的相关度分值。优选地,所述划分训练数据具体为:根据5折交叉验证的方式对训练数据进行划分。优选地,所述训练算法具体为XGBoost算法。优选地,所述XGBoost算法中梯度提升的具体公式为:其中,h为预测值,为样本类别标签,为样本,K为构成梯度提升树模型的树的个数,fi为对应的第i树的结构q以及对应的叶子节点的权重w,F为表征决策树的函数空间的一个泛函,w为对应的叶子节点的权重,为树结构,T为一个决策树的叶子结点的数目,R为w的样本空间。优选地,所述步骤(3)具体包括以下步骤:(31)根据所述的相关度分值,将所述的商业兴趣分类标签进行倒序排序;(32)根据排序结果,判断对应的商业兴趣分类标签是否达到信息推送条件,若是则表明该商业兴趣分类标签对应的对象为具有信息推送价值的目标人群。优选地,所述信息推送条件具体为:通过验证集进行验证后的点击通过率达到提升阈值。一种基于商业兴趣向目标人群推送信息的方法,所述的方法包括以下步骤:(a)一服务器利用权利要求1所述的基于商业兴趣的目标人群确定方法确定具有信息推送价值的目标人群;(b)该服务器向所述的目标人群推送信息。优选地,所述步骤(b)具体包括以下步骤:(b1)该终端判断所述的目标人群是否达到自动推送信息的条件,若是自动向所述的目标人群推送信息,若否则进入步骤(b2);(b2)在接收到用户的推送指令时,向所述的目标人群推送信息。优选地,所述自动推送信息的条件具体为:所述的目标人群数量达到设定阈值。一种服务器,包括处理器和存储器,所述的存储器上存储有计算机程序,该计算机程序被所述处理器执行时,实现上述中任一项所述基于商业兴趣的目标人群确定方法。一种基于商业兴趣向目标人群推送信息的系统,所述系统包括:如上所述的服务器,用于确定基于商业兴趣的目标人群,并向所述的目标人群推送信息;信息接收终端,用于接收所述的服务器推送的信息。与现有技术相比,本专利技术具有以下有益效果:(1)本专利技术提出的基于商业兴趣的目标人群确定方法,通过对已有的商业兴趣分类标签进行进一步分类标注,从而得到创意分类标签,再基于该创意分类标签来获取训练数据并进行机器学习,最后根据机器学习的结果确定商业兴趣人群目标,与现有技术相比,本申请中的创意分类标签是在已有的商业兴趣分类标签上进行的进一步详细划分,之后基于此标签来提取分类特征,比起对比文件中通过综合多渠道数据提取用户的关键词作为基础再定义特征关键词组来说,本申请中的方法无需过多的人为干预,自动化程度较高。(2)本专利技术提出的基于商业兴趣的目标人群确定方法,根据划分的创意分类标签来获取对应的操作日志,再利用操作日志分别进行样本划分和分类特征提取,并将样本和分类特征对应从而得到训练数据,从而可以通过机器学习得到用户基于商业兴趣分类标签的相关度分值,对于相关度分值高且达到信息推送条件的对象作为商业兴趣人群目标(即通过验证集验证后的点击通过率达到提升阈值的商业兴趣分类标签下的人群),这样的整个寻找过程人为干预度极低,利用机器学习可以基本上自动实现商业兴趣人群目标的寻找,因此适合范围广,易于实现。(3)本专利技术提出的基于商业兴趣向目标人群推送信息的方法,在通过上述的寻找方法确定商业兴趣人群目标后,在对应的目标数达到阈值时自动对其推送信息,在目标数未达到阈值时,根据用户的推送指令决定是否推送信息,这种信息推送方式既满足了高自动化的需求,同时也可以灵活配置,根据用户实际需求进行信息推送,适用范围广。附图说明图1为本专利技术基于商业兴趣的目标人群确定方法的步骤流程图;图2为本专利技术基本文档来自技高网...

【技术保护点】
1.一种基于商业兴趣的目标人群确定方法,其特征在于,所述的方法包括以下步骤:(1)对已有的商业兴趣分类标签进一步分类标注,得到创意分类标签;(2)根据所述的创意分类标签,获取训练数据并进行机器学习,得到基于所述的商业兴趣分类标签的相关度分值;(3)根据所述的相关度分值,确定具有信息推送价值的目标人群。

【技术特征摘要】
1.一种基于商业兴趣的目标人群确定方法,其特征在于,所述的方法包括以下步骤:(1)对已有的商业兴趣分类标签进一步分类标注,得到创意分类标签;(2)根据所述的创意分类标签,获取训练数据并进行机器学习,得到基于所述的商业兴趣分类标签的相关度分值;(3)根据所述的相关度分值,确定具有信息推送价值的目标人群。2.根据权利要求1所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(1)具体为:根据已有的商业兴趣分类标签的结构类型,按照相应的创意分类内容进行结构延伸和类目划分,得到创意分类标签。3.根据权利要求2所述基于商业兴趣的目标人群确定方法,其特征在于,所述商业兴趣分类标签为二级结构,所述创意分类标签为三级结构,所述创意分类标签的上二级结构与商业兴趣分类标签一致。4.根据权利要求1所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(2)具体包括以下步骤:(21)根据所述的创意分类标签,获取历史用户的操作日志;(22)根据所述的操作日志,得到训练数据;(23)根据所述的训练数据进行机器学习,得到基于所述的创意分类标签对应的商业兴趣分类标签的相关度分值。5.根据权利要求4所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(22)具体包括以下步骤:(221)根据所述的操作日志,通过样本划分得到用于机器学习的样本数据;(222)根据所述的操作日志,提取分类特征,构造特征字典;(223)将所述的样本数据与所述的分类特征进行关联,得到所述的训练数据。6.根据权利要求5所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(221)具体为:遍历所述的操作日志,将其中被点击的广告日志确定为正样本,曝光未点击的广告日志确定为负样本,得到用于机器学习的样本数据。7.根据权利要求6所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(221)还包括:将所述的操作日志中的异常数据进行清洗过滤。8.根据权利要求5所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(222)具体为:根据所述的操作日志中的具体行为提取用户对应的分类特征,并对所述的分类特征进行编号,得到所述的特征字典。9.根据权利要求8所述基于商业兴趣的目标人群确定方法,其特征在于,所述具体行为包括:搜索、播放、分享、收藏和投币。10.根据权利要求4所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(23)具体包括以下步骤:(231)判断所述的操作日志数量是否达到训练阈值,若是则进入步骤(232),若否则返回步骤(21);(232)根据机器学习的需求,划分训练数据,得到训练集、测试集和验证集,并选择训练算法进行机器...

【专利技术属性】
技术研发人员:谢常亮吴安新吴超唐亚光黄声声
申请(专利权)人:上海哔哩哔哩科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1