用户挖掘及其模型构建方法、装置及计算机设备制造方法及图纸

技术编号:21184565 阅读:34 留言:0更新日期:2019-05-22 15:10
本发明专利技术公开了一种用户挖掘及其模型构建方法、装置及计算机设备,所述方法包括:根据目标用户的语义特征表达对待挖掘用户群中的用户进行筛选,得到所包含用户符合语义特征表达的初选用户群;获取所述初选用户群中用户在不同场景的行为数据;基于所述初选用户群中用户在不同场景的行为数据,对所述初选用户群中用户进行多场景行为融合的综合评分;根据所述初选用户群中用户的综合分值,从所述初选用户群中用户在不同场景的行为数据中选取正样本和负样本;通过所述正样本和所述负样本引导机器学习模型进行训练,由完成训练的机器学习模型构建得到用于实现目标用户预测的用户挖掘模型。采用本发明专利技术解决了现有技术中用户挖掘的准确率不高的问题。

User Mining and Its Modeling Method, Device and Computer Equipment

The invention discloses a method, device and computer equipment for user mining and its model construction. The method includes: screening the users in the mining user group according to the semantic feature expression of the target user, obtaining the initial user group which contains the user's semantic feature expression, obtaining the behavior data of the users in different scenarios in the initial user group, and based on the initial user group. Selecting the behavior data of users in different scenarios, the comprehensive score of multi-scenario behavior fusion of users in the initial selected user group is given; according to the comprehensive score of users in the initial selected user group, positive samples and negative samples are selected from the behavior data of users in different scenarios in the initial selected user group; and the machine learning model is guided by the positive samples and the negative samples. Line training, the user mining model for target user prediction is constructed by the machine learning model which completes the training. The invention solves the problem of low accuracy of user mining in the prior art.

【技术实现步骤摘要】
用户挖掘及其模型构建方法、装置及计算机设备
本专利技术涉及大数据
,尤其涉及一种用户挖掘及其模型构建方法、装置及计算机设备。
技术介绍
随着大数据的发展,针对广告投放领域来说,如何高效地获取大量购买产品的潜在用户,现已成为广告投放商的迫切需求。目前,人工智能技术已广泛应用于广告投放的用户挖掘中,即,基于机器学习模型从广大用户中预测得到目标用户,进而向目标用户推广产品。然而,在目标用户中,仍可能存在因兴趣爱好等自身原因而对推广产品完全不感兴趣的用户,那么,这一类用户势必不可能成为购买产品的潜在用户,反而增加了广告投放商的投放成本。由上可知,现有的用户挖掘仍存在准确性不高的问题。
技术实现思路
为了解决相关技术中存在的用户挖掘的准确率不高的问题,本专利技术各实施例提供一种用户挖掘及其模型构建方法、装置及计算机设备。其中,本专利技术所采用的技术方案为:根据本专利技术公开的一方面,一种应用于用户挖掘的模型构建方法,包括:根据目标用户的语义特征表达对待挖掘用户群中的用户进行筛选,得到所包含用户符合语义特征表达的初选用户群;获取所述初选用户群中用户在不同场景的行为数据;基于所述初选用户群中用户在不同场景的行为数据,对所述初选用户群中用户进行多场景行为融合的综合评分;根据所述初选用户群中用户的综合分值,从所述初选用户群中用户在不同场景的行为数据中选取正样本和负样本;通过所述正样本和所述负样本引导机器学习模型进行训练,由完成训练的机器学习模型构建得到用于实现目标用户预测的用户挖掘模型。根据本专利技术公开的另一方面,一种用户挖掘方法,包括:获取待挖掘用户群中用户在不同场景的行为数据;调用用户挖掘模型,对所述待挖掘用户群中用户在不同场景的行为数据进行目标用户预测,得到目标用户群;其中,所述用户挖掘模型是通过正样本和负样本引导机器学习模型训练得到的,所述正样本和所述负样本与所述待挖掘用户群中用户在多场景行为融合中的综合分值有关。根据本专利技术公开的另一方面,一种应用于用户挖掘的模型构建装置,包括:第一用户筛选模块,用于根据目标用户的语义特征表达对待挖掘用户群中的用户进行筛选,得到所包含用户符合语义特征表达的初选用户群;行为数据获取模块,用于获取所述初选用户群中用户在不同场景的行为数据;用户评分模块,用于基于所述初选用户群中用户在不同场景的行为数据,对所述初选用户群中用户进行多场景综合评分;第二用户筛选模块,用于根据所述初选用户群中用户的综合分值,从所述初选用户群中用户在不同场景的行为数据中选取正样本和负样本;模型构建模块,用于通过所述正样本和所述负样本引导机器学习模型进行训练,由完成训练的机器学习模型构建得到用于实现目标用户预测的用户挖掘模型。根据本专利技术公开的另一方面,一种用户挖掘装置,包括:行为数据获取模块,用于获取待挖掘用户群中用户在不同场景的行为数据;目标用户预测模块,用于调用用户挖掘模型,对所述待挖掘用户群中用户在不同场景的行为数据进行目标用户预测,得到目标用户群;其中,所述用户挖掘模型是通过正样本和负样本引导机器学习模型训练得到的,所述正样本和所述负样本与所述待挖掘用户群中用户在多场景行为融合中的综合分值有关。根据本专利技术公开的另一方面,一种计算机设备,包括处理器及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的方法。根据本专利技术公开的另一方面,一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。在上述技术方案中,在基于机器学习模型构建用户挖掘模型时,针对待挖掘用户群中的用户进行多次筛选,以得到纯净的正样本和负样本,由此解决现有技术中用户挖掘的准确性不高的问题。具体而言,基于待挖掘用户群,根据目标用户的语义特征表达进行第一次用户筛选,并根据用户在多场景行为融合中的综合分值进行第二次用户筛选,得到正样本和负样本,进而通过正样本和负样本引导机器学习模型进行训练,由此构建得到用于实现目标用户预测的用户挖掘模型,由此,进行训练的正样本不仅符合目标用户的语义特征表达,而且在多场景行为融合中具有较高的综合分值,充分地保证了用于训练的样本具有真正意义的正向,进而充分地保证了用户挖掘的准确性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并于说明书一起用于解释本专利技术的原理。图1是根据本专利技术所涉及的实施环境的示意图。图2是根据一示例性实施例示出的一种服务器的硬件结构框图。图3是根据一示例性实施例示出的一种应用于用户挖掘的模型构建方法的流程图。图4是图3对应实施例中步骤310在一个实施例的流程图。图5是图3对应实施例中步骤310在另一个实施例的流程图。图6是图3对应实施例中步骤350在一个实施例的流程图。图7是图6对应实施例中步骤351在一个实施例的流程图。图8是图3对应实施例中步骤390在一个实施例的流程图。图9是图8对应实施例中步骤393在一个实施例的流程图。图10是图8对应实施例中步骤393在另一个实施例的流程图。图11是根据一示例性实施例示出的一种用户挖掘方法的流程图。图12是图11对应实施例中步骤430在一个实施例的流程图。图13是一应用场景中一种用户挖掘方法的具体实现示意图。图14是根据一示例性实施例示出的一种应用于用户挖掘的模型构建装置的框图。图15是根据一示例性实施例示出的一种用户挖掘装置的框图。图16是根据一示例性实施例示出的一种计算机设备的框图。通过上述附图,已示出本专利技术明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本专利技术构思的范围,而是通过参考特定实施例为本领域技术人员说明本专利技术的概念。具体实施方式这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。图1为一种用户挖掘方法所涉及的实施环境的示意图。该实施环境包括用户端110和服务器端130。具体地,用户端110配置有显示屏幕,以借助显示屏幕向用户展示推荐内容,例如,推荐内容包括广告等。用户端110可以是台式电脑、笔记本电脑、平板电脑、智能手机、掌上电脑等,在此不进行限定。服务器端130可以是一台服务器,也可以是由多台服务器构成的服务器集群,还可以是由多台服务器构成的云计算中心。其中,服务器是用于向用户提供后台服务的电子设备,例如,后台服务包括用户挖掘及其模型构建服务、广告投放服务等。当然,根据应用场景的实际需求,不同的后台服务可以部署于不同服务器上,也可以部署于同一服务器上,在此并不进行具体限定。用户端110与服务器端130通过无线或者有线预先建立网络连接,以通过此网络连接实现用户端110与服务器端130之间的数据传输。例如,所传输的数据包括推荐内容、行为数据等。对于服务器端130而言,向广告投放商提供用户挖掘服务,即通过用户挖掘模型由待挖掘用户群得到目标用户群,进而向目标用户群中用户投放推荐内容。通过用户端1本文档来自技高网...

【技术保护点】
1.一种应用于用户挖掘的模型构建方法,其特征在于,包括:根据目标用户的语义特征表达对待挖掘用户群中的用户进行筛选,得到所包含用户符合语义特征表达的初选用户群;获取所述初选用户群中用户在不同场景的行为数据;基于所述初选用户群中用户在不同场景的行为数据,对所述初选用户群中用户进行多场景行为融合的综合评分;根据所述初选用户群中用户的综合分值,从所述初选用户群中用户在不同场景的行为数据中选取正样本和负样本;通过所述正样本和所述负样本引导机器学习模型进行训练,由完成训练的机器学习模型构建得到用于实现目标用户预测的用户挖掘模型。

【技术特征摘要】
1.一种应用于用户挖掘的模型构建方法,其特征在于,包括:根据目标用户的语义特征表达对待挖掘用户群中的用户进行筛选,得到所包含用户符合语义特征表达的初选用户群;获取所述初选用户群中用户在不同场景的行为数据;基于所述初选用户群中用户在不同场景的行为数据,对所述初选用户群中用户进行多场景行为融合的综合评分;根据所述初选用户群中用户的综合分值,从所述初选用户群中用户在不同场景的行为数据中选取正样本和负样本;通过所述正样本和所述负样本引导机器学习模型进行训练,由完成训练的机器学习模型构建得到用于实现目标用户预测的用户挖掘模型。2.如权利要求1所述的方法,其特征在于,所述目标用户的语义特征表达包括正向关键词;所述根据目标用户的语义特征表达对待挖掘用户群中用户进行筛选,得到所包含用户符合语义特征表达的初选用户群,包括:获取所述待挖掘用户群中用户浏览过的媒体数据;在所述媒体数据中,进行所述正向关键词的匹配查找;如果所述媒体数据中包含所述正向关键词,则判定所述待挖掘用户群中的该用户符合语义特征表达,将符合语义特征表达的该用户添加至所述初选用户群。3.如权利要求2所述的方法,其特征在于,所述目标用户的语义特征表达还包括负向关键词;所述根据目标用户的语义特征表达对待挖掘用户群中用户进行筛选,得到所包含用户符合语义特征表达的初选用户群,还包括:基于所述初选用户群中用户浏览过的媒体数据,进行所述负向关键词的匹配查找;如果所述媒体数据中包含所述负向关键词,则判定所述初选用户群中的该用户为噪音用户,从所述初选用户群中剔除所述噪音用户。4.如权利要求1所述的方法,其特征在于,所述基于所述初选用户群中用户在不同场景的行为数据,对所述初选用户群中用户进行多场景行为融合的综合评分,包括:针对所述初选用户群中用户在同一场景的行为数据,从用户行为的至少一个维度确定评分系数;根据所述评分系数,计算得到所述初选用户群中用户对应同一场景的行为分值;将所述初选用户群中用户对应不同场景的行为分值相加,得到所述初选用户群中用户的综合分值。5.如权利要求4所述的方法,其特征在于,所述评分系数包括行为权重值;所述从用户行为的至少一个维度确定评分系数,包括:针对已进行推荐内容投放的历史用户群,对所述历史用户群中用户在不同场景的行为数据进行显著性分析,得到所述历史用户群中用户在不同场景的显著性分值;对所述历史用户群中用户在不同场景的显著性分值进行归一化处理,得到多个行为权重值,每一个行为权重值对应一种场景。6.如权利要求4所述的方法,其特征在于,所述评分系数包括行为频次、行为时间衰减值和行为权重值;所述根据所述评分系数,计算得到所述初选用户群中用户对应同一场景的行为分值,包括:对所述行为频次、行为时间衰减值和行为权重值进行乘法运算,得到所述初选用户群中用户对应同一场景的行为分值。7.如权利要求1所述的方法,其特征在于,所述根据所述初选用户群中用户的综合分值,从所述初选用户群中用户在不同场景的行为数据中选取正样本和负样本,包括:如果所述初选用户群中用户的综合分值超过分数阈值,则将综合分值不小于分数阈值的用户在不同场景的行为数据作为所述正样本;从综合分值小于分数阈值的用户在不同场景的行为数据中随机选取得到所述负样本。8.如权利要求1至7任一项所述的方法,其特征在于,所述通过所述正...

【专利技术属性】
技术研发人员:袁小燕张纪红
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1