用户挖掘及其模型构建方法、装置及计算机设备制造方法及图纸

技术编号：21184565 阅读：34 留言：0更新日期：2019-05-22 15:10

本发明专利技术公开了一种用户挖掘及其模型构建方法、装置及计算机设备，所述方法包括：根据目标用户的语义特征表达对待挖掘用户群中的用户进行筛选，得到所包含用户符合语义特征表达的初选用户群；获取所述初选用户群中用户在不同场景的行为数据；基于所述初选用户群中用户在不同场景的行为数据，对所述初选用户群中用户进行多场景行为融合的综合评分；根据所述初选用户群中用户的综合分值，从所述初选用户群中用户在不同场景的行为数据中选取正样本和负样本；通过所述正样本和所述负样本引导机器学习模型进行训练，由完成训练的机器学习模型构建得到用于实现目标用户预测的用户挖掘模型。采用本发明专利技术解决了现有技术中用户挖掘的准确率不高的问题。

User Mining and Its Modeling Method, Device and Computer Equipment

The invention discloses a method, device and computer equipment for user mining and its model construction. The method includes: screening the users in the mining user group according to the semantic feature expression of the target user, obtaining the initial user group which contains the user's semantic feature expression, obtaining the behavior data of the users in different scenarios in the initial user group, and based on the initial user group. Selecting the behavior data of users in different scenarios, the comprehensive score of multi-scenario behavior fusion of users in the initial selected user group is given; according to the comprehensive score of users in the initial selected user group, positive samples and negative samples are selected from the behavior data of users in different scenarios in the initial selected user group; and the machine learning model is guided by the positive samples and the negative samples. Line training, the user mining model for target user prediction is constructed by the machine learning model which completes the training. The invention solves the problem of low accuracy of user mining in the prior art.

全部详细技术资料下载

【技术实现步骤摘要】
用户挖掘及其模型构建方法、装置及计算机设备
本专利技术涉及大数据
，尤其涉及一种用户挖掘及其模型构建方法、装置及计算机设备。
技术介绍
随着大数据的发展，针对广告投放领域来说，如何高效地获取大量购买产品的潜在用户，现已成为广告投放商的迫切需求。目前，人工智能技术已广泛应用于广告投放的用户挖掘中，即，基于机器学习模型从广大用户中预测得到目标用户，进而向目标用户推广产品。然而，在目标用户中，仍可能存在因兴趣爱好等自身原因而对推广产品完全不感兴趣的用户，那么，这一类用户势必不可能成为购买产品的潜在用户，反而增加了广告投放商的投放成本。由上可知，现有的用户挖掘仍存在准确性不高的问题。
技术实现思路
为了解决相关技术中存在的用户挖掘的准确率不高的问题，本专利技术各实施例提供一种用户挖掘及其模型构建方法、装置及计算机设备。其中，本专利技术所采用的技术方案为：根据本专利技术公开的一方面，一种应用于用户挖掘的模型构建方法，包括：根据目标用户的语义特征表达对待挖掘用户群中的用户进行筛选，得到所包含用户符合语义特征表达的初选用户群；获取所述初选用户群中用户在不同场景的行为数据；基于所述初选用户群中用户在不同场景的行为数据，对所述初选用户群中用户进行多场景行为融合的综合评分；根据所述初选用户群中用户的综合分值，从所述初选用户群中用户在不同场景的行为数据中选取正样本和负样本；通过所述正样本和所述负样本引导机器学习模型进行训练，由完成训练的机器学习模型构建得到用于实现目标用户预测的用户挖掘模型。根据本专利技术公开的另一方面，一种用户挖掘方法，包括：获取待挖掘用户群中用户在不同场景...

【技术保护点】
1.一种应用于用户挖掘的模型构建方法，其特征在于，包括：根据目标用户的语义特征表达对待挖掘用户群中的用户进行筛选，得到所包含用户符合语义特征表达的初选用户群；获取所述初选用户群中用户在不同场景的行为数据；基于所述初选用户群中用户在不同场景的行为数据，对所述初选用户群中用户进行多场景行为融合的综合评分；根据所述初选用户群中用户的综合分值，从所述初选用户群中用户在不同场景的行为数据中选取正样本和负样本；通过所述正样本和所述负样本引导机器学习模型进行训练，由完成训练的机器学习模型构建得到用于实现目标用户预测的用户挖掘模型。

【技术特征摘要】
1.一种应用于用户挖掘的模型构建方法，其特征在于，包括：根据目标用户的语义特征表达对待挖掘用户群中的用户进行筛选，得到所包含用户符合语义特征表达的初选用户群；获取所述初选用户群中用户在不同场景的行为数据；基于所述初选用户群中用户在不同场景的行为数据，对所述初选用户群中用户进行多场景行为融合的综合评分；根据所述初选用户群中用户的综合分值，从所述初选用户群中用户在不同场景的行为数据中选取正样本和负样本；通过所述正样本和所述负样本引导机器学习模型进行训练，由完成训练的机器学习模型构建得到用于实现目标用户预测的用户挖掘模型。2.如权利要求1所述的方法，其特征在于，所述目标用户的语义特征表达包括正向关键词；所述根据目标用户的语义特征表达对待挖掘用户群中用户进行筛选，得到所包含用户符合语义特征表达的初选用户群，包括：获取所述待挖掘用户群中用户浏览过的媒体数据；在所述媒体数据中，进行所述正向关键词的匹配查找；如果所述媒体数据中包含所述正向关键词，则判定所述待挖掘用户群中的该用户符合语义特征表达，将符合语义特征表达的该用户添加至所述初选用户群。3.如权利要求2所述的方法，其特征在于，所述目标用户的语义特征表达还包括负向关键词；所述根据目标用户的语义特征表达对待挖掘用户群中用户进行筛选，得到所包含用户符合语义特征表达的初选用户群，还包括：基于所述初选用户群中用户浏览过的媒体数据，进行所述负向关键词的匹配查找；如果所述媒体数据中包含所述负向关键词，则判定所述初选用户群中的该用户为噪音用户，从所述初选用户群中剔除所述噪音用户。4.如权利要求1所述的方法，其特征在于，所述基于所述初选用户群中用户在不同场景的行为数据，对所述初选用户群中用户进行多场景行为融合的综合评分，包括：针对所述初选用户群中用户在同一场景的行为数据，从用户行为的至少一个维度确定评分系数；根据所述评分系数，计算得到所述初选用户群中用户对应同一场景的行为分值；将所述初选用户群中用户对应不同场景的行为分值相加，得到所述初选用户群中用户的综合分值。5.如权利要求4所述的方法，其特征在于，所述评分系数包括行为权重值；所述从用户行为的至少一个维度确定评分系数，包括：针对已进行推荐内容投放的历史用户群，对所述历史用户群中用户在不同场景的行为数据进行显著性分析，得到所述历史用户群中用户在不同场景的显著性分值；对所述历史用户群中用户在不同场景的显著性分值进行归一化处理，得到多个行为权重值，每一个行为权重值对应一种场景。6.如权利要求4所述的方法，其特征在于，所述评分系数包括行为频次、行为时间衰减值和行为权重值；所述根据所述评分系数，计算得到所述初选用户群中用户对应同一场景的行为分值，包括：对所述行为频次、行为时间衰减值和行为权重值进行乘法运算，得到所述初选用户群中用户对应同一场景的行为分值。7.如权利要求1所述的方法，其特征在于，所述根据所述初选用户群中用户的综合分值，从所述初选用户群中用户在不同场景的行为数据中选取正样本和负样本，包括：如果所述初选用户群中用户的综合分值超过分数阈值，则将综合分值不小于分数阈值的用户在不同场景的行为数据作为所述正样本；从综合分值小于分数阈值的用户在不同场景的行为数据中随机选取得到所述负样本。8.如权利要求1至7任一项所述的方法，其特征在于，所述通过所述正...

【专利技术属性】
技术研发人员：袁小燕，张纪红，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人