目标用户确定方法、装置、设备及存储介质制造方法及图纸

技术编号:21891758 阅读:72 留言:0更新日期:2019-08-17 14:27
目标用户确定方法、装置、设备及存储介质,其中,所述方法包括:基于所属领域特性,选取目标用户特征,所述目标用户特征分别属于多个特征维度;获取原始用户数据集和基于所选取的目标用户特征预先验证的样本数据集;将所述样本数据集输入预设的筛选模型筛选出用户的用户画像特征;将筛选出所述用户画像特征的样本数据集按照预设方式进行标准化处理;基于所述标准化处理后的样本数据集,选取有监督学习的预测模型的阈值,使得所述预测模型输出的所述预先验证的目标用户和非目标用户的准确率达至预设要求;将所述原始用户数据集进行标准化处理后,输入选取阈值后的所述预测模型进行处理,得到目标用户。上述方案可以提高目标用户覆盖度及精确度。

Target user determination methods, devices, devices and storage media

【技术实现步骤摘要】
目标用户确定方法、装置、设备及存储介质
本专利技术实施涉及数据分析与处理
,尤其涉及目标用户确定方法、装置、设备及存储介质。
技术介绍
数据挖掘技术是以任何系统的数据资源为对象,并从中发现数据之间表现的相关性的信息处理技术,目前已经广泛应用于互联网的流程优化、目标化消息以及广告推送、用户个性化服务与改善等方面,成为网络服务背后强大的后台技术支撑。目前,通过数据挖掘确定目标用户的方法,存在目标用户挖掘不充分的问题,目标用户群体覆盖度和精确度有待提高。
技术实现思路
有鉴于此,本专利技术实施例提供一种目标用户确定方法、装置、设备及存储介质,能够提高目标用户覆盖度及精确度。本专利技术实施例的一个方面,提供了一种目标用户确定方法,所述方法包括:基于所属领域特性,选取目标用户特征,所述目标用户特征分别属于多个特征维度;获取原始用户数据集和基于所选取的目标用户特征预先验证的样本数据集,所述样本数据集包括目标用户数据集和非目标用户数据集;将所述样本数据集输入预设的筛选模型筛选出所述样本数据集中用户的用户画像特征;将筛选出所述用户画像特征的样本数据集按照预设方式进行标准化处理;基于所述标准化处理后本文档来自技高网...

【技术保护点】
1.一种目标用户确定方法,其特征在于,包括:基于所属领域特性,选取目标用户特征,所述目标用户特征分别属于多个特征维度;获取原始用户数据集和基于所选取的目标用户特征预先验证的样本数据集,所述样本数据集包括目标用户数据集和非目标用户数据集;将所述样本数据集输入预设的筛选模型筛选出所述样本数据集中用户的用户画像特征;将筛选出所述用户画像特征的样本数据集按照预设方式进行标准化处理;基于所述标准化处理后的样本数据集,选取有监督学习的预测模型的阈值,使得所述有监督学习的预测模型输出的所述预先验证的目标用户和非目标用户的准确率达至预设要求;将所述原始用户数据集按照所述预设方式进行标准化处理后,输入选取阈值后...

【技术特征摘要】
1.一种目标用户确定方法,其特征在于,包括:基于所属领域特性,选取目标用户特征,所述目标用户特征分别属于多个特征维度;获取原始用户数据集和基于所选取的目标用户特征预先验证的样本数据集,所述样本数据集包括目标用户数据集和非目标用户数据集;将所述样本数据集输入预设的筛选模型筛选出所述样本数据集中用户的用户画像特征;将筛选出所述用户画像特征的样本数据集按照预设方式进行标准化处理;基于所述标准化处理后的样本数据集,选取有监督学习的预测模型的阈值,使得所述有监督学习的预测模型输出的所述预先验证的目标用户和非目标用户的准确率达至预设要求;将所述原始用户数据集按照所述预设方式进行标准化处理后,输入选取阈值后的所述预测模型进行处理,得到所述原始用户数据集中的目标用户。2.根据权利要求1所述的目标用户确定方法,其特征在于,所述预先验证的样本数据集包括第一样本数据集和第二样本数据集,所述第一样本数据集包含所述第二样本数据集,所述第二样本数据集的数据量少于所述第一样本数据集的数据量;所述将所述样本数据集输入预设的筛选模型筛选出所述样本数据集中用户的用户画像特征,包括:将所述第一样本数据集输入预设的筛选模型筛选出所述第一样本数据集中用户的用户画像特征;所述基于所述标准化处理后的样本数据集,选取有监督学习的预测模型的阈值,包括:基于所述标准化处理后的第二样本数据集,选取有监督学习的预测模型的阈值。3.根据权利要求1所述的目标用户确定方法,其特征在于,还包括:基于所述标准化处理后的样本数据集,采用有监督学习并利用交叉验证的方式,调整所述预测模型的参数,使得所述预测模型与样本数据集在具有相同用户画像特征情况下对应的用户为目标用户的概率近似。4.根据权利要求1所述的目标用户确定方法,其特征在于,所述基于所述标准化处理后的样本数据集,选取有监督学习的预测模型的阈值,使得所述有监督学习的预测模型输出的所述预先验证的目标用户和非目标用户的准确率达至预设要求,包括:计算多个阈值计算所述预先验证的目标用户和非目标用户的准确率,以准确率最高的区间作为阈值区间;在所述准确率最高的阈值区间内逐渐缩小阈值切割单位,进行多轮递归运算,直至选取出准确率最高区间的中间值作为阈值。5.根据权利要求...

【专利技术属性】
技术研发人员:李雪赵呈路
申请(专利权)人:北京小度信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1