【技术实现步骤摘要】
一种基于哈希学习的广告定向投放方法
本专利技术提供一种基于哈希学习的广告定向投放方法,涉及哈希学习领域的参数量化算法,旨在提升线上存储和计算的效率,特别适用于重视线上性能的大规模广告定向投放任务。
技术介绍
近年来,随着互联网广告行业的飞速发展,广告定向投放技术受到人们瞩目的程度与日俱增。如何根据用户的信息和行为,挖掘并分析用户的喜好,从而向用户精准地定向投放他们感兴趣的广告,成为包括Google、Facebook、Yahoo在内的许多互联网公司的长期课题。在本专利技术涉及的具体广告定向任务中,广告主会为他们待投放的广告提供一份种子用户的列表,广告定向系统需要根据指定的种子用户人群去计算出与他们相似的人群进行广告投放,从而有效地帮助广告主拓展业务和发掘新用户。在这个场景中,“用户是否为广告的种子用户”的二值关系矩阵即作为广告和用户之间的关系数据,同时还可引入用户的其他特征信息,共同作为训练数据去指导模型训练,得到用户和广告的向量表示。通过在线上衡量用户向量与待投放广告向量之间的相关程度,系统得以向用户投放他们更可能感兴趣的广告内容。然而,随着互联网广告业务的不断扩 ...
【技术保护点】
1.一种基于哈希学习的广告定向投放方法,其特征在于:包括使用神经网络离线训练模型的步骤,对模型参数量化为二值编码的步骤,对用户进行线上广告定向投放的步骤;首先构建用户与广告的二值关系矩阵用于训练;然后先通过神经网络为每个用户和广告学习一个低维实值表示向量,再将所有参数量化为二值表示,进一步压缩模型以便于线上的存储和计算;最后在线上使用得到的二值编码为用户进行广告定向投放。
【技术特征摘要】
1.一种基于哈希学习的广告定向投放方法,其特征在于:包括使用神经网络离线训练模型的步骤,对模型参数量化为二值编码的步骤,对用户进行线上广告定向投放的步骤;首先构建用户与广告的二值关系矩阵用于训练;然后先通过神经网络为每个用户和广告学习一个低维实值表示向量,再将所有参数量化为二值表示,进一步压缩模型以便于线上的存储和计算;最后在线上使用得到的二值编码为用户进行广告定向投放。2.如权利要求1所述的基于哈希学习的广告定向投放方法,其特征在于,所述使用神经网络离线训练模型的步骤具体为:步骤100,输入广告主为待投放广告提供的种子用户数据至数据处理平台;步骤101,若存在用户的特征数据,则将其输入作为训练时的辅助特征信息;步骤102,定义用户与广告之间的关系标签,若某用户属于该广告的种子用户集合,则标记为“1”,定义为正例样本;否则该用户与该广告的关系未知,标记为“0”,算法将从标记为“0”的关系中随机采样一部分定义为负例样本,未被采样的将不参与训练;标记完成后得到用户与广告之间的二值关系矩阵A(A∈{0,1}m×n,其中m为广告数,n为用户数),以及告知系统A中哪些元素需作为训练样本参与训练的训练数据索引集Ω;步骤103,初始化用户和广告表示向量的维度k等相关模型超参;步骤104,在数据处理平台上,使用神经网络离线训练模型,得到两个参数矩阵W,U,其中W的每一行为一个广告的k维实值表示向量,U的每一行为一个用户的k维实值表示向量;步骤105,输出并保存模型W,U至数据处理平台的存储系统。3.如权利要求2所述的基于哈希学习的广告定向投放方法,其特征在于,所述对模型参数量化为二值编码的步骤具体为:步骤200,输入步骤105所得的模型W,U的所有参数至参数量化算法中;步骤201,初始化算法的量化位数超参q,表示W,U中的每个实值参数将被量化成q位二值编码;步骤202,将W中的所有参数取绝对值后放入一个正实数集W+中,之后运用聚类算法对W+中每个元素按大小聚成2q-1类,并且根据这2q-1个聚类中心计算出关于W的2q-1-1个阈值;步骤203,对于W中的每一行用于表示某广告的k维实值向量,利用步骤202计算出的阈值信息将其每个维度上的实数分别量化至相应的q位二值编码,之后将这k组q位二值编码予以拼接,得到表示该广告的k*q位二值编码;所有广告的二值编码组成二值矩阵Wb;步骤204,将U中的所有参数取绝对值后放入一个正实数集U+中,之后运用聚类算法对U+中每个元素按大小聚成2q-1类,并且根据这2q-1个聚类中心计算出关于U的2q-1-1个阈值;步骤205,对于U中的每一行用于表示某用户的k维实值向量,利用步骤204计算出的阈值信息将其每个维度上的实数分别量化至相应的q位二值编码,之后将这k组q位二值编码予以拼接,得到表示该用户的k*q位二值编码;所有用户的二值编码组成二值矩阵Ub;步骤206,输出并保存模型Wb,Ub至广告定向的线上存储系统。4.如权利要求...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。