【技术实现步骤摘要】
一种量化方法、推荐方法以及装置
[0001]本申请涉及计算机领域,尤其涉及一种量化方法、推荐方法以及装置。
技术介绍
[0002]机器学习系统,包括个性化推荐系统,基于输入数据和标签,通过梯度下降等优化方法训练机器学习模型的参数,当模型参数收敛之后,可利用该模型完成未知数据的预测。
[0003]例如,以推荐系统中的点击率预测模型为例,通常该模型可以包括嵌入(embedding)层以及多层感知机(multilayer perceptron,MLP)层,embedding层通常用于将高维稀疏的额数据映射至低维稠密的向量,MLP通常用于拟合特征之间的组合关系、序列信息或者点击率等不等。然而,对于一些大规模数据场景,通常推荐模型的输入数据量也非常大,因此embedding层的规模非常大,导致存储以及训练等过程中所需的存储空间非常大。
技术实现思路
[0004]本申请提供一种量化方法、推荐方法以及装置,用于基于自适应步长对全精度嵌入表征中每种特征进行量化,从而提高量化精度。
[0005]有鉴于此,第一方面,本申请提供一种量化方法,包括:首先,获取全精度嵌入表征,嵌入表征包括多种特征;确定多种特征中每种特征分别对应的自适应步长,该多种特征对应的步长可能相同也可能不相同;随后根据每种特征对应的自适应步长分别对多种特征进行量化,得到低精度嵌入表征,该低精度嵌入表征中的特征的精度低于全精度嵌入表征中特征的精度,因此保存或者传输该低精度嵌入表征所需的存储资源或者传输资源低于保存或者传输全精度嵌入表征所需的 ...
【技术保护点】
【技术特征摘要】
1.一种量化方法,其特征在于,包括:获取全精度嵌入表征,所述嵌入表征包括多种特征;确定所述多种特征中每种特征分别对应的自适应步长;根据所述每种特征对应的自适应步长分别对所述多种特征进行量化,得到低精度嵌入表征,所述低精度嵌入表征中的特征的精度低于所述全精度嵌入表征中特征的精度。2.根据权利要求1所述的方法,其特征在于,所述低精度嵌入表征词表应用于神经网络,所述获取全精度嵌入表征词表,包括:从低精度嵌入表征词表中获取与当前次迭代的输入数据对应的表征,得到当前次迭代的低精度嵌入表征;对所述当前次迭代的低精度嵌入表征进行反量化,得到当前次迭代的所述全精度嵌入表征。3.根据权利要求2所述的方法,其特征在于,所述确定所述多种特征中每种特征分别对应的自适应步长,包括:将所述当前次迭代的全精度嵌入表征作为所述神经网络的输入,得到当前次迭代的预测结果对应的全精度梯度;根据所述全精度梯度获取更新所述全精度嵌入表征,得到更新后的全精度嵌入表征;根据所述全精度梯度获取所述更新后的全精度嵌入表征中每种特征分别对应的自适应步长。4.根据权利要求3所述的方法,其特征在于,所述根据所述每种特征对应的自适应步长分别对所述多种特征进行量化,包括:根据所述每种特征分别对应的自适应步长,对所述当前次迭代的全精度低维表征中的多种特征进行量化,得到所述低精度嵌入表征。5.根据权利要求2
‑
4中任一项所述的方法,其特征在于,所述方法还包括:根据所述低精度嵌入表征更新所述低精度嵌入表征词表,得到更新后的低精度嵌入表征词表。6.根据权利要求1所述的方法,其特征在于,所述确定所述多种特征中每种特征对应的自适应步长,包括:通过启发式算法计算所述每种特征对应的自适应步长。7.根据权利要求6所述的方法,其特征在于,所述通过启发式算法计算所述每种特征对应的自适应步长,还包括:根据所述每种特征中权重绝对值计算所述每种特征对应的自适应步长。8.根据权利要求1
‑
7所述的方法,其特征在于,所述根据所述每种特征对应的自适应步长分别对所述多种特征进行量化,得到低精度嵌入表征词表,还包括:根据所述每种特征对应的自适应步长,得到所述每种特征的离散特征;通过随机截断算法对所述每种特征的离散特征进行截断,得到所述低精度嵌入表征。9.根据权利要求1
‑
8所述的方法,其特征在于,所述低精度嵌入表征词表应用于语言模型或者推荐模型,所述语言模型用于获取语料的语义信息,所述推荐模型用于根据用户的信息生成推荐信息。
10.一种推荐方法,其特征在于,包括:获取输入数据,所述输入数据包括用户针对终端的至少一种行为产生的数据;从低精度嵌入表征词表中获取与所述输入数据对应的低精度嵌入表征,所述低精度嵌入表征中包括多种特征;根据所述多种特征中每种特征对应的自适应步长对所述多种特征分别进行反量化,得到全精度嵌入表征;根据所述全精度嵌入表征作为神经网络的输入,输出推荐信息,所述推荐信息用于针对所述用户的所述至少一种行为进行推荐。11.根据权利要求10所述的方法,其特征在于,所述神经网络包括语言模型或者推荐模型,所述语言模型用于获取语料的语义信息,所述推荐模型用于根据用户的信息生成推荐信息。12.一种量化装置,其特征在于,包括:获取模块,用于获取全精度嵌入表征,所述嵌入表征包括多种特征;确定模块,用于确定所述多种特征中每种特征分别对应的自适应步长;量化模块,用于根据所述每种特征对应的自适应步长分别对所述多种特征进行量化,得到低精度嵌入表征,所述低精度嵌入表征中的特征的精度低于所述全精度嵌入表征中特征的精度。...
【专利技术属性】
技术研发人员:郭慧丰,李世伟,侯璐,章伟,唐睿明,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。