嵌入维度的分配方法、装置、设备及存储介质制造方法及图纸

技术编号:40454551 阅读:17 留言:0更新日期:2024-02-22 23:12
一种嵌入维度的分配方法,装置、设备及存储介质,属于人工智能技术领域。该方法包括:基于M个特征域分别对应的多个候选嵌入维度,对M个特征域分别对应的嵌入维度进行T次维度分配,得到T个维度分配结果;基于T个维度分配结果,对神经网络模型进行训练得到超网;对超网进行子网搜索,确定M个特征域分别对应的最终嵌入维度。上述方法,通过将模型参数训练与嵌入维度搜索进行解耦。一方面,这种将模型参数训练与嵌入维度搜索解耦的方法,提高了嵌入维度分配的稳定性;另一方面,本申请通过强化学习方法,可以在搜索空间中为每个特征域搜索出近似全局最优的嵌入维度,提高了嵌入维度分配的准确性。

【技术实现步骤摘要】

本申请涉及人工智能,特别涉及一种嵌入维度的分配方法、装置、设备及存储介质


技术介绍

0、技术背景

1、合理地给不同特征域分配嵌入(embedding)维度,有利于提高计算效率、节省内存开销,并在一定程度上提升模型预测效果。

2、在相关技术中,在研究嵌入维度的分配方法时,一种常见的方法是基于先验知识建模,是指使用特征域的统计学信息来辅助模型进行嵌入维度的分配。示例性地,根据特征域包含的特征值数量来为特征域分配不同的嵌入维度,即为包含更多特征值的特征域分配更大的嵌入维度。另一种常见的方法是强化学习搜索方法,该方法的实现步骤是:首先,使用强化学习方法建立一个策略网络作为控制器,该策略网络的输入包括当前特征域对应的嵌入维度和特征域出现的频率。接着定义动作信息,策略网络为每个特征域对应的嵌入维度定义了两种动作信息:不变和放大。然后建立一个基于全连接的深度网络模型,这个深度网络模型帮助策略网络做出决策,指导动作信息的选择。策略网络会根据环境的反馈不断调整参数,当策略网络经过多次迭代训练后收敛时,确定出每个特征域分别对应的嵌入维度。

...

【技术保护点】

1.一种嵌入维度的分配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述T个维度分配结果,对神经网络模型进行训练得到超网,包括:

3.根据权利要求2所述的方法,其特征在于,所述通过所述神经网络模型将所述样本数据的特征信息,转换为与所述第i个维度分配结果对应的嵌入向量,包括:

4.根据权利要求2所述的方法,其特征在于,所述通过所述神经网络模型将所述样本数据的特征信息,转换为与所述第i个维度分配结果对应的嵌入向量,包括:

5.根据权利要求2所述的方法,其特征在于,所述神经网络模型包括嵌入子模型和主干子模型,...

【技术特征摘要】

1.一种嵌入维度的分配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述t个维度分配结果,对神经网络模型进行训练得到超网,包括:

3.根据权利要求2所述的方法,其特征在于,所述通过所述神经网络模型将所述样本数据的特征信息,转换为与所述第i个维度分配结果对应的嵌入向量,包括:

4.根据权利要求2所述的方法,其特征在于,所述通过所述神经网络模型将所述样本数据的特征信息,转换为与所述第i个维度分配结果对应的嵌入向量,包括:

5.根据权利要求2所述的方法,其特征在于,所述神经网络模型包括嵌入子模型和主干子模型,所述嵌入子模型用于将所述样本数据的特征信息,转换为与所述第i个维度分配结果对应的嵌入向量,所述主干子模型用于根据与所述第i个维度分配结果对应的嵌入向量,得到所述样本数据对应的预测结果;

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1所述的方法,其特征在于,所述对所述超网进行子网搜索,确定所述m个特征域分别对应的最终嵌入维度,包括:

9.根据权利要求8所述的方法,其特征在于,所述在基于所述m个特征域在第一时间单元分别对应的动作信息,对所述m个特征域分别对应的嵌入维度进行转移后,对所述超网进行子网搜索,确定所述m个特征域在第二时间单元分别对应的状态信息和所述m个特征域在第二时间单元对应的奖励信息,包括:

10.根据权利要求8所述的方法,其特征在于,所述目标函...

【专利技术属性】
技术研发人员:杨月奎伍海洋魏赫
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1