改进非神经网络模型的部署的方法和系统技术方案

技术编号:38592064 阅读:11 留言:0更新日期:2023-08-26 23:30
本公开涉及改进非神经网络模型的部署的方法和系统。该方法可包括:使用第一数据集对神经网络模型进行训练,所述第一数据集包括特征和所述非神经网络模型针对所述特征的预测结果;以及将经训练的神经网络模型部署到使用所述非神经网络模型的预测任务中来代替所述非神经网络模型。本公开还涉及一种用于改进非神经网络模型的部署的系统和装置以及一种非瞬态处理器可读存储介质。瞬态处理器可读存储介质。瞬态处理器可读存储介质。

【技术实现步骤摘要】
改进非神经网络模型的部署的方法和系统


[0001]本申请涉及机器学习的领域,尤其涉及非神经网络模型的部署的方法和系统。

技术介绍

[0002]当今各种生产场景(例如推荐系统、风控系统等等)经常用各式各样的机器学习模型(尤其是非神经网络模型)来进行预测。这些模型的原理和性质不同,无法相互替代。
[0003]正是由于这些模型的原理和性质各异,会导致在预测阶段的具体实现方式的差异。这种差异为预测阶段(包括统一管理、硬件适配,性能优化,等等)带来额外的困难。
[0004]本公开针对但不限于上述诸多因素进行了改进。

技术实现思路

[0005]本说明书的一个或多个实施例通过以下技术方案来实现其上述目的。
[0006]根据本公开的第一方面,提供了一种改进非神经网络模型的部署的方法,包括:使用第一数据集对神经网络模型进行训练,所述第一数据集包括特征和所述非神经网络模型针对所述特征的预测结果;以及将经训练的神经网络模型部署到使用所述非神经网络模型的预测任务中来代替所述非神经网络模型。
[0007]根据一实施例,所述神经网络模型的输出层的格式与所述非神经网络模型的输出层的格式相同。
[0008]根据另一实施例,所述非神经网络模型是用于图像二分类的基于SVM的模型,并且所述神经网络模型的输出层的格式是二分类。
[0009]根据又一实施例,所述非神经网络模型是用于文本词的主题标注的基于LDA的模型,并且所述神经网络模型的输出层的格式是每个词的K分类,其中K是文本词的主题的数目。
[0010]根据又一实施例,所述训练使得神经网络模型的输出在特定度量上与所述非神经网络模型的输出最接近,其中所述特定度量取决于所述预测任务。
[0011]根据又一实施例,所述特定度量包括以下中的一者:针对分类应用任务的交叉熵度量;以及针对回归应用任务的均方误差度量。
[0012]根据又一实施例,所述神经网络模型的训练和/或部署是使用TensorFlow和/或PyTorch神经网络训练平台来完成的。
[0013]根据又一实施例,所述非神经网络模型是使用第二数据集来训练的,其中所述第二数据集包括所述特征及与所述特征相关联的标签。
[0014]根据本公开的第二方面,提供了一种改进非神经网络模型的部署的系统,包括:训练模块,所述训练模块被布置成使用第一数据集对神经网络模型进行训练,所述第一数据集包括特征和所述非神经网络模型针对所述特征的预测结果;以及部署模块,所述部署模块被配置成将经训练的神经网络模型部署到使用所述非神经网络模型的预测任务中来代替所述非神经网络模型。
[0015]根据一实施例,所述神经网络模型的输出层的格式与所述非神经网络模型的输出层的格式相同。
[0016]根据另一实施例,所述非神经网络模型是用于图像二分类的基于SVM的模型,并且所述神经网络模型的输出层的格式是二分类。
[0017]根据又一实施例,所述非神经网络模型是用于文本词的主题标注的基于LDA的模型,并且所述神经网络模型的输出层的格式是每个词的K分类,其中K是文本词的主题的数目。
[0018]根据又一实施例,所述训练使得神经网络模型的输出在特定度量上与所述非神经网络模型的输出最接近,其中所述特定度量取决于所述预测任务。
[0019]根据又一实施例,所述特定度量包括以下中的一者:针对分类应用场景的交叉熵度量;以及针对回归应用场景的均方误差度量。
[0020]根据又一实施例,所述神经网络模型的训练和部署是使用TensorFlow和/或PyTorch神经网络训练平台来完成的。
[0021]根据又一实施例,所述非神经网络模型是使用第二数据集来训练的,其中所述第二数据集包括所述特征及与所述特征相关联的标签。
[0022]根据本公开的第三方面,提供了一种改进非神经网络模型的部署的装置,包括:处理器;以及与所述处理器耦合的存储器,所述存储器存储有处理器可执行指令,所述指令在被所述处理器执行时使所述处理器执行根据本公开的第一方面所述的方法。
[0023]根据本公开的第四方面,提供了一种非瞬态处理器可读存储介质,包括处理器可执行指令,所述指令在被所述处理器执行时使所述处理器执行根据本公开的第一方面所述的方法。
[0024]本说明书一个或多个实施例能够实现以下技术效果中的一者或多者:
[0025]本公开的方法和系统可以将任意非神经网络模型转化成神经网络模型,使其预测阶段变成一步前向预测,从而可以与神经网络模型一样使用成熟的深度学习平台(诸如各种基础设施平台,例如infra)和/或基于成熟的深度学习库(诸如TensorFlow/PyTorch)来统一部署和管理,更加方便、稳健、硬件友好。
附图说明
[0026]以上
技术实现思路
以及下面的具体实施方式在结合附图阅读时会得到更好的理解。需要说明的是,附图仅作为所请求保护的专利技术的示例。在附图中,相同的附图标记代表相同或类似的元素。
[0027]图1是示出根据本公开的一示例实施例的改进非神经网络模型的部署的方法的示例流程图。
[0028]图2是示出根据本公开的一示例实施例的改进非神经网络模型的部署的系统的示意性框图。
[0029]图3示出根据本公开的一示例实施例的改进非神经网络模型的部署的装置的示例性框图。
[0030]图4示出根据本公开的一示例实施例的改进非神经网络模型的部署的各个阶段的示意图。
具体实施方式
[0031]术语解释:
[0032]以下具体实施方式的内容足以使任何本领域技术人员了解本说明书的一个或多个实施例的
技术实现思路
并据以实施,且根据本说明书所揭露的说明书、权利要求及附图,本领域技术人员可轻易地理解本说明书的一个或多个实施例相关的目的及优点。
[0033]专利技术人认识到,当今各种生产场景(例如推荐系统、风控系统等等)经常用各式各样的机器学习模型来进行预测。对于各种非NN的模型而言,它们的计算原理差异很大,无法相互替代。
[0034]例如,有的模型(例如支持向量机,SVM)可以通过一个公式直接预测,有的模型(例如最大期望,EM)需要循环迭代预测,有的模型(例如基于Gibbs采样的概率图模型)需要蒙特卡洛采样预测,还有的模型(例如条件随机场,crf++)需要依赖特殊的库,等等。另外,有的模型可以用GPU加速,而有的模型则不能用GPU加速,等等。正是由于这些模型的原理和性质各异,会导致在预测阶段的具体实现方式的差异。这种差异为预测阶段(包括统一管理、硬件适配,性能优化,等等)带来额外的困难。
[0035]为此,专利技术人提出了一种改进非神经网络模型的部署的方法和系统。本公开的方法和系统可以将任意非神经网络模型转化成神经网络模型,使其预测阶段变成一步前向预测,从而可以与神经网络模型一样使用成熟的深度学习平台(诸如各种基础设施平台,例如infra)和/或基于成熟的深度学习库(诸如TensorFlow/PyTorch)来统一部署和管理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种改进非神经网络模型的部署的方法,包括:使用第一数据集对神经网络模型进行训练,所述第一数据集包括特征和所述非神经网络模型针对所述特征的预测结果;以及将经训练的神经网络模型部署到使用所述非神经网络模型的预测任务中来代替所述非神经网络模型。2.根据权利要求1所述的方法,其特征在于,所述神经网络模型的输出层的格式与所述非神经网络模型的输出层的格式相同。3.根据权利要求2所述的方法,其特征在于,所述非神经网络模型是用于图像二分类的基于SVM的模型,并且所述神经网络模型的输出层的格式是二分类。4.根据权利要求2所述的方法,其特征在于,所述非神经网络模型是用于文本词的主题标注的基于LDA的模型,并且所述神经网络模型的输出层的格式是每个词的K分类,其中K是文本词的主题的数目。5.根据权利要求1所述的方法,其特征在于,所述训练使得神经网络模型的输出在特定度量上与所述非神经网络模型的输出最接近,其中所述特定度量取决于所述预测任务。6.根据权利要求5所述的方法,其特征在于,所述特定度量包括以下中的一者:针对分类应用任务的交叉熵度量;以及针对回归应用任务的均方误差度量。7.根据权利要求1所述的方法,其特征在于,所述神经网络模型的训练和/或部署是使用TensorFlow和/或PyTorch神经网络训练平台来完成的。8.根据权利要求1所述的方法,其特征在于,所述非神经网络模型是使用第二数据集来训练的,其中所述第二数据集包括所述特征及与所述特征相关联的标签。9.一种改进非神经网络模型的部署的系统,包括:训练模块,所述训练模块被布置成使用第一数据集对神经网络模型进行训练,所述第一数据集包括特征和所述非神经网络模型针对所述特征的预测结果;以及部署模块,所述部署模块被配置成将经训练的神经网络模型部署到使用所...

【专利技术属性】
技术研发人员:齐翔
申请(专利权)人:蚂蚁区块链科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1