一种神经网络模型的训练方法及装置制造方法及图纸

技术编号：28560491 阅读：27 留言：0更新日期：2021-05-25 17:55

本申请公开了一种神经网络模型的训练方法及装置。所述方法应用于终端设备，所述终端设备包括用于处理业务的第一神经网络模型和第二神经网络模型，所述第一神经网络模型的精度小于所述第二神经网络模型的精度；所述方法包括：获取所述终端设备在设定周期内生成的所述业务的标注数据；使用所述设定周期内生成的所述业务的标注数据对所述第二神经网络模型进行训练，得到训练后的第二神经网络模型；根据所述训练后的第二神经网络模型，对所述第一神经网络模型进行更新。本申请实施例中由于是根据终端设备生成的标注数据进行训练，从而使得更新后的第一神经网络模型相比于通用模型来说，推理结果的可信度更高，更能满足用户的个性化需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络模型的训练方法及装置
本专利技术涉及计算机
，特别涉及一种神经网络模型的训练方法及装置。
技术介绍
人工智能(artificialintelligence，AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。基于人工智能的神经网络模型是一种模拟大脑结构的机器学习模型。在机器学习领域，神经网络经常被用来对较复杂的任务建模。神经网络的规模，包括深度和宽度都是可以调节的，视应用领域和问题规模而定。因为神经网络超强的表达能力，在语音识别、图像识别、自然语言处理、广告投放等应用领域被广泛应用。神经网络模型的结构包括多层，第一层是输入层，最顶上一层是输出层，中间包括零个或者多个隐含层，每一层包括一个或多个节点。输入层规模根据输入变量的数量决定，输出层规模则取决于类别数目。隐含层包括多个神经元...

【技术保护点】
1.一种神经网络模型的训练方法，其特征在于，包括：/n使用第一神经网络模型对业务的第一输入数据进行推理，得到推理结果；/n在接收到用户对所述推理结果的有效反馈之后，根据所述第一输入数据和所述用户对所述推理结果的有效反馈生成所述业务的标注数据；/n使用所述业务的标注数据对第二神经网络模型进行训练，得到训练后的第二神经网络模型；/n根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新。/n

【技术特征摘要】
1.一种神经网络模型的训练方法，其特征在于，包括：
使用第一神经网络模型对业务的第一输入数据进行推理，得到推理结果；
在接收到用户对所述推理结果的有效反馈之后，根据所述第一输入数据和所述用户对所述推理结果的有效反馈生成所述业务的标注数据；
使用所述业务的标注数据对第二神经网络模型进行训练，得到训练后的第二神经网络模型；
根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新。

2.根据权利要求1所述的训练方法，其特征在于，所述第一神经网络模型的精度小于所述第二神经网络模型的精度。

3.根据权利要求1或2所述的训练方法，其特征在于，所述第一神经网络模型和所述第二神经网络模型均为终端设备上部署的神经网络模型。

4.根据权利要求1-3任一所述的训练方法，其特征在于，所述第一神经网络模型为所述第二神经网络模型经过转换后生成的网络模型。

5.根据权利要求1-4任一所述的训练方法，其特征在于，所述根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新包括：
根据所述训练后的第二神经网络模型的参数值对第一神经网络模型的参数值进行更新。

6.根据权利要求1-5任一所述的方法，其特征在于，还包括：
接收云端服务器发送的第二版本软件包，所述第二版本软件包中包括第二版本对应的第一神经网络模型；
使用所述第二版本对应的第一神经网络模型进行推理。

7.一种神经网络模型的训练方法，其特征在于，包括：
使用第一神经网络模型对业务的第一输入数据进行推理，得到推理结果；
确定所述推理结果的可信度；
根据所述推理结果的可信度、所述第一输入数据和所述推理结果生成所述业务的标注数据；
使用所述业务的标注数据对第二神经网络模型进行训练，得到训练后的第二神经网络模型；
根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新。

8.根据权利要求7所述的训练方法，其特征在于，所述第一神经网络模型的精度小于所述第二神经网络模型的精度。

9.根据权利要求7或8所述的训练方法，其特征在于，所述第一神经网络模型和所述第二神经网络模型均为终端设备上部署的神经网络模型。

10.根据权利要求7-9任一所述的训练方法，其特征在于，所述第一神经网络模型为所述第二神经网络模型经过转换后生成的网络模型。

11.根据权利要求7-10任一所述的方法，其特征在于，所述根据所述推理结果的可信度、所述第一输入数据和所述推理结果生成所述业务的标注数据包括：
在所述推理结果的可信度大于第一阈值时，根据所述第一输入数据和所述推理结果生成所述业务的标注数据。

12.根据权利要求7-11任一所述的方法，其特征在于，所述方法应用于终端设备，所述使用所述业务的标注数据对所述第二神经网络模型进行训练，包括：
在所述终端设备处于充电状态时，使用所述业务的标注数据对所述第二神经网络模型进行训练。

13.一种神经网络模型的训练装置，其特征在于，包括：...

【专利技术属性】
技术研发人员：马涛，苏箐，金颖，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人