一种病灶识别神经网络模型的训练方法及软件技术

技术编号:37144022 阅读:15 留言:0更新日期:2023-04-06 21:53
本发明专利技术涉及一种病灶识别神经网络模型的训练方法,包括:使用第一神经网络模型对业务的第一输入数据进行推理,得到推理结果;在接收到用户对所述推理结果的有效反馈之后。该病灶识别神经网络模型的训练方法及软件,通过建立初始神经网络模型,获取大量的训练样本,对训练样本进行预处理后依次输入至初始神经网络模型,根据第一输出和与预设期望的损失值,反向传输至初始神经网络模型,以调节初始神经网络模型的网络参数,得到目标神经网络模型。建立了参数少、占用内存小的高精度目标神经网络,使得训练得到的目标神经网络模型可应用于移动终端,不在依赖于GPU的设置,提高了目标神经网络模型的适应性。经网络模型的适应性。经网络模型的适应性。

【技术实现步骤摘要】
一种病灶识别神经网络模型的训练方法及软件


[0001]本专利技术涉及人工智能
,具体为一种病灶识别神经网络模型的训练方法及软件。

技术介绍

[0002]神经网络是一种大规模、多参数优化的工具,需要依靠大量的训练数据,才能完成复杂任务。目前大量的训练数据都需要人工标注,利用标注的训练数据不断调整神经网络的参数,直至获得满足训练结束条件的神经网络模型,以便在处理复杂任务的时候获得较为满意的结果,但这种方法需要大量人工进行标注,人工成本高。为了减少大量训练数据人工标注的成本,通常采用非监督训练的方法,采用未标注的训练数据直接训练神经网络,然而采用这种方法获得的神经网络在实际应用中效果较差,不能满足实际应用的精准度。
[0003]但是目前的神经网络模型需要使用相应的计算框架,通过布置多块高性能图形处理器,且占用内存大,无法适用于设置有传统中央处理器,且内存空间较小的诸如智能手机或者平板电脑等的移动终端,故而提出一种病灶识别神经网络模型的训练方法及软件。

技术实现思路

[0004](一)解决的技术问题
[0005]针对现有技术的不足,本专利技术提供了一种病灶识别神经网络模型的训练方法及软件,具备占用内存小等优点,解决了目前的神经网络模型需要使用相应的计算框架,通过布置多块高性能图形处理器,且占用内存大,无法适用于设置有传统中央处理器,且内存空间较小的诸如智能手机或者平板电脑等的移动终端的问题。
[0006](二)技术方案
[0007]为实现上述目的,本专利技术提供如下技术方案:一种病灶识别神经网络模型的训练方法,包括:使用第一神经网络模型对业务的第一输入数据进行推理,得到推理结果;在接收到用户对所述推理结果的有效反馈之后,根据所述第一输入数据和所述用户对所述推理结果的有效反馈生成所述业务的标注数据;使用所述业务的标注数据对第二神经网络模型进行训练,得到训练后的第二神经网络模型;根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新,所述第一神经网络模型的精度小于所述第二神经网络模型的精度,所述第一神经网络模型和所述第二神经网络模型均为终端设备上部署的神经网络模型,所述第一神经网络模型为所述第二神经网络模型经过转换后生成的网络模型,所述根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新包括:根据所述训练后的第二神经网络模型的参数值对第一神经网络模型的参数值进行更新,还包括:接收云端服务器发送的第二版本软件包,所述第二版本软件包中包括第二版本对应的第一神经网络模型;使用所述第二版本对应的第一神经网络模型进行推理。
[0008]进一步,包括:使用第一神经网络模型对业务的第一输入数据进行推理,得到推理结果;确定所述推理结果的可信度;根据所述推理结果的可信度、所述第一输入数据和所述
推理结果生成所述业务的标注数据;使用所述业务的标注数据对第二神经网络模型进行训练,得到训练后的第二神经网络模型;根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新,所述第一神经网络模型的精度小于所述第二神经网络模型的精度,所述第一神经网络模型和所述第二神经网络模型均为终端设备上部署的神经网络模型,所述第一神经网络模型为所述第二神经网络模型经过转换后生成的网络模型,所述根据所述推理结果的可信度、所述第一输入数据和所述推理结果生成所述业务的标注数据包括:在所述推理结果的可信度大于第一阈值时,根据所述第一输入数据和所述推理结果生成所述业务的标注数据,所述方法应用于终端设备,所述使用所述业务的标注数据对所述第二神经网络模型进行训练,包括:在所述终端设备处于充电状态时,使用所述业务的标注数据对所述第二神经网络模型进行训练。
[0009]进一步,包括:处理模块,用于使用第一神经网络模型对业务的第一输入数据进行推理,得到推理结果;获取模块,用于在接收到用户对所述推理结果的有效反馈之后,根据所述第一输入数据和所述用户对所述推理结果的有效反馈生成所述业务的标注数据;所述处理模块,还用于使用所述业务的标注数据对第二神经网络模型进行训练,得到训练后的第二神经网络模型;以及,根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新,所述第一神经网络模型的精度小于所述第二神经网络模型的精度,所述第一神经网络模型为所述第二神经网络模型经过转换后生成的网络模型,还包括:收发模块,用于接收云端服务器发送的第二版本软件包,所述第二版本软件包中包括第二版本对应的第一神经网络模型;所述处理模块,还用于使用所述第二版本对应的第一神经网络模型进行推理。
[0010]进一步,包括:处理模块,使用第一神经网络模型对业务的第一输入数据进行推理,得到推理结果;确定所述推理结果的可信度;获取模块,根据所述推理结果的可信度、所述第一输入数据和所述推理结果生成所述业务的标注数据;所述处理模块,还用于使用所述业务的标注数据对第二神经网络模型进行训练,得到训练后的第二神经网络模型;以及,根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新。
[0011]进一步,所述第一神经网络模型的精度小于所述第二神经网络模型的精度。
[0012]进一步,所述第一神经网络模型为所述第二神经网络模型经过转换后生成的网络模型。
[0013]进一步,所述获取模块具体用于:在所述推理结果的可信度大于第一阈值时,根据所述第一输入数据和所述推理结果生成所述业务的标注数据。
[0014]进一步,所述处理模块具体用于:在终端设备处于充电状态时,使用所述业务的标注数据对所述第二神经网络模型进行训练,一种终端设备,所述终端设备包括:存储器,用于存储软件程序;处理器,用于读取所述存储器中的软件程序并执行权利要求1

6或权利要求7中任一项所述的病灶识别神经网络模型的训练方法,一种芯片,所述芯片包括:存储器,用于存储软件程序;处理器,用于读取所述存储器中的软件程序并执行权利要求1

6或权利要求7中任一项所述的病灶识别神经网络模型的训练方法,一种计算机存储介质,所述存储介质中存储软件程序,该软件程序在被一个或多个处理器读取并执行时实现权利要求1

6或权利要求7中任一项所述的病灶识别神经网络模型的训练方法。
[0015](三)有益效果
[0016]与现有技术相比,本专利技术提供了一种病灶识别神经网络模型的训练方法及软件,具备以下有益效果:
[0017]该病灶识别神经网络模型的训练方法及软件,通过建立初始神经网络模型,获取大量的训练样本,对训练样本进行预处理后依次输入至初始神经网络模型,根据第一输出和与预设期望的损失值,反向传输至初始神经网络模型,以调节初始神经网络模型的网络参数,得到目标神经网络模型。建立了参数少、占用内存小的高精度目标神经网络,使得训练得到的目标神经网络模型可应用于移动终端,不在依赖于GPU的设置,提高了目标神经网络模型的适应性。
附图说明
[0018]图1为本专利技术提出的一种病灶识别神经网络模型的训练方法及软件结构示意图。
...

【技术保护点】

【技术特征摘要】
1.一种病灶识别神经网络模型的训练方法,其特征在于,包括:使用第一神经网络模型对业务的第一输入数据进行推理,得到推理结果;在接收到用户对所述推理结果的有效反馈之后,根据所述第一输入数据和所述用户对所述推理结果的有效反馈生成所述业务的标注数据;使用所述业务的标注数据对第二神经网络模型进行训练,得到训练后的第二神经网络模型;根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新,所述第一神经网络模型的精度小于所述第二神经网络模型的精度,所述第一神经网络模型和所述第二神经网络模型均为终端设备上部署的神经网络模型,所述第一神经网络模型为所述第二神经网络模型经过转换后生成的网络模型,所述根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新包括:根据所述训练后的第二神经网络模型的参数值对第一神经网络模型的参数值进行更新,还包括:接收云端服务器发送的第二版本软件包,所述第二版本软件包中包括第二版本对应的第一神经网络模型;使用所述第二版本对应的第一神经网络模型进行推理。2.一种病灶识别神经网络模型的训练方法,其特征在于,包括:使用第一神经网络模型对业务的第一输入数据进行推理,得到推理结果;确定所述推理结果的可信度;根据所述推理结果的可信度、所述第一输入数据和所述推理结果生成所述业务的标注数据;使用所述业务的标注数据对第二神经网络模型进行训练,得到训练后的第二神经网络模型;根据所述训练后的第二神经网络模型对所述第一神经网络模型进行更新,所述第一神经网络模型的精度小于所述第二神经网络模型的精度,所述第一神经网络模型和所述第二神经网络模型均为终端设备上部署的神经网络模型,所述第一神经网络模型为所述第二神经网络模型经过转换后生成的网络模型,所述根据所述推理结果的可信度、所述第一输入数据和所述推理结果生成所述业务的标注数据包括:在所述推理结果的可信度大于第一阈值时,根据所述第一输入数据和所述推理结果生成所述业务的标注数据,所述方法应用于终端设备,所述使用所述业务的标注数据对所述第二神经网络模型进行训练,包括:在所述终端设备处于充电状态时,使用所述业务的标注数据对所述第二神经网络模型进行训练。3.一种神经网络模型的训练软件,其特征在于,包括:处理模块,用于使用第一神经网络模型对业务的第一输入数据进行推理,得到推理结果;获取模块,用于在接收到用户对所述推理结果的有效反馈之后,根据所述第一输入数据和所述用户对所述推理结果的有效反馈生成所述业...

【专利技术属性】
技术研发人员:刘程吉艳莉
申请(专利权)人:北京帆引未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1