当前位置: 首页 > 专利查询>清华大学专利>正文

一种影像识别方法和装置制造方法及图纸

技术编号:28376184 阅读:32 留言:0更新日期:2021-05-08 00:03
本申请实施例公开了一种影像识别方法和装置,该方法包括:获取待识别影像以及训练好的影像识别模型;将待识别影像输入影像识别模型,并由影像识别模型输出待识别影像对应的疾病类型;影像识别模型是以预设的训练数据集包含的标注数据集合对第一卷积神经网络进行训练,并基于训练数据集包含的未标注数据集合以及训练后的第一卷积神经网络获得未标注数据集合中每个未标注数据对应的伪标签;基于伪标签以及元学习方法对第二卷积神经网络进行训练获得的;第二卷积神经网络与第一卷积神经网络结构相同;训练好的第二卷积神经网络作为影像识别模型。该实施例方案实现了不引入额外的超参数,具有更低的部署成本,适用性更广。

【技术实现步骤摘要】
一种影像识别方法和装置
本文涉及影像分析技术,尤指一种影像识别方法和装置。
技术介绍
医疗影像技术指的是利用x光投射、核磁共振扫描等方式获取人体内部的可视影像数据,其包含大量清晰、直观的医学信息,对临床医生和专家的分析及诊断具有极大地参考意义,在现代医学治疗和研究中具有非常广泛的应用。近年来,随着人工智能技术的快速发展,利用深度卷积神经网络对医疗影像进行自动识别已经成为一种高效、精确、低成本的医疗影像分析技术,可以有效缓解医疗资源不足、存在医生误判风险等问题。然而,部署深度卷积神经网络需要对足量的训练数据进行标注,医疗影像的标注工作往往需要富有经验的放射科医生及相关领域专家花费较长时间完成,具有很高的人力和时间成本。针对标注成本高昂的问题,半监督学习是一种有效的解决方案。其使用少量高成本标注样本和大量低成本、易获取无标注样本同时进行训练,得到泛化性能较佳的深度卷积网络。尽管一些现有的半监督学习方法已经被应用于医疗影像识别,但是这些方法往往具有很高的超参数搜索成本,需要投入大量的计算资源才能取得较好的效果。
技术实现思路
本申请实施例提供了一种影像识别方法和装置,能够不引入额外的超参数,具有更低的部署成本,适用性更广。本申请实施例提供了一种影像识别方法,所述方法可以包括:获取待识别影像以及训练好的影像识别模型;将所述待识别影像输入所述影像识别模型,并由所述影像识别模型输出所述待识别影像对应的疾病类型;其中,所述影像识别模型是以预设的训练数据集包含的标注有疾病类型的标注数据集合对预先建立的第一卷积神经网络进行训练,并基于所述训练数据集包含的未标注有疾病类型的未标注数据集合以及训练后的第一卷积神经网络获得所述未标注数据集合中每个未标注数据对应的伪标签;基于所述伪标签以及元学习方法对第二卷积神经网络进行训练获得的;所述第二卷积神经网络与所述第一卷积神经网络的结构完全相同;训练好的第二卷积神经网络作为所述影像识别模型。在本申请的示例性实施例中,获取训练好的影像识别模型可以包括:直接调取存储的影像识别模型;或者,创建所述影像识别模型。在本申请的示例性实施例中,所述创建所述影像识别模型,可以包括:获取所述训练数据集;所述训练数据集包含标注有疾病类型的标注数据集合以及未标注有疾病类型的未标注数据集合;构建所述第一卷积神经网络以及与所述第一卷积神经网络的结构完全相同的第二卷积神经网络;以所述标注数据集合对所述第一卷积神经网络进行训练;将所述未标注数据集合输入训练后的第一卷积神经网络,获得所述伪标签;基于所述伪标签对所述第二卷积神经网络进行预设次数的训练;将训练后的第二卷积神经网络作为所述影像识别模型。在本申请的示例性实施例中,所述第一卷积神经网络和所述第二卷积神经网络均可以包含:多个按照残差神经网络ResNet规则或紧密连接的神经网络DenseNet规则排列的函数层。在本申请的示例性实施例中,所述以所述标注数据集合对所述第一卷积神经网络进行训练可以包括:根据以下第一计算式训练所述第一卷积神经网络,以获得所述第一卷积神经网络的最优网络参数:其中,g(xi,Θm)表示将所述标注数据集合中的第i个元素xi输入参数为Θm的第一神经网络所得的输出,表示g(xi,Θm)的第yi个元素,yi为元素xi所属的病变类型的类别标签;表示优化后最终得到的最优网络参数;i为正整数。在本申请的示例性实施例中,所述基于所述伪标签以及元学习方法对所述第二卷积神经网络进行预设次数的训练,可以包括:61、基于所述伪标签、所述标注数据集合中每个标注数据对应的类别标签yi以及所述第二卷积神经网络的参数Θ获取所述伪标签对应的元梯度;62、基于所述元梯度对所述参数Θ进行优化更新;63、检测当前优化次数是否达到所述预设次数,如果当前优化次数达到所述预设次数,确定所述第二卷积神经网络训练完毕;如果当前优化次数未达到所述预设次数,返回步骤61。在本申请的示例性实施例中,所述基于所述伪标签、所述标注数据集合中每个标注数据对应的类别标签yi以及所述第二卷积神经网络的参数Θ获取所述伪标签对应的元梯度,可以包括:根据所述未标注数据集合中每个未标注数据、所述每个未标注数据对应的伪标签以及预设的损失函数计算损失函数值;计算所述损失函数值对所述第二卷积神经网络的参数Θ的第一偏导数;根据所述标注数据集合中每个标注数据、所述每个标注数据对应的类别标签yi以及预设的总损失函数计算总损失值;计算所述总损失值对所述第二卷积神经网络的参数Θ的第二偏导数;对于所述未标注数据集合中每个未标注数据以及所述每个未标注数据对应的伪标签,利用所述第一偏导数、所述第二偏导数以及预设的元梯度计算式计算所述元梯度。在本申请的示例性实施例中,所述损失函数可以包括:其中,为第i个未标注数据ui及其对应的伪标签所对应的损失函数值,g(ui,Θ)表示将第i个未标注数据ui输入参数为Θ的第二神经网络所得的输出,和g(ui,Θ)j分别表第i个未标注数据ui对应的伪标签示和g(ui,Θ)的第j个元素,i和j为正整数;所述总损失函数可以包括:其中,为所述标注数据集合中的所有标注数据及其类别标签计算出的总损失值;g(xi,Θ)表示将第i个标注数据xi输入参数为Θ的第二神经网络所得的输出;表示g(xi,Θ)的第yi个元素;所述元梯度计算式可以包括:在本申请的示例性实施例中,所述基于所述元梯度对所述参数Θ进行优化更新,可以包括:对于所述未标注数据集合中每个未标注数据以及所述每个未标注数据对应的伪标签,根据所述元梯度和预设的判别函数计算判别函数值;根据所述判别函数值、预设的第二计算式以及计算出的损失函数值对所述参数Θ进行更新计算;所述损失函数值根据所述未标注数据集合中每个未标注数据、所述每个未标注数据对应的伪标签以及预设的损失函数计算获得。在本申请的示例性实施例中,所述判别函数可以包括:其中,为第i个未标注数据ui及其对应的伪标签所对应的判别函数值,Δi为第i个未标注数据ui及其对应的伪标签所对应的元梯度;所述第二计算式可以包括:本申请实施例还提供了一种影像识别装置,可以包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令被所述处理器执行时,实现上述任意一项所述的影像识别方法。与相关技术相比,本申请实施例可以包括:获取待识别影像以及训练好的影像识别模型;将所述待识别影像输入所述影像识别模型,并由所述影像识别模型输出所述待识别影像对应的疾病类型;其中,所述影像识别模型是以预设的训练数据集包含的标注有疾病类型的标注数据集合对预先建立的第一卷积神经网络进行训练,并基于所述训练数据集包含的未标注有疾病类型的未标注数据集合以及训练后的第一卷积神经网络获得所述未标注数据集合中每个未标注数据对应的伪标签;基本文档来自技高网...

【技术保护点】
1.一种影像识别方法,其特征在于,所述方法包括:/n获取待识别影像以及训练好的影像识别模型;/n将所述待识别影像输入所述影像识别模型,并由所述影像识别模型输出所述待识别影像对应的疾病类型;/n其中,所述影像识别模型是以预设的训练数据集包含的标注有疾病类型的标注数据集合对预先建立的第一卷积神经网络进行训练,并基于所述训练数据集包含的未标注有疾病类型的未标注数据集合以及训练后的第一卷积神经网络获得所述未标注数据集合中每个未标注数据对应的伪标签;基于所述伪标签以及元学习方法对第二卷积神经网络进行训练获得的;所述第二卷积神经网络与所述第一卷积神经网络的结构完全相同;训练好的第二卷积神经网络作为所述影像识别模型。/n

【技术特征摘要】
1.一种影像识别方法,其特征在于,所述方法包括:
获取待识别影像以及训练好的影像识别模型;
将所述待识别影像输入所述影像识别模型,并由所述影像识别模型输出所述待识别影像对应的疾病类型;
其中,所述影像识别模型是以预设的训练数据集包含的标注有疾病类型的标注数据集合对预先建立的第一卷积神经网络进行训练,并基于所述训练数据集包含的未标注有疾病类型的未标注数据集合以及训练后的第一卷积神经网络获得所述未标注数据集合中每个未标注数据对应的伪标签;基于所述伪标签以及元学习方法对第二卷积神经网络进行训练获得的;所述第二卷积神经网络与所述第一卷积神经网络的结构完全相同;训练好的第二卷积神经网络作为所述影像识别模型。


2.根据权利要求1所述的影像识别方法,其特征在于,获取训练好的影像识别模型,包括:
直接调取存储的影像识别模型;或者,
创建所述影像识别模型。


3.根据权利要求2所述的影像识别方法,其特征在于,所述创建所述影像识别模型,包括:
获取所述训练数据集;所述训练数据集包含标注有疾病类型的标注数据集合以及未标注有疾病类型的未标注数据集合;
构建所述第一卷积神经网络以及与所述第一卷积神经网络的结构完全相同的第二卷积神经网络;
以所述标注数据集合对所述第一卷积神经网络进行训练;
将所述未标注数据集合输入训练后的第一卷积神经网络,获得所述伪标签;
基于所述伪标签对所述第二卷积神经网络进行预设次数的训练;
将训练后的第二卷积神经网络作为所述影像识别模型。


4.根据权利要求3所述的影像识别方法,其特征在于,所述第一卷积神经网络和所述第二卷积神经网络均包含:多个按照残差神经网络ResNet规则或紧密连接的神经网络DenseNet规则排列的函数层。


5.根据权利要求3所述的影像识别方法,其特征在于,所述以所述标注数据集合对所述第一卷积神经网络进行训练包括:根据以下第一计算式训练所述第一卷积神经网络,以获得所述第一卷积神经网络的最优网络参数:



其中,g(xi,Θm)表示将所述标注数据集合χ中的第i个元素xi输入参数为Θm的第一神经网络所得的输出,表示g(xi,Θm)的第yi个元素,yi为元素xi所属的病变类型的类别标签;表示优化后最终得到的最优网络参数;i为正整数。


6.根据权利要求3所述的影像识别方法,其特征在于,所述基于所述伪标签以及元学习方法对所述第二卷积神经网络进行预设次数的训练,包括:
61、基于所述伪标签、所述标注数据集合中每个标注数据对应的类别标签yi以及所述第二卷积神经网络的参数Θ获取所述伪标签对应的元梯度;
62、基于所述元梯度对所述参数Θ进行优化更新;
6...

【专利技术属性】
技术研发人员:黄高王语霖郭嘉懿宋士吉
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1