目标对象的识别方法和装置制造方法及图纸

技术编号:21433246 阅读:37 留言:0更新日期:2019-06-22 12:14
本发明专利技术公开了一种目标对象的识别方法和装置。其中,该方法包括:获取包含目标对象的第一图像;利用U形全卷积神经网络模型对第一图像进行图像分割,得到目标对象的边界,其中,U形全卷积神经网络模型采用水平集损失函数。本发明专利技术解决了现有技术中目标对象的识别准确率较低,且可重复性较差的技术问题。

【技术实现步骤摘要】
目标对象的识别方法和装置
本专利技术涉及图像识别领域,具体而言,涉及一种目标对象的识别方法和装置。
技术介绍
在医疗领域的图像识别中,前段光学相干断层扫描(Anteriorsegmentopticalcoherencetomography,AS-OCT)用来辅助诊断许多眼科疾病,例如角膜疾病、白内障和青光眼等,是一种非侵入式无伤害的拍摄方式。晶状体,是眼球的主要屈光结构,当晶状体出现浑浊现象时(密度增加),会引起视力障碍,导致白内障产生。晶状体密度是衡量白内障等疾病严重程度的重要指标,晶状体是一个多层的结构,从外到里可大致分为:角膜层、皮质层和核。目前基于AS-OCT影像的晶状体结构分割大多都是手动进行,并且具有可重复性差,人工成本较高等缺陷。AS-OCT图像中晶状体结构边界之间模糊,导致全自动分割困难,尤其是核(nucleus)和皮质(cortex)的边界。而且,在白内障患者眼中拍摄的AS-OCT图像,边界会变得更加模糊。针对现有技术中目标对象的识别准确率较低,且可重复性较差的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种目标对象的识别方法和装置,以至少解决现有技术中目标对象的识别准确率较低,且可重复性较差的技术问题。根据本专利技术实施例的一个方面,提供了一种目标对象的识别方法,包括:获取包含目标对象的第一图像;利用U形全卷积神经网络模型对第一图像进行图像分割,得到目标对象的边界,其中,U形全卷积神经网络模型采用水平集损失函数。进一步地,U形全卷积神经网络模型包括:编码模型和解码模型,编码模型包括:多个第一网络块,第一网络块包括:依次连接的至少两个第一卷积层,第一卷积层采用修正线性单元激活函数和池化操作,第一网络块中的最后一个第一卷积层与下一个第一网络块中的第一个第一卷积层连接;解码模型包括:多个第二网络块和输出层,第一网络块和第二网络块的数量相同,第二网络块包括:依次连接的级联层和至少两个第二卷积层,级联层与对应的第一网络块和上一个第二网络块中的最后一个第二卷积层连接,级联层与对应的第一网络块采用复制和合并的跳跃连接方式连接,输出层与最后一个第二网络块中的最后一个第二的旁侧输出层连接,输出层采用水平集损失函数。进一步地,池化操作包括如下之一:最大池化操作和均值池化操作。进一步地,水平集损失函数通过如下方式确定:确定输入至输出层的结果为第一水平集,并确定输出层输出的结果为第二水平集;获取第一水平集的形状和第二水平集的形状;基于第一水平集的形状和第二水平集的状态,得到水平集损失函数。进一步地,获取第一水平集的形状,包括:获取第一水平集的第一函数值,以及第一图像的真值水平集的第二函数值;基于第一函数值和第二函数值,得到第一水平集的形状。进一步地,基于第一函数值和第二函数值,得到第一水平集的形状,包括:获取第二函数值和第一函数值之差,得到差值;获取差值的绝对值,得到绝对值;获取绝对值的平方,得到平方值;获取平方值的积分,得到第一水平集的形状。进一步地,在获取真值水平集的第二函数值之后,上述方法还包括:基于水平集转换函数对第二函数值进行处理,得到处理后的第二函数值;对处理后的第二函数值进行归一化处理,得到归一化函数值;基于第一函数值和归一化函数值,得到第一水平集的形状。进一步地,获取第二水平集的形状,包括:获取输入至输出层的多个概率值,以及每个概率值对应的真值;基于每个概率值和对应的真值,得到每个概率值的乘积;获取多个概率值的乘积之和,得到第二水平集的形状。进一步地,基于每个概率值和对应的真值,得到每个概率值的乘积,包括:获取每个概率值的对数,得到每个概率值的对数值;获取每个概率值的对数值和对应的真值的乘积,得到每个概率值的乘积。进一步地,基于第一水平集的形状和第二水平集的状态,得到水平集损失函数,包括:获取第一水平集的形状和第一参数的乘积,得到第一乘积;获取第二水平集的形状和第二参数的乘积,得到第二乘积;获取目标对象的边界的长度和第三参数的乘积,得到第三乘积;获取目标对象所在区域的积分值和第四参数的乘积,得到第四乘积,其中,积分值用于表征连接目标对象所在区域的内部和外部;获取第一乘积、第二乘积、第三乘积和第四乘积之和,得到水平集损失函数。进一步地,在利用U形全卷积神经网络模型对第一图像进行图像分割,得到目标对象的边界之前,上述方法还包括:利用边缘检测算法对第一图像进行处理,得到目标对象所在区域的第二图像;利用U形全卷积神经网络模型对第二图像进行图像分割,得到目标对象的边界。进一步地,利用边缘检测算法对第一图像进行处理,得到目标对象所在区域的第二图像,包括:利用多级边缘检测算法对第一图像进行处理,得到第二图像。进一步地,获取包含目标对象的第一图像,包括:利用前段光学相干断层扫描技术对目标对象进行扫描,得到第一图像。进一步地,目标对象为晶状体核。根据本专利技术实施例的另一方面,还提供了一种目标对象的识别装置,包括:获取模块,用于获取包含目标对象的图像;图像分割模块,用于利用U形全卷积神经网络模型对图像进行图像分割,得到目标对象的边界,其中,U形全卷积神经网络模型采用水平集损失函数。根据本专利技术实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的目标对象的识别方法。根据本专利技术实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的目标对象的识别方法。在本专利技术实施例中,在获取到包含目标对象的第一图像之后,可以利用采用了水平集损失函数的U形全卷积神经网络模型对第一图像进行图像分割,得到目标对象的边界,也即得到最终的分割结果。容易注意到的是,通过结合U形全卷积神经网络模型和水平集算法进行晶状体结构分割,实现了基于深度学习全自动晶状体结构分割,达到了有效提高晶状体结构分割的准确性和可重复性的技术效果,进而解决了现有技术中目标对象的识别准确率较低,且可重复性较差的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种目标对象的识别方法的流程图;图2a是根据本专利技术实施例的一种可选的AS-OCT图像的示意图;图2b是根据本专利技术实施例的一种可选的目标对象所在区域的示意图;图2c是根据本专利技术实施例的一种可选的分割的结果的示意图;图3是根据本专利技术实施例的一种可选的U-net网络的网络结构的示意图;图4a是根据本专利技术实施例的一种可选的真值水平集的示意图;图4b是根据本专利技术实施例的一种可选的真值标签的示意图;图4c是根据本专利技术实施例的一种可选的归一化后的结果的示意图;以及图5是根据本专利技术实施例的一种目标对象的识别装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附本文档来自技高网
...

【技术保护点】
1.一种目标对象的识别方法,其特征在于,包括:获取包含目标对象的第一图像;利用U形全卷积神经网络模型对所述第一图像进行图像分割,得到所述目标对象的边界,其中,所述U形全卷积神经网络模型采用水平集损失函数。

【技术特征摘要】
1.一种目标对象的识别方法,其特征在于,包括:获取包含目标对象的第一图像;利用U形全卷积神经网络模型对所述第一图像进行图像分割,得到所述目标对象的边界,其中,所述U形全卷积神经网络模型采用水平集损失函数。2.根据权利要求1所述的方法,其特征在于,所述U形全卷积神经网络模型包括:编码模型和解码模型,所述编码模型包括:多个第一网络块,所述第一网络块包括:依次连接的至少两个第一卷积层,所述第一卷积层采用修正线性单元激活函数和池化操作,所述第一网络块中的最后一个第一卷积层与下一个第一网络块中的第一个第一卷积层连接;所述解码模型包括:多个第二网络块和输出层,所述第一网络块和所述第二网络块的数量相同,所述第二网络块包括:依次连接的级联层和至少两个第二卷积层,所述级联层与对应的第一网络块和上一个第二网络块中的最后一个第二卷积层连接,所述级联层与所述对应的第一网络块采用复制和合并的跳跃连接方式连接,所述输出层与最后一个第二网络块中的最后一个第二的旁侧输出层连接,所述输出层采用所述水平集损失函数。3.根据权利要求2所述的方法,其特征在于,所述池化操作包括如下之一:最大池化操作和均值池化操作。4.根据权利要求2所述的方法,其特征在于,所述水平集损失函数通过如下方式确定:确定输入至所述输出层的结果为第一水平集,并确定所述输出层输出的结果为第二水平集;获取所述第一水平集的形状和所述第二水平集的形状;基于所述第一水平集的形状和所述第二水平集的状态,得到所述水平集损失函数。5.根据权利要求4所述的方法,其特征在于,获取所述第一水平集的形状,包括:获取所述第一水平集的第一函数值,以及所述第一图像的真值水平集的第二函数值;基于所述第一函数值和所述第二函数值,得到所述第一水平集的形状。6.根据权利要求5所述的方法,其特征在于,基于所述第一函数值和所述第二函数值,得到所述第一水平集的形状,包括:获取所述第二函数值和所述第一函数值之差,得到差值;获取所述差值的绝对值,得到绝对值;获取所述绝对值的平方,得到平方值;获取所述平方值的积分,得到所述第一水平集的形状。7.根据权利要求5所述的方法,其特征在于,在获取真值水平集的第二函数值之后,所述方法还包括:基于水平集转换函数对所述第二函数值进行处理,得到处理后的第二函数值;对所述处理后的第二函数值进行归一化处理,得到归一化函数值;基于所述第一函数值和所述归一化函数值,得到所述第一水平集的形状。8.根据权利要求4所述的方法,其特征在于,获取所述第二水平集的形状,包括:获取输入至所述输...

【专利技术属性】
技术研发人员:童云飞
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1