基于人工智能的医疗影像的噪声数据识别方法和相关装置制造方法及图纸

技术编号:24889840 阅读:62 留言:0更新日期:2020-07-14 18:16
本申请实施例公开了基于人工智能的医疗影像的噪声数据识别方法和相关装置,针对具有标签的医疗影像,若需要识别其中是否具有噪声数据,可以将该医疗影像作为待识别标签数据,并通过第一识别模型对其进行识别。由于第一识别模型具备较好的抗噪能力,根据该第一识别模型得到的识别结果,其体现的置信度可以有效表达出待识别标签数据属于噪声数据的可能性,以此从具有标签的医疗影像中有效的筛选出标签标注错误的医疗影像,提高了噪声数据的确定准确性。

【技术实现步骤摘要】
基于人工智能的医疗影像的噪声数据识别方法和相关装置
本申请涉及数据处理领域,特别是涉及基于人工智能的医疗影像的噪声数据识别方法和相关装置。
技术介绍
在网络模型训练时,标签数据可以作为训练样本对网络模型进行监督训练或半监督训练。标签数据可以理解为携带有标签的数据,该标签用于标识数据中所体现、涉及的指定内容,例如关于医疗影像中病灶区域识别的标签数据中,医疗影像的标签可以体现出该医疗影像中是否具有病灶区域,或者病灶区域的病灶类型等。然而,并不是所有数据的标签都是准确的,若一个标签数据的标签实际上并不正确,即标签所标识的内容并未体现在该数据中,或该数据并未涉及标签所标识的内容,那么这个标签数据属于噪声数据。若使用噪声数据对网络模型进行训练,会导致网络模型对噪声过拟合,最终得到效果不好的模型。例如在医疗影像领域,由于病灶识别的复杂性,即使是专家也不能给出准确的标注信息。相关技术中,一般通过统计学方式筛查噪声数据,例如将噪声数据作为统计的异常值,通过使用异常值检测的方法从大量标签数据中筛查出噪声数据。然而,很多噪声数据并不属于统计规则下的异常值,例如一张通过标签标识了具有病灶的医疗影像,其上虽然没有示出病灶,但示出了对病灶区域手术之后形成的伤口,该标签数据理应属于噪声数据,但是从统计学角度并不能将其确定为异常值。由此可见,相关技术中对医疗影像的噪声数据筛查方式准确性并不高,难以满足目前的噪声数据识别需求。
技术实现思路
为了解决上述技术问题,本申请提供了基于人工智能的医疗影像的噪声数据识别方法和相关装置,提高了噪声数据的确定准确性。本申请实施例公开了如下技术方案:一方面,本申请实施例提供了一种医疗影像的噪声数据识别方法,所述方法包括:根据第一识别模型确定待识别标签数据的识别结果;所述第一识别模型是通过对初始网络模型进行N轮训练得到的,N小于完成对所述初始网络模型完整训练所需的总轮数M,所述第一识别模型的模型参数尚未收敛;根据所述识别结果所体现的置信度,确定所述待识别标签数据是否为噪声数据。另一方面,本申请实施例提供了一种医疗影像的噪声数据识别装置,所述装置包括第一确定单元和第二确定单元:所述第一确定单元,用于根据第一识别模型确定待识别标签数据的识别结果;所述第一识别模型是通过对初始网络模型进行N轮训练得到的,N小于完成对所述初始网络模型完整训练所需的总轮数M,所述第一识别模型的模型参数尚未收敛;所述第二确定单元,用于根据所述识别结果所体现的置信度,确定所述待识别标签数据是否为噪声数据。另一方面,本申请实施例提供了一种用于医疗影像的噪声数据识别设备,所述设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行上述方面所述的方法。另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方面所述的方法。由上述技术方案可以看出,针对具有标签的医疗影像,若需要识别其中是否具有噪声数据,可以将该医疗影像作为待识别标签数据,并通过特定的第一识别模型对其进行识别。该第一识别模型是通过初始网络模型进行N轮训练得到的,由于N小于完成对所述初始网络模型完整训练所需的总轮数M,故训练得到的第一识别模型中的模型参数尚未收敛,属于刚完成初期训练,此时的第一识别模型通过训练学习到的是训练样本中大部分类似数据的共通特征,而由于作为训练样本的医疗影像中非噪声数据即具有正确标签的占比较大,那么第一识别模型学习到的主要是这类标签数据的共通特征,尚未过拟合噪声数据,从而具备较好的抗噪能力。由于第一识别模型本身的这种抗噪能力,根据这种第一识别模型得到的识别结果,其体现的置信度可以有效表达出待识别标签数据属于噪声数据的可能性,可以以此从具有标签的医疗影像中有效的筛选出标签标注错误的医疗影像,提高了噪声数据的确定准确性。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种医疗影像的噪声数据识别方法的应用场景示意图;图2为本申请实施例提供的一种医疗影像的噪声数据识别方法的流程示意图;图3为本申请实施例提供的另一种医疗影像的噪声数据识别方法的流程示意图;图4为本申请实施例提供的一种医疗影像的噪声数据识别装置的结构示意图;图5为本申请实施例提供的服务器的结构示意图;图6为本申请实施例提供的终端设备的结构示意图。具体实施方式下面结合附图,对本申请的实施例进行描述。为了更有效地筛选出标签标注错误的医疗影像,本申请实施例提供了一种基于人工智能的医疗影像的噪声数据识别方法,该方法利用经过初期训练的第一识别模型对具有标签的医疗影像进行识别,通过该医疗影像对应的识别结果所体现的置信度,确定该医疗影像是否为噪声数据,从而可以有效地筛选出标签标注错误的医疗影像。本申请实施例提供的医疗影像的噪声数据识别方法是基于人工智能实现的,人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。在本申请实施例中,主要涉及的人工智能软件技术包括上述计算机视觉技术、机器学习/深度学习等方向。例如可以涉及计算机视觉(ComputerVision)中的图像处理(ImageProcessing)、图像语义理解(ImageSemanticUnderstanding,ISU)、视频处理(videoprocessing)、视频语义理解(videosemanticunderstanding,VSU)、人脸识别(facerecognition)等。例如可以涉及机器学习(Machinelearning,ML)中的深度学习(DeepLearning),包括各类人工神经网络(ArtificialNeuralNetwork,ANN)。为了便于理解本申请本文档来自技高网...

【技术保护点】
1.一种医疗影像的噪声数据识别方法,其特征在于,所述方法包括:/n根据第一识别模型确定待识别标签数据的识别结果;所述第一识别模型是通过对初始网络模型进行N轮训练得到的,N小于完成对所述初始网络模型完整训练所需的总轮数M,所述第一识别模型的模型参数尚未收敛;所述待识别标签数据为具有标签的医疗影像;/n根据所述识别结果所体现的置信度,确定所述待识别标签数据是否为噪声数据;所述噪声数据为标签标注错误的医疗影像。/n

【技术特征摘要】
1.一种医疗影像的噪声数据识别方法,其特征在于,所述方法包括:
根据第一识别模型确定待识别标签数据的识别结果;所述第一识别模型是通过对初始网络模型进行N轮训练得到的,N小于完成对所述初始网络模型完整训练所需的总轮数M,所述第一识别模型的模型参数尚未收敛;所述待识别标签数据为具有标签的医疗影像;
根据所述识别结果所体现的置信度,确定所述待识别标签数据是否为噪声数据;所述噪声数据为标签标注错误的医疗影像。


2.根据权利要求1所述的方法,其特征在于,所述根据所述识别结果所体现的置信度,确定所述识别结果对应的待识别标签数据是否为噪声数据,包括:
若所述识别结果所体现的置信度低于第一条件阈值,确定所述识别结果对应的待识别标签数据为噪声数据。


3.根据权利要求1所述的方法,其特征在于,所述根据所述识别结果所体现的置信度,确定所述识别结果对应的待识别标签数据是否为噪声数据,包括:
若所述识别结果所体现的置信度高于第二条件阈值,确定所述待识别标签数据的标签与所述识别结果是否一致;
若不一致,确定所述识别结果对应的待识别标签数据为噪声数据。


4.根据权利要求1-3任意一项所述的方法,其特征在于,在所述根据所述识别结果所体现的置信度,确定所述识别结果对应的待识别标签数据是否为噪声数据之前,所述方法还包括:
通过标识所述识别结果的概率分布,确定所述识别结果所体现的置信度。


5.根据权利要求4所述的方法,其特征在于,所述通过标识所述识别结果的概率分布,确定所述识别结果对应的置信度,包括:
确定标识所述识别结果的概率分布所对应的信息熵;
根据所述信息熵确定所述识别结果所体现的置信度。


6.根据权利要求1所述的方法,其特征在于,所述待识别标签数据为训练所述初始网络模型所使用训练样本集中的标签数据。


7.根据权利要求6所述的方法,其特征在于,在根据所述识别结果确定出噪声数据之后,所述方法还包括:
获取重新标注数据,所述重新标注数据是对所述噪声数据重新标注标签得到的;
根据所述重新标注数据和所述训练样本集中的剩余数据生成调整样本集,所述剩余数据为所述训练样本集中除了噪声数据之外的标签数据;
将所述调整样本集作为所述训练样...

【专利技术属性】
技术研发人员:陈豪尚鸿孙钟前
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1