基于人工智能的医疗影像的噪声数据识别方法和相关装置制造方法及图纸

技术编号：24889840 阅读：80 留言：0更新日期：2020-07-14 18:16

本申请实施例公开了基于人工智能的医疗影像的噪声数据识别方法和相关装置，针对具有标签的医疗影像，若需要识别其中是否具有噪声数据，可以将该医疗影像作为待识别标签数据，并通过第一识别模型对其进行识别。由于第一识别模型具备较好的抗噪能力，根据该第一识别模型得到的识别结果，其体现的置信度可以有效表达出待识别标签数据属于噪声数据的可能性，以此从具有标签的医疗影像中有效的筛选出标签标注错误的医疗影像，提高了噪声数据的确定准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于人工智能的医疗影像的噪声数据识别方法和相关装置
本申请涉及数据处理领域，特别是涉及基于人工智能的医疗影像的噪声数据识别方法和相关装置。
技术介绍
在网络模型训练时，标签数据可以作为训练样本对网络模型进行监督训练或半监督训练。标签数据可以理解为携带有标签的数据，该标签用于标识数据中所体现、涉及的指定内容，例如关于医疗影像中病灶区域识别的标签数据中，医疗影像的标签可以体现出该医疗影像中是否具有病灶区域，或者病灶区域的病灶类型等。然而，并不是所有数据的标签都是准确的，若一个标签数据的标签实际上并不正确，即标签所标识的内容并未体现在该数据中，或该数据并未涉及标签所标识的内容，那么这个标签数据属于噪声数据。若使用噪声数据对网络模型进行训练，会导致网络模型对噪声过拟合，最终得到效果不好的模型。例如在医疗影像领域，由于病灶识别的复杂性，即使是专家也不能给出准确的标注信息。相关技术中，一般通过统计学方式筛查噪声数据，例如将噪声数据作为统计的异常值，通过使用异常值检测的方法从大量标签数据中筛查出噪声数据。然而，很多...

【技术保护点】
1.一种医疗影像的噪声数据识别方法，其特征在于，所述方法包括：/n根据第一识别模型确定待识别标签数据的识别结果；所述第一识别模型是通过对初始网络模型进行N轮训练得到的，N小于完成对所述初始网络模型完整训练所需的总轮数M，所述第一识别模型的模型参数尚未收敛；所述待识别标签数据为具有标签的医疗影像；/n根据所述识别结果所体现的置信度，确定所述待识别标签数据是否为噪声数据；所述噪声数据为标签标注错误的医疗影像。/n

【技术特征摘要】
1.一种医疗影像的噪声数据识别方法，其特征在于，所述方法包括：
根据第一识别模型确定待识别标签数据的识别结果；所述第一识别模型是通过对初始网络模型进行N轮训练得到的，N小于完成对所述初始网络模型完整训练所需的总轮数M，所述第一识别模型的模型参数尚未收敛；所述待识别标签数据为具有标签的医疗影像；
根据所述识别结果所体现的置信度，确定所述待识别标签数据是否为噪声数据；所述噪声数据为标签标注错误的医疗影像。

2.根据权利要求1所述的方法，其特征在于，所述根据所述识别结果所体现的置信度，确定所述识别结果对应的待识别标签数据是否为噪声数据，包括：
若所述识别结果所体现的置信度低于第一条件阈值，确定所述识别结果对应的待识别标签数据为噪声数据。

3.根据权利要求1所述的方法，其特征在于，所述根据所述识别结果所体现的置信度，确定所述识别结果对应的待识别标签数据是否为噪声数据，包括：
若所述识别结果所体现的置信度高于第二条件阈值，确定所述待识别标签数据的标签与所述识别结果是否一致；
若不一致，确定所述识别结果对应的待识别标签数据为噪声数据。

4.根据权利要求1-3任意一项所述的方法，其特征在于，在所述根据所述识别结果所体现的置信度，确定所述识别结果对应的待识别标签数据是否为噪声数据之前，所述方法还包括：
通过标识所述识别结果的概率分布，确定所述识别结果所体现的置信度。

5.根据权利要求4所述的方法，其特征在于，所述通过标识所述识别结果的概率分布，确定所述识别结果对应的置信度，包括：
确定标识所述识别结果的概率分布所对应的信息熵；
根据所述信息熵确定所述识别结果所体现的置信度。

6.根据权利要求1所述的方法，其特征在于，所述待识别标签数据为训练所述初始网络模型所使用训练样本集中的标签数据。

7.根据权利要求6所述的方法，其特征在于，在根据所述识别结果确定出噪声数据之后，所述方法还包括：
获取重新标注数据，所述重新标注数据是对所述噪声数据重新标注标签得到的；
根据所述重新标注数据和所述训练样本集中的剩余数据生成调整样本集，所述剩余数据为所述训练样本集中除了噪声数据之外的标签数据；
将所述调整样本集作为所述训练样...

【专利技术属性】
技术研发人员：陈豪，尚鸿，孙钟前，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人