内窥镜图像数据集构建方法技术

技术编号：27305167 阅读：15 留言：0更新日期：2021-02-10 09:15

内窥镜图像数据集构建方法。本发明专利技术提供一种图像数据集构建方法，所述方法包括：对原始图像进行预处理，以获得标准规格图像集；从所述标准规格图像集中去除冗余图像，以获得精简图像集；对所述精简图像集中的每个图像标注标识符；已及整合所述精简图像集中具有所述至少一个标识符的每幅图像。一个标识符的每幅图像。一个标识符的每幅图像。

全部详细技术资料下载

【技术实现步骤摘要】
内窥镜图像数据集构建方法

[0001]本申请涉及图像数据集构建方法，特别涉及胶囊内窥镜图像数据集构建方法。

技术介绍

[0002]胶囊内窥镜，或称无线内镜，由微型照相机、数字处理系统和无线收发系统等组成。受检者将胶囊内窥镜吞咽入体内后，胶囊内窥镜拍摄受检者的消化道图像，并将消化道图像经无线传送到体外的接收器。胶囊内窥镜能无创地进入人体，用于窥探人体肠胃和食道部位的状况，用来协助医生对病人消化道系统疾患进行诊断。
[0003]胶囊内窥镜可以生成视频图像。一次完整的内窥镜检查，可以生成大约超过8小时的视频图像记录，在使用每秒2帧的记录形式的情况下，视频中将包含大约60000幅图像。其中，大部分图像为可能是对应于受检者身体健康部位的正常图像，反映病症的图像大约占总的图像的5％，而将反映病症的图像筛选出，则需要对全部图样作逐一判读，工作量大，效率低，误差率高。另外，胶囊内窥镜依靠胃肠动力在胃肠道内移动，使得成像条件变化多端，因此成像复杂度高，需要对生成的图像进行整理。
[0004]目前的胶囊内窥镜图像分析，有一些辅助判读工具，例如，深度神经网络的发展为内窥镜图像的辅助判读提供了有效的工具。但是数据集的缺乏和数据集生成方法的随意性，使得神经网络的判读方法受到很大的局限。优质的胶囊内窥镜数据集不但可以提供深度学习的基础，也可以作为图谱，用于医生学习的辅助工具。

技术实现思路

[0005]本专利技术提供一种内窥镜图像数据集构建方法，所述方法包括：对内窥镜拍摄的原始图像进行预处理，以获得标准规格图像集...

【技术保护点】

【技术特征摘要】
1.一种图像数据集构建方法，其特征在于，所述方法包括：对原始图像进行预处理，以获得标准规格图像集；从所述标准规格图像集中去除冗余图像，以获得精简图像集；对所述精简图像集中的每个图像标注标识符；整合所述精简图像集中具有所述至少一个标识符的每幅图像。2.根据权利要求1所述的方法，其特征在于，所述从标准规格图像集中去除冗余图像包括：获得所述标准规格图像集中每个图像的哈希值；计算所述标准规格图像集中任意两幅图像的汉明距离；将所述任意两幅图像的汉明距离与预设阈值进行比对，如果汉明距离大于或等于阈值，则将该两幅图像均标注为保留图像；如果汉明距离小于阈值，则将该两幅图像中的一幅标注为冗余图像，将该两幅图像中的另一幅标注为保留图像；基于所述保留图像生成所述精简图像集。3.根据权利要求1所述的方法，其特征在于，所述对所述精简图像集中的每个图像标注标识符包括：对精简图像集中的每个精简单幅图像标注第一标识符；对精简图像集中的每个精简单幅图像标注第二标识符；对精简图像集中的每个精简单幅图像标注第三标识符；对精简图像集中的每个精简单幅图像标注第四标识符。4.根据权利要求3所述的方法，其特征在于，所述第一标识符包含受检者病灶位置的信息。5.根据权利要求3所述的方法，其特征在于，所述第二标识符包含受检者病灶类型的信息...

【专利技术属性】
技术研发人员：郭英凯，郭永新，胡珂立，申崇江，王伟，王博，
申请(专利权)人：苏州工业园区新国大研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人