一种萎缩性胃炎图像识别模型的构建方法及其应用技术

技术编号:20944990 阅读:30 留言:0更新日期:2019-04-24 02:36
本发明专利技术涉及一种基于人工智能的萎缩性胃炎图像识别模型的构建方法,该图像识别模型能够准确的识别萎缩性胃炎图像中的病变部位。

A Method for Constructing Image Recognition Model of Atrophic Gastritis and Its Application

The invention relates to a method for constructing an image recognition model of atrophic gastritis based on artificial intelligence, which can accurately identify the pathological parts in the image of atrophic gastritis.

【技术实现步骤摘要】
一种萎缩性胃炎图像识别模型的构建方法及其应用
本专利技术属于医学领域,更具体的涉及利用图像识别模型实现病变图像自动识别的

技术介绍
虽然胃癌的发病率从1975年起逐渐下降,但2012年仍有将近100万的新发病例(共951000例,占所有癌症发病率的6.8%),使之成为世界第五大最常见的恶性肿瘤。其中,有超过70%的病例出现在发展中国家,且有一半发生在东亚(主要在中国)。在死亡率方面,胃癌是世界第三大癌症死因(共723000例死亡,占总死亡率的8.8%)。胃癌的预后极大程度上取决于它的分歧。有研究表明胃早癌的5年生存率几乎超过90%,而进展期胃癌的生存率却低于20%。所以,在高风险患癌人群中早期发现和规律随诊是降低胃癌发病率、提高患者生存率的最有效的手段,尤其是那些被诊断癌前病变的患者。由幽门螺旋杆菌诱发,后经历慢性胃炎、萎缩性胃炎、肠上皮化生最终发展为胃癌的多阶段发展过程已经被广泛认可。尤其是萎缩性胃炎和肠上皮化生,被认为是演变为胃腺癌的毕竟阶段。萎缩和肠化程度越严重、累及范围越大,意味着胃癌的患病风险越大。所以准确诊断萎缩和肠化,以及后续定期复查、及时治疗被认为是将胃癌控制在早期阶段的重中之重。由于普通白光内镜诊断胃癌(尤其是浅表平坦型病变)的误诊、漏诊率相当高,各种内镜诊断技术应运而生。但是应用这些内镜设备不仅需要的高超的操作技巧,还需要可观的经济支持。因此,急需研发一种发现、诊断胃早癌及癌前病变的简单易得、经济实用并且安全可靠的诊断技术。
技术实现思路
专利技术人在长期的医学实践中,为了减少人为内镜诊断所带来的各种问题,利用机器学习技术,经过多次开发、反复优化和训练获得了可用于萎缩性胃炎图像中病变部位识别的神经网络,即一种基于人工智能的萎缩性胃炎图像识别模型。特别是,专利技术人在训练时创新性的改进了训练图像集的预处理方法,从而使得经过训练的神经网络可精准的判定图像中是否存在病变以及病变存在位置和/或概率,使得基于神经网络的图像识别模型的应用从病理学的分类提升至病变的精准识别,大大提高了临床应用价值。本专利技术构建的图像识别模型能够非常精准的识别病理图像(如胃镜图片和实时图像)中的癌症病变部位,其识别率甚至已经超过了内科专家医师。本专利技术的第一个方面提供了一种能够自动识别图像中病变和/或其位置的图像识别模型的构建方法,所述病变为萎缩性胃炎,其包括下列步骤:S1.获取病变数据获得M张被确诊患有萎缩性胃炎的患者的包含病变部位的图像,所述图像优选为内镜图像,从而构建训练集,其中M为1至100000之间的自然数,例如50-50000、100-10000、500-7000、1000-5000或3000-4000之间的自然数;S2.图像预处理针对步骤S1得到的训练集,精确框选萎缩性胃炎的病灶部位,其中框选内的部分定义为阳性样本,而框选外的部分定义为阴性样本,同时记录和/或输出病灶的位置坐标信息和病灶类型信息;S3.训练图像识别模型利用经过S2步骤的训练集对基于神经网络(优选为卷积神经网络,更优选为基于faster-rcnn构架的神经网络)的图像识别模型进行训练(优选为有监督训练),通过预设的算法调整可训练参数,从而获得能够识别萎缩性胃炎的图像识别模型;在一个实施方案中,其中所述框选能够生成一个包含病灶部位的矩形框或正方形框;所述坐标信息优选为所述矩形框或正方形框的左上角和右下角的点的坐标信息;优选的,所述框选利用计算机软件进行。在另一个实施方案中,其中框选部位通过下述步骤确定:2n位内镜医师以“背对背”方式进行框选,即将2n人随机分成n组,2人/组,同时将所有图像随机分成n份,并随机分配给各组医师进行框选;当框选完成后,对比每组两位医师的框选结果,并对两位医师之间框选结果的一致性进行评估,最终确定框选部位,其中n为1-100之间的自然数,例如1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100;在一个具体实施方案中,所述对两位医师之间框选结果的一致性进行评估的标准如下:针对每一张病变图像,对比每组2位医师的框选结果的重叠面积,如果每组两位医师分别框选的部位重叠部分的面积(即交集)大于该两者的并集所覆盖的面积的50%,则认为2位医师的框选判断结果一致性好,并且将上述交集对应的对角线坐标保存为目标病变最终的定位;若重叠部分的面积(即交集)小于该两者的并集所覆盖的面积的50%,则认为2位医师的框选判断结果相差较大,此类病变图像被单独挑选出来,由所有参与框选工作的2n位医师共同讨论确定目标病变的最终位置;在另一个实施方案中,其中步骤S2中还预先对图像进行脱敏处理。在另一个实施方案中,其中所述图像识别模型包括:a)特征提取器所述特征提取器由X个卷积层和Y个采样层组成,其中第i个(i在1-X之间)卷积层包含个Qi个尺寸为m*m*pi的卷积核,其中m*m表示卷积核的长和宽的像素值,pi等于上一个卷积层的卷积核数量Qi-1,在第i个卷积层中,卷积核以步长L对来自上一级的数据(包括原图、第i-1个卷积层、或者采样层)进行卷积操作;每个采样层包含1个以步长2L移动的,大小为2L*2L的卷积核,对卷积层输入的图像进行卷积操作;其中,经过特征提取器进行特征提取后,最终获得Qx维的特征图;其中X在1-20之间,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20;Y在1-10之间,例如1、2、3、4、5、6、7、8、9或10;m在2-10之间,例如2、3、4、5、6、7、8、9或10;p在1-1024之间,Q在1-1024之间,p或Q的数值分别例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、32、64、128、256、512或1024;b)候选区域选定器在由原图特征提取层所提取的特征图中设置滑动窗口,滑动窗口的大小为n×n,例如3×3;使滑动窗口沿特征图滑动,同时对于滑动窗口所在的每一个位置,其中心点与原图中的相应位置存在对应关系,并以所述相应位置为中心在原图中生成k个具有不同的尺度和长宽比的候选区域;其中,如果k个候选区域具有x种(例如3种)不同的尺度和长宽比,则k=x2(例如k=9);c)目标识别器其又包括中间层,分类层和边框回归层,其中中间层,用于映射滑窗操作所形成的候选区域的数据,是一个多维(例如256维或512维)的向量;分类层和边框回归层分别与中间层连接,用于判定该目标候选区域是前景(即阳性样本)还是背景(即阴性样本),以及用于生成候选区域中心点的x坐标和y坐标、以及候选区域的宽w和高h。在另一个实施方案中,其中在步骤S3中,采用基于mini-batch的梯度下降法进行所述训练,即对每一张训练图片产生一个包含多个阳性和阴性候选区域的mini-batch;随后从每张图片中随机抽样256个候选区域直到阳性候选区域样本和阴性候选区域的比例接近1:1,随后计算对应的mini-batch的损失函数(Lossfunction);若一张图片中阳性候选区域的数量少于128个,则用阴性候选区域去填补这个mini-batch;优选的,将前50000个mini-batch的学习率设置为0.001,将后50000个本文档来自技高网...

【技术保护点】
1.一种能够识别图像中病变和/或其位置的图像识别模型的构建方法,所述病变为萎缩性胃炎,其包括下列步骤:S1.获取病变数据获得M张被确诊患有萎缩性胃炎患者的包含病变部位的图像,所述图像优选为内镜图像,从而构建训练集,其中M为1至100000之间的自然数,例如50‑50000、100‑10000、500‑7000、1000‑5000或3000‑4000之间的自然数;S2.图像预处理针对步骤S1得到的训练集,精确框选训练集中每张图像中萎缩性胃炎病变的部位,其中框选内的部分定义为阳性样本,而框选外的部分定义为阴性样本,同时记录和/或输出病变的位置坐标信息和/或病变类型信息;S3.训练图像识别模型利用经过S2步骤所述图像预处理的训练集对基于神经网络(优选为卷积神经网络,更优选为基于faster‑rcnn构架的神经网络)的图像识别模型进行训练(优选为有监督训练),通过预设的算法调整可训练参数,从而获得能够识别萎缩性胃炎的图像识别模型。

【技术特征摘要】
1.一种能够识别图像中病变和/或其位置的图像识别模型的构建方法,所述病变为萎缩性胃炎,其包括下列步骤:S1.获取病变数据获得M张被确诊患有萎缩性胃炎患者的包含病变部位的图像,所述图像优选为内镜图像,从而构建训练集,其中M为1至100000之间的自然数,例如50-50000、100-10000、500-7000、1000-5000或3000-4000之间的自然数;S2.图像预处理针对步骤S1得到的训练集,精确框选训练集中每张图像中萎缩性胃炎病变的部位,其中框选内的部分定义为阳性样本,而框选外的部分定义为阴性样本,同时记录和/或输出病变的位置坐标信息和/或病变类型信息;S3.训练图像识别模型利用经过S2步骤所述图像预处理的训练集对基于神经网络(优选为卷积神经网络,更优选为基于faster-rcnn构架的神经网络)的图像识别模型进行训练(优选为有监督训练),通过预设的算法调整可训练参数,从而获得能够识别萎缩性胃炎的图像识别模型。2.根据权利要求1所述的方法,其中所述框选能够生成一个包含病灶部位的矩形框或正方形框;所述坐标信息优选为所述矩形框或正方形框的左上角和右下角的点的坐标信息;优选的,所述框选利用计算机软件进行。3.根据权利要求1或2所述的方法,其中框选部位通过下述步骤确定:2n位内镜医师以“背对背”方式进行框选,即将2n人随机分成n组,2人/组,同时将所有图像随机分成n份,并随机分配给各组医师进行框选;当框选完成后,对比每组两位医师的框选结果,并对两位医师之间框选结果的一致性进行评估,最终确定框选部位,其中n为1-100之间的自然数,例如1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100;优选的,所述对两位医师之间框选结果的一致性进行评估的标准如下:针对每一张病变图像,对比每组2位医师的框选结果的重叠面积,如果每组两位医师分别框选的部位重叠部分的面积(即交集)大于该两者的并集所覆盖的面积的50%,则认为2位医师的框选判断结果一致性好,并且将上述交集对应的对角线坐标保存为目标病变最终的定位;若重叠部分的面积(即交集)小于该两者的并集所覆盖的面积的50%,则认为2位医师的框选判断结果相差较大,此类病变图像被单独挑选出来,由所有参与框选工作的2n位医师共同讨论确定目标病变的最终位置。4.根据权利要求1至3中任一项所述的方法,其中步骤S2中还预先对图像进行脱敏处理。5.根据权利要求1至4中任一项所述的方法,其中所述图像识别模型包括:a)特征提取器所述特征提取器由X个卷积层和Y个采样层组成,其中第i个(i在1-X之间)卷积层包含个Qi个尺寸为m*m*pi的卷积核,其中m*m表示卷积核的长和宽的像素值,pi等于上一个卷积层的卷积核数量Qi-1,在第i个卷积层中,卷积核以步长L对来自上一级的数据(包括原图、第i-1个卷积层、或者采样层)进行卷积操作;每个采样层包含1个以步长2L移动的,大小为2L*2L的卷积核,对卷积层输入的图像进行卷积操作;其中,...

【专利技术属性】
技术研发人员:陈蕾曹立宏陈雯婕张澍田朱圣韬闵力杜凤桐
申请(专利权)人:首都医科大学附属北京友谊医院中国传媒大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1