训练肺部内窥镜图像识别模型的方法及识别方法技术

技术编号：35744788 阅读：15 留言：0更新日期：2022-11-26 18:49

本发明专利技术公开了训练肺部内窥镜图像识别模型的方法及识别方法，所述方法包括数据集的构建和神经网络模型的构建，并在构建的识别模型的方法上进行肺部内窥镜图像识别，所述神经网络模型为YOLOv5模型结合LSTM构建而成的SeqYOLO，来对内窥镜视频进行识别，即通过人工智能深度学习算法来训练出专用于识别肺部内窥镜的模型，医生在使用搭载了此项技术的内窥镜时，可通过终端屏幕直观得知内窥镜所处位置信息，减少人为判断的时间，提升手术的效率，缩短手术时长，减少病人的痛苦。减少病人的痛苦。减少病人的痛苦。

全部详细技术资料下载

【技术实现步骤摘要】
训练肺部内窥镜图像识别模型的方法及识别方法

[0001]本专利技术涉及神经网络
，尤其涉及一种训练肺部内窥镜图像识别模型的方法及识别方法。

技术介绍

[0002]肺部内窥镜检查是将细长的内窥镜经口或鼻置入患者的下呼吸道，即经过声门进入气管和支气管以及更远端，直接观察气管和支气管的病变，并根据病变进行相应的检查和治疗。
[0003]肺部气管和支气管结构类似倒置的一株大树，有许多的分岔口，即时经过专业训练的外科医生，在检查过程中容易迷路，因此手术时间变长，延长了病人手术过程中的不适感，只有经验丰富的医生才能对手术得心应手。
[0004]现阶段只靠人工观察内窥镜图像判断所处位置，寻找前进的管道，容易因经验不足导致无法准确判断内窥镜当前所处位置。

技术实现思路

[0005]本专利技术目的在于提供一种通过内窥镜图像自动识别并标注内窥镜探头当前所处的肺部气管位置的训练肺部内窥镜图像识别模型的方法及识别方法。
[0006]为实现上述目的，本专利技术的技术方案如下：一种训练肺部内窥镜图像识别模型的方法，方法包括数据集的构建和神经网络模型的构建，并通过构建的数据集的80%的样本数据对神经网络模型进行训练，训练完成后通过数据集的剩下的20%的样本数据进行检验后进行部署，并使用mAP0.5 作为在内窥镜图像目标检测任务上衡量准确度的评价指标。
[0007]数据集的构建为：从若干支气管镜视频中截取的若干清晰的支气管镜图像，并分为多个类别，继而通过绘制一个或多个边界框的方式进行标记，最后通...

【技术保护点】

【技术特征摘要】
1.一种训练肺部内窥镜图像识别模型的方法，其特征在于：所述方法包括数据集的构建和神经网络模型的构建，并通过构建的数据集的80%的样本数据对神经网络模型进行训练，训练完成后通过数据集的剩下的20%的样本数据进行检验后进行部署，并使用mAP0.5 作为在内窥镜图像目标检测任务上衡量准确度的评价指标；所述数据集的构建为：从若干支气管镜视频中截取的若干清晰的支气管镜图像，并分为多个类别，继而通过绘制一个或多个边界框的方式进行标记，最后通过数据增强的方式构建而成；所述数据集进行数据增强包括增强强度高中低三个不同等级；所述神经网络模型为YOLOv5模型结合LSTM构建而成的SeqYOLO；所述SeqYOLO的代码以YOLOv5来建立基准，由YOLOv5部分提供目标检测能力，同时引入了新的LSTM模块来学习到视频中具有时间序列关系的信息；所述SeqYOLO将一个视频序列中的每一帧分别通过YOLO backbone得到图像特征值，并将这些特征值使用LSTM模型进行计算，以学习到视频中具有时间序列关系的信息，LSTM在读取完整个序列的图像特征值后会输出一个进行推理的图像对应的图像特征值，YOLO系列算法中的 head组件，使用该图像特征值进行推理并计算出具体的图像检测框与框中物体类别。2.根据权利要求1所述的一种训练肺部内窥镜图像识别模型的方法，其特征在于：所述数据集分类包含18个类别，分别为：会厌软骨、声带、主气管、左主支气管、隆突、右主支气管、左上叶支气管、左下叶支气管、右上叶支气管、右中间支气管、右下叶支气管、左固有上叶支气管、左舌叶支气管、左下叶背段支气管、左下叶基底段支气管、右中叶气管、右下叶基底段支气管和右下叶背段支气管。3.根据权利要求1所述的一种训练肺部内窥镜图像识别模型的方法，其特征在于：所述YOLOv5模型结构主要分为两部分，分别为用来提取信息的YOLOv5 Backbone 与用来回归检测框的独立的YOLOv5模块，称为YOLOv5 Head。4.根据权利要求1所述的一种训练肺部内窥镜图像识别模型的方法，其特征在于：所述SeqYOLO在读入连续的视频帧信息后，给出最后一个帧图像的预测结果，即首先使用YOLO backbone 对图像进行特征提取，并将得到的特征值输入LSTM模型进行时间序列学习，LSTM中学习每一帧的特征信息，并保留对下一帧预测有用的信息，在读入最后一帧后，LSTM会输出最后综合前面所有帧信息与最后一帧信息的整体视频片段特征值，该特征值将会使用YOLO head结构进行检测框与对象类别的识别。5.根据权利要求1所述的一种训练肺部内窥镜图像识别模型的方法，其特征在于：SeqYOLO模型的训练分为两个阶段：第一阶段、先使用YOLOv5模型对单张有标签的图片进行训练，使mAP0.5达到一个相对准确的值，在该阶段获得到模型的backbone和head两个组件的权重，用于下一阶段模型权重的初始化；第二阶段、构建的SeqYOLO模型将前一个阶段获得的YOLO backbone和 YOLO head两部分权重迁移至SeqYOLO中对应部分，该阶段训练使用视频数据进行训练，即为连续的视频帧输入模型，采用了间隔取帧的方法获得20帧的图像输入进SeqYOLO...

【专利技术属性】
技术研发人员：方传煜，严建祺，刘淳奇，
申请(专利权)人：珠海市圈宝网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人