用于内窥镜和腹腔镜导航的同时场景解析和模型融合的方法和系统技术方案

技术编号：17216118 阅读：39 留言：0更新日期：2018-02-08 02:03

公开了一种用于在腹腔镜和内窥镜2D/2.5D图像数据中进行场景解析和模型融合的方法和系统。接收包括2D图像通道和2.5D深度通道的术中图像流的当前帧。在术前3D医学图像数据中分割的目标器官的3D术前模型被融合到术中图像流的当前帧中。基于目标器官的融合术前3D模型，将来自术前3D医学图像数据的语义标签信息传播到术中图像流的当前帧中的多个像素中的每个像素，从而产生用于术中图像流的当前帧的渲染标签图。语义分类器基于用于术中图像流的当前帧的渲染标签图来训练。

Method and system for simultaneous scene analysis and model fusion for endoscope and laparoscopic navigation

A method and system for scene analysis and model fusion in the laparoscopic and endoscope 2D/2.5D image data are disclosed. The current frame of the image stream including the 2D image channel and the 2.5D depth channel is received. The 3D preoperation model of the target organs divided in the preoperative 3D medical image data is fused into the current frame of the intraoperative image flow. Based on the 3D model of target organ fusion before operation, the semantic label information of 3D medical image data will be propagated to every pixel in the multiple pixels of the current frame of the intraoperative image stream in the future, so as to generate the rendering label map for the current frame of intraoperative image stream. The semantic classifier is trained based on the rendering of the current frame, which is used for the image flow in the operation.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于内窥镜和腹腔镜导航的同时场景解析和模型融合的方法和系统
本专利技术涉及腹腔镜或内窥镜图像数据中的语义分割和场景解析，并且更具体地，涉及使用分割的术前图像数据在腹腔镜和内窥镜图像流中同时进行场景解析和模型融合。
技术介绍
在微创外科手术期间，图像序列为经采集以引导外科手术的腹腔镜或内窥镜图像。可以采集多个2D/2.5D图像并将其拼接在一起以生成所观察到的关注器官的3D模型。然而，由于摄像头和器官移动的复杂性，精确的3D拼接是具有挑战性的，因为这种3D拼接需要对腹腔镜或内窥镜图像序列的连续帧之间的对应关系进行稳健的估算。
技术实现思路
本专利技术提供一种用于使用分割术前图像数据在术中图像流如腹腔镜或内窥镜图像流中同时进行场景解析和模型融合的方法和系统。本专利技术的实施方式利用目标器官的术前和术中模型的融合来促进采集术中图像流的采集帧的特定场景语义信息。本专利技术的实施方式自动地将来自术前图像数据的语义信息传播到术中图像流的各个帧，并且随后可以使用具有语义信息的帧来训练用于执行对输入的术中图像的语义分割的分类器。在本专利技术的一个实施方式中，接收包括2D图像通道和2.5D深度通道的术中图像流的当前帧。在术前3D医学图像数据中分割的目标器官的3D术前模型被融合到术中图像流的当前帧中。基于目标器官的融合术前3D模型，将来自术前3D医学图像数据的语义标签信息传播到术中图像流的当前帧中的多个像素中的每个像素，从而产生用于术中图像流的当前帧的渲染标签图。语义分类器基于用于术中图像流的当前帧的渲染标签图来训练。通过参考下面的详细描述和附图，本专利技术的这些和其它优点对于本领...
用于内窥镜和腹腔镜导航的同时场景解析和模型融合的方法和系统

【技术保护点】
一种用于在术中图像流中进行场景解析的方法，包括：接收包括2D图像通道和2.5D深度通道的术中图像流的当前帧；将在术前3D医学图像数据中分割的目标器官的3D术前模型融合到所述术中图像流的所述当前帧；基于所述目标器官的所述融合术前3D模型，将来自所述术前3D医学图像数据的语义标签信息传播到所述术中图像流的所述当前帧中的多个像素中的每个像素，从而产生所述术中图像流的所述当前帧的渲染标签图；以及基于用于所述术中图像流的所述当前帧的所述渲染标签图来训练语义分类器。

【技术特征摘要】
【国外来华专利技术】1.一种用于在术中图像流中进行场景解析的方法，包括：接收包括2D图像通道和2.5D深度通道的术中图像流的当前帧；将在术前3D医学图像数据中分割的目标器官的3D术前模型融合到所述术中图像流的所述当前帧；基于所述目标器官的所述融合术前3D模型，将来自所述术前3D医学图像数据的语义标签信息传播到所述术中图像流的所述当前帧中的多个像素中的每个像素，从而产生所述术中图像流的所述当前帧的渲染标签图；以及基于用于所述术中图像流的所述当前帧的所述渲染标签图来训练语义分类器。2.根据权利要求1所述的方法，其中，将在术前3D医学图像数据中分割的目标器官的3D术前模型融合到所述术中图像流的所述当前帧包括：在所述术前3D医学图像数据与所述术中图像流之间执行初始非刚性配准；以及使用所述目标器官的计算生物力学模型使所述目标器官的所述3D术前模型变形以将所述术前3D医学图像数据与所述术中图像流的所述当前帧对准。3.根据权利要求2所述的方法，其中，在所述术前3D医学图像数据与所述术中图像流之间执行初始非刚性配准包括：拼接所述术中图像流的多个帧以生成所述目标器官的3D术中模型；以及在所述目标器官的所述3D术前模型与所述目标器官的所述3D术中模型之间执行刚性配准。4.根据权利要求2所述的方法，其中，使用所述目标器官的计算生物力学模型使所述目标器官的所述3D术前模型变形以将所述术前3D医学图像数据与所述术中图像流的所述当前帧对准包括：使用所述目标器官的所述计算生物力学模型使所述目标器官的所述3D术前模型变形，以将所述术前3D医学图像数据与所述术中图像流的所述当前帧的所述2.5D深度通道中的深度信息对准。5.根据权利要求2所述的方法，其中，使用所述目标器官的计算生物力学模型使所述目标器官的所述3D术前模型变形以将所述术前3D医学图像数据与所述术中图像流的所述当前帧对准包括：估算所述目标器官的所述3D术前模型与所述当前帧中的所述目标器官之间的对应关系；根据所述对应关系估算所述目标器官上的力；以及使用所述目标器官的所述计算生物力学模型基于估算的力来模拟所述目标器官的所述3D术前模型的变形。6.根据权利要求1所述的方法，其中，基于所述目标器官的所述融合术前3D模型，将来自所述术前3D医学图像数据的语义标签信息传播到所述术中图像流的所述当前帧中的多个像素中的每个像素，从而产生所述术中图像流的所述当前帧的渲染标签图包括：基于所述目标器官的所述融合术前3D模型，将所述术前3D医学图像数据与所述术中图像流的所述当前帧对准；基于所述当前帧的姿态来估算对应于所述术中图像流的所述当前帧的所述3D医学图像数据中的投影图像；以及通过将来自所述3D医学图像数据中的所述估算的投影图像中的多个像素位置中的每个像素位置的语义标签传播到所述术中图像流的所述当前帧中的所述多个像素中的对应像素术中来渲染所述术中图像流的所述当前帧的渲染标签图。7.根据权利要求1所述的方法，其中，基于用于所述术中图像流的所述当前帧的所述渲染标签图来训练语义分类器的过程包括：基于用于所述术中图像流的所述当前帧的所述渲染标签图来更新经训练的语义分类器。8.根据权利要求1所述的方法，其中，基于用于所述术中图像流的所述当前帧的所述渲染标签图来训练语义分类器包括：针对所述术中图像流的所述当前帧，在所述渲染标签图中的一个或多个经标记的语义类别中的每个语义类别中对所述训练样本进行采样；以及针对所述术中图像流的所述当前帧，基于所述渲染标签图中的所述一个或多个经标记的语义类别中的每个语义类别中的所述训练样本来训练所述语义分类器。9.根据权利要求8所述的方法，其中，针对所述术中图像流的所述当前帧，基于所述渲染标签图中的所述一个或多个经标记的语义类别中的每个语义类别中的所述训练样本来训练所述语义分类器的过程包括：从所述术中图像流的所述当前帧中的每个训练样本周围的对应图像块中的所述2D图像通道和所述2.5D深度通道提取统计特征；以及针对每个训练样本以及与所述渲染标签图中的每个训练样本相关联的语义标签，基于所提取的统计特征来训练所述语义分类器。10.根据权利要求8所述的方法，还包括：使用经训练的语义分类器对所述术中图像流的所述当前帧执行语义分割。11.根据权利要求10所述的方法，还包括：将使用所述经训练的分类器对所述当前帧执行语义分割所产生的标签图与用于所述当前帧的所述渲染标签图进行比较；以及使用从所述一个或多个语义类别中的每个语义类别中采样的附加训练样本重复所述语义分类器的训练，并且使用所述经训练的语义分类器执行所述语义分割，直到使用所述经训练的分类器对所述当前帧执行语义分割产生的所述标签图收敛于所述当前帧的所述渲染标签图。12.根据权利要求11所述的方法，其中，所述附加训练样本选自在使用所述经训练的分类器对所述当前帧执行语义分割所产生的所述标签图中被错误分类的所述术中图像流的所述当前帧中的像素。13.根据权利要求10所述的方法，还包括：使用从所述一个或多个语义类别中的每个语义类别采样的附加训练样本重复所述语义分类器的训练，并且使用所述经训练的语义分类器执行所述语义分割，直到所述目标器官的姿态收敛在使用所述经训练的分类器对所述当前帧执行语义分割所产生的所述标签图中。14.根据权利要求1所述的方法，还包括：针对所述术中图像流的一个或多个后续帧中的每个后续帧，重复所述接收、融合、传播和训练步骤。15.根据权利要求1所述的方法，还包括：接收所述术中图像流的一个或多个后续帧；以及使用所述经训练的语义分类器在所述术中图像流的所述一个或多个后续帧中的每个后续帧中执行语义分割。16.根据权利要求15所述的方法，还包括：基于所述术中图像流的所述一个或多个后续帧中的每个后续帧的所述语义分割结果，拼接所述术中图像流的所述一个或多个后续帧以生成所述目标器官的术中3D模型。17.一种用于在术中图像流中进行场景解析的设备，包括：用于接收包括2D图像通道和2.5D深度通道的术中图像流的当前帧的装置；用于将在术前3D医学图像数据中分割的目标器官的3D术前模型融合到所述术中图像流的所述当前帧的装置；用于基于所述目标器官的所述融合术前3D模型，将来自所述术前3D医学图像数据的语义标签信息传播到所述术中图像流的所述当前帧中的多个像素中的每个像素，从而产生所述术中图像流的所述当前帧的渲染标签图的装置；以及用于基于所述术中图像流的所述当前帧的所述渲染标签图来训练语义分类器的装置。18.根据权利要求17所述的设备，其中，所述用于将在术前3D医学图像数据中分割的目标器官的3D术前模型融合到所述术中图像流的所述当前帧的装置包括：用于在所述术前3D医学图像数据与所述术中图像流之间执行初始非刚性配准的装置；以及用于使用所述目标器官的计算生物力学模型使所述目标器官的所述3D术前模型变形以将所述术前3D医学图像数据与所述术中图像流的所述当前帧对准的装置。19.根据权利要求17所述的设备，其中，所述用于基于所述术中图像流的所述当前帧的所述渲染标签图来训练语义分类器的装置包括：用于基于所述术中图像流的所述当前帧的所述渲染标签图来更新经训练的语义分类器的装置。20.根据权利要求17所述的设备，其中，所述用于基于所述术中图像流的所述当前帧的所述渲染标签图来训练语义分类器的装置包括：用于针对所述术中图像流的所述当前帧，在所述渲染标签图中的一个或多个经标记的语义类别中的每个语义类别中对所述训练样本进行采样的装置；以及用于针对所述术中图像流的所述当前帧，基于所述渲染标签图中的所述一个或多个经标记的语义类别中的每个语义类别中的所...

【专利技术属性】
技术研发人员：斯特凡·克卢克纳，阿里·卡门，陈德仁，
申请(专利权)人：西门子公司，
类型：发明
国别省市：德国,DE

全部详细技术资料下载我是这个专利的主人