基于影像报告的CT图像肺气肿自动标注方法技术

技术编号:20548217 阅读:39 留言:0更新日期:2019-03-09 20:48
本发明专利技术涉及一种基于影像报告的CT图像肺气肿自动标注方法,步骤如下:(1)、在输入模块中完成图像影像报告、CT图像序列输入和图像标准化预处理;(2)、在语音语义提取模块中根据词典的技术和规则模式匹配技术提取影像报告中的特征信息,即有关肺气肿描述的信息;(3)、在肺气肿病灶提取模块中先对肺进行区域式划分,在肺部区域进行聚类分析提取肺气肿病灶;(4)、根据步骤3计算结果计算得到各区域CT阈值,在输出与显示模块中将各区域肺气肿区域标注出来,将肺气肿区域显示在CT图像中,并给出肺功能定量分析报告。本发明专利技术的优点效果:并且简化了肺气肿诊疗过程中的流程,降低了患者看病费用。

【技术实现步骤摘要】
基于影像报告的CT图像肺气肿自动标注方法
本专利技术涉及一种CT图像肺气肿自动标注方法,尤其涉及一种基于影像报告的CT图像肺气肿自动标注方法。
技术介绍
慢性阻塞性肺疾病(COPD),简称慢阻肺,是一种严重威胁人类健康的疾病,目前医生诊断慢阻肺的主要手段依赖于肺功能检查及CT影像扫描,但影像报告并未标出肺气肿在CT影像上的位置信息,肺功能检查也不能提供肺气肿的病灶位置信息,这导致了肺气肿的量化评估和严重程度分级依靠主观经验,这影响了患者的早期诊断,易出现漏诊和误诊,降低了诊断的有效性。目前一些CT厂商配备的后处理工作站中提供了手动量化评估工具,可以根据医生输入的CT阈值,计算可能的气肿体素并在图像上显示出来。但是该CT阈值需要依赖医生的经验进行主观设定,因此急需利用机器学习或者深度学习技术的全自动检测和量化评估工具。机器学习或者深度学习需要一定数量、具有标注信息的数据集训练模型,而依靠医生手动在CT图像标注气肿位置来建设标准数据集是不现实的。目前,对于医院来说存在有大量的影像报告和CT影像数据,但是在CT影像上并未标记出肺气肿的位置和区域大小等信息。大量医学数据:目前医院里存在一定规模COPD患者人群的CT图像和对应的影像诊断报告,但是医生未在CT图像上标出气肿的位置,也没有气肿的量化分析结果,影像诊断报告中只有对气肿的定性文字描述,没有病灶具体的位置信息。语音语义的提取:目前机器学习及深度想学习在语音语义上的应用已经进入日常生活,基于词典的技术和规则模式匹配技术,获取影像报告文本语料中的命名实体及关系。首先是信息抽取:该阶段主要使用自然语言处理技术和统计机器学习技术等来识别、标注和抽取文本中的实体信息以及挖掘实体之间的关联关系,并进行指代消解、语义消歧等任务,得到的抽取或标注的中间结果以及在抽取过程中的词典工具、词汇本体等资源。
技术实现思路
为了解决上述技术问题本专利技术提供一种基于影像报告的CT图像肺气肿自动标注方法,目的是将影像诊断报告中的肺气肿诊断结果自动标注在CT影像中。为达上述目的,本专利技术基于影像报告的CT图像肺气肿自动标注方法,步骤如下:(1)、在输入模块中完成图像影像报告、CT图像序列输入和图像标准化预处理;(2)、在语音语义提取模块中根据词典的技术和规则模式匹配技术提取影像报告中的特征信息,即有关肺气肿描述的信息;(3)、在肺气肿病灶提取模块中先对肺进行区域式划分,右肺由上自下每个区域的宽度相同,左肺在中间将分成两个区域;然后在肺部区域进行聚类分析提取肺气肿病灶;(4)、根据步骤3计算结果计算得到各区域CT阈值,在输出与显示模块中将各区域肺气肿区域标注出来,然后根据各区域CT阈值对各区域肺气肿及健康区域进行蒙色,同时对各区域肺气肿病灶位置精确定位,将肺气肿区域显示在CT图像中,并给出肺功能定量分析报告。所述的步骤2中影像报告中病灶信息的提取经过文本信息抽取得到文本特征,然后经过人工标注和众包方法标注文本特征,最后将标注的特征与建立的医疗词典库进行对比得到病灶结果信息。所述的步骤3分别采用均值聚类、高斯混合模型聚类、基于密度噪声的聚类以及凝聚层次聚类的方法区分健康组织和气肿组织,最后利用投票法选出均值聚类、高斯混合模型聚类、基于密度噪声的聚类以及凝聚层次聚类其中的一种进行区分健康组织和气肿组织,并确定气肿位置。所述的均值聚类算法为:CT图像序列,提取输入数据点集;从N个数据随机选取K个数据作为聚类质心;对剩余的每个数据测量其到每个质心的距离,并把它归到最近的质心的类;重新计算已经得到的各个类的质心;迭代2~4步直至新的质心与原质心相等或小于指定阈值,算法结束;其中数据分配过程中公式:Si={xp:||xp-mi||2≤||xp-mj||2Si为第i个数据点集,Xp待确定数据点,mi,mj为kmeans的第i,j个重心点;数据更新过程:在计算到第t次的时候,第mi的重心为当前所有属于点集Si的欧式距离xi的均值,求和计算新中心点,直至中心点不再变化或者达到最大循环次数。所述的对于高斯混合模型,分类的个数即为高斯模型的个数,把单高斯概率密度函数定义为:其中θ=(μ,σ2),μ,σ2分别表示样本均值和方差,y表示数据高斯密度;多个高斯混合模型组合定义如下:其中,αk是样本集合中k类被选中的概率:αk=P(z=k|θ),其中z=k指的是样本属于k类,那么φ(y|θk)=P(y|z=k,θ),显然αk≥0,y是观测值;计算出μ,σ2就可以得到多个类的分布情况。所述的基于密度的噪声应用空间聚类算法:从未被访问的任意数据开始,计算该点邻域(e)内所有点数量,若有足够多数量的点,则开始聚类,否则将改点标记为噪声;对于新簇中的第一点,它的领域(e)内的点也会成为同簇的一部分;这个过程是邻域(e)内的所有点属于同一类,不断重复上述过程,至所有点被标记。所述的凝聚层次聚类为对给定的数据集进行层次的分解,直到某种条件满足为止;在已经得到距离值之后,元素间被联系起来,通过分离和融合构建一个结构;首先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,直到某个终结条件被满足。本专利技术的优点效果:将影像报告的气肿的位置、严重程度等信息直观的显示在CT图像上,那么不仅可以节约医生诊断的时间、提高诊断效率,同时可以满足肺气肿病灶自动标注的需求,大幅减轻医生标注图像数据的工作量,该方法在建设呼吸系统疾病的标准影像数据集方面具有重要意义。并且简化了肺气肿诊疗过程中的流程,降低了患者看病费用。附图说明图1是本专利技术的工作流程图。图2是步骤工作流程图。图3是均值聚类的工作流程图。图4是根据图3得出的肺部各感兴趣的CT阈值。图5是高斯混合模型的工作流程图。图6是图5得出的肺部各感兴趣的CT阈值。图7基于密度的噪声应用空间聚的工作流程图。图8是图7得出的肺部各感兴趣的CT阈值。图9凝聚层次聚类的工作流程图。图10是图9得出的肺部各感兴趣的CT阈值。图11为源数据。图12为对图11源数据进行聚类的结果。具体实施方式下面结合附图对本专利技术作进一步说明。应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。如图所示,基于影像报告的CT图像肺气肿自动标注方法,步骤如下:(1)、在输入模块中完成图像影像报告报告、CT图像序列输入和图像标准化预处理;(2)、在语音语义提取模块中根据词典的技术和规则模式匹配技术提取影像报告中的特征信息,即有关肺气肿描述的信息;(3)、在肺气肿病灶提取模块中先对肺进行区域式划分,右肺由上自下每个区域的宽度相同,左肺在中间将分成两个区域;然后在肺部区域进行聚类分析提取肺气肿病灶;(4)、根据步骤3计算结果计算得到各区域CT阈值,在输出与显示模块中将各区域肺气肿区域标注出来,然后根据各区域CT阈值对各区域肺气肿及健康区域进行蒙色,同时对各区域肺气肿病灶位置精确定位,将肺气肿区域显示在CT图像中,并给出肺功能定量分析报告。所述的步骤2中影像报告中病灶信息的提取经过文本信息抽取得到文本特征,然后经过人工标注和众包方法标注文本特征,最后将标注的特征与建立的医疗词典库进行对比得到病灶结果信息。所述的步骤3分别采用均值聚类、高斯混合模型聚类、基于密度噪声的聚类以及凝聚层次聚类的方法区分健康组织和气肿组织本文档来自技高网
...

【技术保护点】
1.基于影像报告的CT图像肺气肿自动标注方法,其特征在于步骤如下:(1)、在输入模块中完成图像影像报告、CT图像序列输入和图像标准化预处理;(2)、在语音语义提取模块中根据词典的技术和规则模式匹配技术提取影像报告中的特征信息,即有关肺气肿描述的信息;(3)、在肺气肿病灶提取模块中先对肺进行区域式划分,右肺由上自下每个区域的宽度相同,左肺在中间将分成两个区域;然后在肺部区域进行聚类分析提取肺气肿病灶;(4)、根据步骤3计算结果计算得到各区域CT阈值,在输出与显示模块中将各区域肺气肿区域标注出来,然后根据各区域CT阈值对各区域肺气肿及健康区域进行蒙色,同时对各区域肺气肿病灶位置精确定位,将肺气肿区域显示在CT图像中,并给出肺功能定量分析报告。

【技术特征摘要】
1.基于影像报告的CT图像肺气肿自动标注方法,其特征在于步骤如下:(1)、在输入模块中完成图像影像报告、CT图像序列输入和图像标准化预处理;(2)、在语音语义提取模块中根据词典的技术和规则模式匹配技术提取影像报告中的特征信息,即有关肺气肿描述的信息;(3)、在肺气肿病灶提取模块中先对肺进行区域式划分,右肺由上自下每个区域的宽度相同,左肺在中间将分成两个区域;然后在肺部区域进行聚类分析提取肺气肿病灶;(4)、根据步骤3计算结果计算得到各区域CT阈值,在输出与显示模块中将各区域肺气肿区域标注出来,然后根据各区域CT阈值对各区域肺气肿及健康区域进行蒙色,同时对各区域肺气肿病灶位置精确定位,将肺气肿区域显示在CT图像中,并给出肺功能定量分析报告。2.根据权利要求1所述的基于影像报告的CT图像肺气肿自动标注方法,其特征在于步骤2中影像报告中病灶信息的提取经过文本信息抽取得到文本特征,然后经过人工标注和众包方法标注文本特征,最后将标注的特征与建立的医疗词典库进行对比得到病灶结果信息。3.根据权利要求1所述的基于影像报告的CT图像肺气肿自动标注方法,其特征在于步骤3分别采用均值聚类、高斯混合模型聚类、基于密度噪声的聚类以及凝聚层次聚类的方法区分健康组织和气肿组织,最后利用投票法选出均值聚类、高斯混合模型聚类、基于密度噪声的聚类以及凝聚层次聚类其中的一种进行区分健康组织和气肿组织,并确定气肿位置。4.根据权利要求3所述的基于影像报告的CT图像肺气肿自动标注方法,其特征在于均值聚类算法为:CT图像序列,提取输入数据点集;从N个数据随机选取K个数据作为聚类质心;对剩余的每个数据测量其到每个质心的距离,并把它归到最近的质心的类;重新计算已经...

【专利技术属性】
技术研发人员:夏书月康雁何巍孙龙昊李强陈磊
申请(专利权)人:沈阳医学院附属中心医院
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1