用于医学图像中文本区域检测的方法及装置制造方法及图纸

技术编号:14349996 阅读:107 留言:0更新日期:2017-01-04 20:43
本发明专利技术公开一种用于医学图像中文本区域检测的方法及装置,能够提高文本区域的检测精度。所述方法包括:S1、获取待检测的医学图像;S2、对所述医学图像进行检测,得到一系列的连通区域,并且基于单样例图像得到所述医学图像中文本区域的二值模板;S3、利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域,并基于字符特征进一步滤除所述文本候选区域中的非文本区域;S4、将得到的文本区域进行聚合,得到文本行。

【技术实现步骤摘要】

本专利技术涉及医学图像检测
,具体涉及一种用于医学图像中文本区域检测的方法及装置
技术介绍
医学影像图像是由一定数目由黑到白不同灰度的像素按矩阵排列所构成的图像。它反映了器官和组织在特定影像设备上的成像情况,可以很好的显示由软组织构成的器官,如脑、脊髓、纵膈、肺、肝、胆、胰以及盆部器官等,并在良好的解剖图像背景上显示出病变的影像,因此医学影像在医学诊断上具有非常重要的应用价值。原始的医学影像除了图像本身外,还会将患者信息等附加数据按照一定标准(如DICOM)以元数据形式保存。这些数据与图像是分别保存的。经分析的医疗影像经过转换打印输出用于诊断与保存。与原始影像不同,这类用于输出的医学图像上除了器官的层面图像外,还会将附加信息以文字图样形式直接叠加到医学影像上。这些文字往往包含了患者姓名、检测时间以及检测指标等信息,为我们准确解读医学图像提供了重要的价值,因此检测这些医学图像中文字所在的位置,将其提取出来有着重要的意义。现有技术一般使用MSER、SWT等方法进行医学图像中文本区域检测,但是此种方法是依据纹理特征进行检测的,不容易将图像中字符纹理与其它纹理进行区分,造成检测精度较低。
技术实现思路
针对现有技术存在的不足和缺陷,本专利技术提供一种用于医学图像中文本区域检测的方法及装置。一方面,本专利技术实施例提出一种用于医学图像中文本区域检测的方法,包括:S1、获取待检测的医学图像;S2、对所述医学图像进行检测,得到一系列的连通区域,并且基于单样例图像得到所述医学图像中文本区域的二值模板;S3、利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域,并基于字符特征进一步滤除所述文本候选区域中的非文本区域;S4、将得到的文本区域进行聚合,得到文本行。另一方面,本专利技术实施例提出一种用于医学图像中文本区域检测的装置,包括:获取单元,用于获取待检测的医学图像;计算单元,用于对所述医学图像进行检测,得到一系列的连通区域,并且基于单样例图像得到所述医学图像中文本区域的二值模板;滤除单元,用于利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域,并基于字符特征进一步滤除所述文本候选区域中的非文本区域;聚合单元,用于将得到的文本区域进行聚合,得到文本行。本专利技术实施例提供的用于医学图像中文本区域检测的方法及装置,利用待检测的医学图像中文本区域的二值模板滤除掉连通区域中的非文本区域得到文本候选区域,基于字符特征进一步滤除所述文本候选区域中的非文本区域,并将得到的文本区域进行聚合,得到文本行,相较于现有技术,本专利技术实施例不需要区分纹理特征,能够提高文本区域的检测精度。附图说明图1为本专利技术用于医学图像中文本区域检测的方法一实施例的流程示意图;图2为本专利技术用于医学图像中文本区域检测的装置一实施例的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参看图1,本实施例公开一种用于医学图像中文本区域检测的方法,包括:S1、获取待检测的医学图像;S2、对所述医学图像进行检测,得到一系列的连通区域,并且基于单样例图像得到所述医学图像中文本区域的二值模板;需要说明的是,对所述医学图像进行检测可以采用MSER算法,此处不再赘述。单样例图像是指包含文本对象的医学图像,能够充分体现医学图像中的文本特征。在具体应用中,所述基于单样例图像得到所述医学图像中文本区域的二值模板,可以包括:计算所述单样例图像R的局部自适应回归核KR,并且对于每一个连通区域T,计算该连通区域T的局部自适应回归核KT;对所述KR进行归一化处理得到权值向量矩阵WR,对所述KT进行归一化处理得到权值向量矩阵WT;对所述WR采用PCA算法(主成份分析法)进行处理,得到主成分,并保留所述主成分的前d项构成矩阵PR,将所述WR向所述PR进行投影,得到所述单样例图像R的特征向量FR,将所述WT向所述PR进行投影,得到所述连通区域T的特征向量FT;其中,所述d为整数,具体可以根据需要进行取值,比如可以取值4、5、6等,本专利技术实施例对此不作限定。将所述WR向所述PR进行投影的函数表达式为将所述WT向所述PR进行投影的函数表达式为计算所述特征向量FR与FT之间的相似度,判断所述相似性度量是否大于第一数值,若大于所述第一数值,则将对应的连通区域的像素值置为1,得到文本区域,否则,则将对应的连通区域的像素值置为0,得到背景区域,将所述文本区域和背景区域作为所述二值模板。在具体应用中,需要说明的是,计算相似度可以采用余弦相似度度量进行计算,此处不再赘述。按照医学图像中文本字体的不同第一数值可以有不同的取值,比如若医学图像中文本为宋体,则第一数值可以为70%,当然也可以根据需要进行左右调整,本实施例对此不作限定。另外,可以理解的是,本实施例计算二值模板的过程其实质是计算单样例图像的特征向量和每一个连通区域之间的相似度,根据相似度的大小建立对应的连通区域大小的全黑或者全白的二值模板。S3、利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域,并基于字符特征进一步滤除所述文本候选区域中的非文本区域;本实施例中,利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域,具体是说将连通区域中的背景区域的像素值置为0,得到文本候选区域,其处理过程相应的数学表达式为Ican=Imask∩IMSER,其中,Ican为文本候选区域,Imask为二值模板,IMSER为连通区域。具体地,所述基于字符特征进一步滤除所述文本候选区域中的非文本区域,可以包括:对于每一个文本候选区域,计算该文本候选区域的笔划宽度特征SW,并保留笔划宽度特征SW小于第二数值的文本候选区域,其中,所述笔划宽度特征SW的计算公式为SW=stdE---(1)]]>式中,std和E分别是该文本候选区域的笔划宽度标准差和平均值;一般情况下,因单个字符的笔划宽度大致保持一致,使得文本候选区域的笔划宽度标准差和平均值的比值较小,借助于这一特点可以将部分非文本区域滤除。需要说明的是,第二数值的取值与字符的笔画宽度有关,字符的笔画宽度越大,则该值取值相应增大,一般情况下取值可以为0.5-1,5。计算得到的文本候选区域的非零像素的个数,滤除非零像素的个数大于第三数值和小于第四数值的文本候选区域;在具体应用中,第三数值和第四数值的取值与文本候选区域的像素数目有关,一般情况下取值分别可以为文本候选区域的像素数目的0.9倍和0.5倍。计算得到的文本候选区域的非零像素的个数与对应的文本候选区域的区域面积的比值,滤除比值大于第五数值和小于第六数值的文本候选区域;在具体应用中,第五数值和第六数值的取值一般情况下可以分别为70%和10%。计算得到的文本候选区域的的长宽比,滤除掉长宽比大于第七数值和小于第八数值的文本候选区域;在具体应用中,第七数值和第八数值的取值一般情况下可以分别为1.2和0.5。对于得到的每一个文本候选区域,利用投影法或者连通区域法对该文本候选区域本文档来自技高网...
用于医学图像中文本区域检测的方法及装置

【技术保护点】
一种用于医学图像中文本区域检测的方法,其特征在于,包括:S1、获取待检测的医学图像;S2、对所述医学图像进行检测,得到一系列的连通区域,并且基于单样例图像得到所述医学图像中文本区域的二值模板;S3、利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域,并基于字符特征进一步滤除所述文本候选区域中的非文本区域;S4、将得到的文本区域进行聚合,得到文本行。

【技术特征摘要】
1.一种用于医学图像中文本区域检测的方法,其特征在于,包括:S1、获取待检测的医学图像;S2、对所述医学图像进行检测,得到一系列的连通区域,并且基于单样例图像得到所述医学图像中文本区域的二值模板;S3、利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域,并基于字符特征进一步滤除所述文本候选区域中的非文本区域;S4、将得到的文本区域进行聚合,得到文本行。2.根据权利要求1所述的方法,其特征在于,所述基于单样例图像得到所述医学图像中文本区域的二值模板,包括:计算所述单样例图像R的局部自适应回归核KR,并且对于每一个连通区域T,计算该连通区域T的局部自适应回归核KT;对所述KR进行归一化处理得到权值向量矩阵WR,对所述KT进行归一化处理得到权值向量矩阵WT;对所述WR采用PCA算法进行处理,得到主成分,并保留所述主成分的前d项构成矩阵PR,将所述WR向所述PR进行投影,得到所述单样例图像R的特征向量FR,将所述WT向所述PR进行投影,得到所述连通区域T的特征向量FT,其中,所述d为整数;计算所述特征向量FR与FT之间的相似度,判断所述相似性度量是否大于第一数值,若大于所述第一数值,则将对应的连通区域的像素值置为1,得到文本区域,否则,则将对应的连通区域的像素值置为0,得到背景区域,将所述文本区域和背景区域作为所述二值模板。3.根据权利要求1或2所述的方法,其特征在于,所述基于字符特征进一步滤除所述文本候选区域中的非文本区域,包括:对于每一个文本候选区域,计算该文本候选区域的笔划宽度特征SW,并保留笔划宽度特征SW小于第二数值的文本候选区域,其中,所述笔划宽度特征SW的计算公式为SW=stdE---(1)]]>式中,std和E分别是该文本候选区域的笔划宽度标准差和平均值;计算得到的文本候选区域的非零像素的个数,滤除非零像素的个数大于第三数值和小于第四数值的文本候选区域;计算得到的文本候选区域的非零像素的个数与对应的文本候选区域的区域面积的比值,滤除比值大于第五数值和小于第六数值的文本候选区域;计算得到的文本候选区域的的长宽比,滤除掉长宽比大于第七数值和小于第八数值的文本候选区域;对于得到的每一个文本候选区域,利用投影法或者连通区域法对该文本候选区域进行切分,得到多个小块,并确定每一个小块是否是字符,计算是字符的小块所占的比值,滤除比值小于第九数值的文本候选区域。4.根据权利要求1所述的方法,其特征在于,所述S4,包括:对于得到的文本区域中每一个未被聚合的文本区域A,选取其它未被聚合的文本区域中的一个未被聚合的文本区域B,判断该两个文本区域A和B是否能够聚合,若能够聚合,则将该两个文本区域A和B进行聚合,得到文本区域C,再从其它未被聚合的文本区域中选取一个未被聚合的文本区域D,判断所述文本区域C和D是否能够聚合,若能够聚合,则将该两个文本区域C和D进行聚合,重复上述选取文本区域、判断是否能够聚合以及聚合的步骤直至未被聚合的文本区域选取完毕。5.根据权利要求4所述的方法,其特征在于,所述判断该两个文本区域A和B是否能够聚合,包括:S40、计算该两个文本区域A和B之间的垂直距离,判断所述垂直距离是否小于第十数值,若小于所述第十数值,则执行步骤S41,否则,执行步骤S42;S41、计算所述两个文本区域A和B中像素的横坐标较大的文本区域包含的像素的最小横坐标与所述两个文本区域A和B中像素的横坐标较小的文本区域包含的像素的最大横坐标的差值的绝对值,判断所述绝对值是否小于第十一数值,若小于所述第十一数值,则将所述像素的横坐标较大的文本区域聚合在所述像素的横坐标较小的文本区域后面;S42、判断所述垂直距离是否小于第十一数值,若小于所述第十一数值,则计算所述两个文本区域A和B中一个文本区域包含的像素的最小横坐标与另一个文本区域包含的像素的最小横坐标的差值的绝对值,判断所述绝对值是否小于第十数值,若小于所述第十数值,则将所述两个文本区域A和B中像素的纵坐标较小的文本区域聚合在所...

【专利技术属性】
技术研发人员:刘立杜一帆
申请(专利权)人:北京好运到信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1