【技术实现步骤摘要】
本专利技术涉及医学图像检测
,具体涉及一种用于医学图像中文本区域检测的方法及装置。
技术介绍
医学影像图像是由一定数目由黑到白不同灰度的像素按矩阵排列所构成的图像。它反映了器官和组织在特定影像设备上的成像情况,可以很好的显示由软组织构成的器官,如脑、脊髓、纵膈、肺、肝、胆、胰以及盆部器官等,并在良好的解剖图像背景上显示出病变的影像,因此医学影像在医学诊断上具有非常重要的应用价值。原始的医学影像除了图像本身外,还会将患者信息等附加数据按照一定标准(如DICOM)以元数据形式保存。这些数据与图像是分别保存的。经分析的医疗影像经过转换打印输出用于诊断与保存。与原始影像不同,这类用于输出的医学图像上除了器官的层面图像外,还会将附加信息以文字图样形式直接叠加到医学影像上。这些文字往往包含了患者姓名、检测时间以及检测指标等信息,为我们准确解读医学图像提供了重要的价值,因此检测这些医学图像中文字所在的位置,将其提取出来有着重要的意义。现有技术一般使用MSER、SWT等方法进行医学图像中文本区域检测,但是此种方法是依据纹理特征进行检测的,不容易将图像中字符纹理与其它纹理进行区分,造成检测精度较低。
技术实现思路
针对现有技术存在的不足和缺陷,本专利技术提供一种用于医学图像中文本区域检测的方法及装置。一方面,本专利技术实施例提出一种用于医学图像中文本区域检测的方法,包括:S1、获取待检测的医学图像;S2、对所述医学图像进行检测,得到一系列的连通区域,并且基于单样例图像得到所述医学图像中文本区域的二值模板;S3、利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选 ...
【技术保护点】
一种用于医学图像中文本区域检测的方法,其特征在于,包括:S1、获取待检测的医学图像;S2、对所述医学图像进行检测,得到一系列的连通区域,并且基于单样例图像得到所述医学图像中文本区域的二值模板;S3、利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域,并基于字符特征进一步滤除所述文本候选区域中的非文本区域;S4、将得到的文本区域进行聚合,得到文本行。
【技术特征摘要】
1.一种用于医学图像中文本区域检测的方法,其特征在于,包括:S1、获取待检测的医学图像;S2、对所述医学图像进行检测,得到一系列的连通区域,并且基于单样例图像得到所述医学图像中文本区域的二值模板;S3、利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域,并基于字符特征进一步滤除所述文本候选区域中的非文本区域;S4、将得到的文本区域进行聚合,得到文本行。2.根据权利要求1所述的方法,其特征在于,所述基于单样例图像得到所述医学图像中文本区域的二值模板,包括:计算所述单样例图像R的局部自适应回归核KR,并且对于每一个连通区域T,计算该连通区域T的局部自适应回归核KT;对所述KR进行归一化处理得到权值向量矩阵WR,对所述KT进行归一化处理得到权值向量矩阵WT;对所述WR采用PCA算法进行处理,得到主成分,并保留所述主成分的前d项构成矩阵PR,将所述WR向所述PR进行投影,得到所述单样例图像R的特征向量FR,将所述WT向所述PR进行投影,得到所述连通区域T的特征向量FT,其中,所述d为整数;计算所述特征向量FR与FT之间的相似度,判断所述相似性度量是否大于第一数值,若大于所述第一数值,则将对应的连通区域的像素值置为1,得到文本区域,否则,则将对应的连通区域的像素值置为0,得到背景区域,将所述文本区域和背景区域作为所述二值模板。3.根据权利要求1或2所述的方法,其特征在于,所述基于字符特征进一步滤除所述文本候选区域中的非文本区域,包括:对于每一个文本候选区域,计算该文本候选区域的笔划宽度特征SW,并保留笔划宽度特征SW小于第二数值的文本候选区域,其中,所述笔划宽度特征SW的计算公式为SW=stdE---(1)]]>式中,std和E分别是该文本候选区域的笔划宽度标准差和平均值;计算得到的文本候选区域的非零像素的个数,滤除非零像素的个数大于第三数值和小于第四数值的文本候选区域;计算得到的文本候选区域的非零像素的个数与对应的文本候选区域的区域面积的比值,滤除比值大于第五数值和小于第六数值的文本候选区域;计算得到的文本候选区域的的长宽比,滤除掉长宽比大于第七数值和小于第八数值的文本候选区域;对于得到的每一个文本候选区域,利用投影法或者连通区域法对该文本候选区域进行切分,得到多个小块,并确定每一个小块是否是字符,计算是字符的小块所占的比值,滤除比值小于第九数值的文本候选区域。4.根据权利要求1所述的方法,其特征在于,所述S4,包括:对于得到的文本区域中每一个未被聚合的文本区域A,选取其它未被聚合的文本区域中的一个未被聚合的文本区域B,判断该两个文本区域A和B是否能够聚合,若能够聚合,则将该两个文本区域A和B进行聚合,得到文本区域C,再从其它未被聚合的文本区域中选取一个未被聚合的文本区域D,判断所述文本区域C和D是否能够聚合,若能够聚合,则将该两个文本区域C和D进行聚合,重复上述选取文本区域、判断是否能够聚合以及聚合的步骤直至未被聚合的文本区域选取完毕。5.根据权利要求4所述的方法,其特征在于,所述判断该两个文本区域A和B是否能够聚合,包括:S40、计算该两个文本区域A和B之间的垂直距离,判断所述垂直距离是否小于第十数值,若小于所述第十数值,则执行步骤S41,否则,执行步骤S42;S41、计算所述两个文本区域A和B中像素的横坐标较大的文本区域包含的像素的最小横坐标与所述两个文本区域A和B中像素的横坐标较小的文本区域包含的像素的最大横坐标的差值的绝对值,判断所述绝对值是否小于第十一数值,若小于所述第十一数值,则将所述像素的横坐标较大的文本区域聚合在所述像素的横坐标较小的文本区域后面;S42、判断所述垂直距离是否小于第十一数值,若小于所述第十一数值,则计算所述两个文本区域A和B中一个文本区域包含的像素的最小横坐标与另一个文本区域包含的像素的最小横坐标的差值的绝对值,判断所述绝对值是否小于第十数值,若小于所述第十数值,则将所述两个文本区域A和B中像素的纵坐标较小的文本区域聚合在所...
【专利技术属性】
技术研发人员:刘立,杜一帆,
申请(专利权)人:北京好运到信息科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。