图像的处理方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:36759226 阅读:12 留言:0更新日期:2023-03-04 10:52
本说明书实施方式提供了图像的处理方法、装置、电子设备及可读存储介质,包括:接收包括有表格的图像;其中,所述表格中包括多个文本字段;针对所述图像进行文本区域识别,得到多个分别包括文本字段的目标文本区域;其中,每个所述目标文本区域包括有位置特征数据和文本特征数据;所述位置特征数据用于表征所述目标文本区域的位置;所述文本特征数据用于表征所述目标文本区域的文本字段;根据多个所述目标文本区域的位置特征数据确定所述表格的行和列;根据确定的所述表格的行和列,和所述目标文本区域中的文本特征数据,生成所述图像的表格中文本字段的结构化数据。相对于现有技术,本方法更鲁棒,准确率高。准确率高。准确率高。

【技术实现步骤摘要】
图像的处理方法、装置、电子设备及可读存储介质


[0001]本说明书中实施方式关于深度学习
,特别是关于图像的处理方法、装置、电子设备及可读存储介质。

技术介绍

[0002]信息结构化是指将信息经过处理分解成多个互相关联的组成部分,各组成部分间有明确的层次结构,其使用和维护通过数据库进行管理,并有一定的操作规范。无法完全数字化的信息称为非结构化信息,如文档文件、图纸资料、缩微胶片等。
[0003]在对包括有表格的图像进行处理的
中,例如,对医疗化验单图像进行处理的
中,在现有技术中,对于医疗化验单图像的详情区域执行结构化的方法鲁棒性不高。

技术实现思路

[0004]有鉴于此,本说明书多个实施方式致力于提供一种图像的处理方法、装置、电子设备及可读存储介质,以一定程度上解决现有技术中对于化验单化验的详情区域执行结构化的方法鲁棒性不高的技术问题。
[0005]本说明书中多个实施方式提供一种图像的处理方法,包括:接收包括有表格的图像;其中,所述表格中包括多个文本字段;针对所述图像进行文本区域识别,得到多个分别包括文本字段的目标文本区域;其中,每个所述目标文本区域包括有位置特征数据和文本特征数据;所述位置特征数据用于表征所述目标文本区域的位置;所述文本特征数据用于表征所述目标文本区域的文本字段;根据多个所述目标文本区域的位置特征数据确定所述表格的行和列;根据确定的所述表格的行和列,和所述目标文本区域中的文本特征数据,生成所述图像的表格中文本字段的结构化数据。
[0006]本说明书的一个实施方式提供一种图像的处理装置,所述装置包括:接收单元,其用于接收包括有表格的图像;其中,所述表格中包括多个文本字段。识别单元,其用于针对所述图像进行文本区域识别,得到多个分别包括文本字段的目标文本区域;其中,每个所述目标文本区域包括有位置特征数据和文本特征数据;所述位置特征数据用于表征所述目标文本区域的位置;所述文本特征数据用于表征所述目标文本区域的文本字段。确定单元,其用于根据多个所述目标文本区域的位置特征数据确定所述表格的行和列。生成单元,其用于根据确定的所述表格的行和列,和所述目标文本区域中的文本特征数据,生成所述图像的表格中文本字段的结构化数据。
[0007]本说明书的一个实施方式提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述的一种图像的处理方法。
[0008]本说明书的一个实施方式提供一种计算机可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种图像的处理方法。
[0009]本说明书提供的多个实施方式,通过考虑目标文本区域的位置特征数据来确定所
述表格的行和列,再根据确定的所述表格的行和列以及所述目标文本区域中的文本特征数据,生成所述图像的表格中文本字段的结构化数据。该方法相对于现有技术中通过预先配置的规则来对于表格中文本字段进行信息结构化的方法,鲁棒性更高。
附图说明
[0010]图1是在一个场景示例中,应用本说明书实施方式提供的图像的处理方法的一种实施方式的示意图。
[0011]图2是在一个场景示例中,应用本说明书实施方式提供的图像的处理方法的一种实施方式的示意图。
[0012]图3为本说明书的一个实施方式提供的一种图像的处理方法的流程示意图。
[0013]图4为本说明书的一个实施方式提供的一种图像的处理方法应用环境示意图。
[0014]图5为本说明书的一个实施方式提供的一种图像的处理装置的框图。
[0015]图6为本说明书的一个实施方式提供的一种电子设备的框图。
具体实施方式
[0016]概述
[0017]在相关技术中,医疗化验单是医院出具的记载了患者的一些基本信息和具体化验项目与对应结果、单位和参考值的单据。所述基本信息包括姓名、年龄等等。在医疗化验单中,记载所述基本信息的区域一般被称为基本区域。记载所述化验项目与对应结果、单位和参考值的区域一般被称为详情区域。正如,
技术介绍
中记载的,信息结构化是指将信息经过处理分解成多个互相关联的组成部分,各组成部分间有明确的层次结构,其使用和维护通过数据库进行管理,并有一定的操作规范。
[0018]对医疗化验单图像进行信息结构化的目的是在于对OCR输出的散乱的文本信息进行处理,以得到结构化的信息,从而满足结构化存储、检索等需求。在现有技术中,往往是采用基于规则的方式来对详情区域进行信息结构化。具体的,在一种方式中,先根据一个预先设定的表头关键词集合来确定表格的表头各个文本框,再将表头的文本框作为基准,拟合出一条线,以这个线作为基准,再根据各个文本框的坐标,确定每一行,根据表头文本框与每一行文本的投影交并比执行列的划分,从而实现行列构建。在另外一种方式中,预先设定多种医疗化验单模板和基于规则的匹配引擎。通过该医疗化验单模板和基于规则的匹配引擎来对详情区域进行信息结构化。
[0019]但是不同的医院其出具的医疗化验单中基本区域和详情区域排版布局不同。即使具有相同的排版布局,详情区域中表头的关键词不一定完全一样。例如,有的医院的医疗化验单,其基本信息区域和详情区域是左右排版,也有的医院是上下排版,还有的医院是,对于详情区域具有两个或者多个表格。除了上述的医疗信息单本身的问题,在实际的使用过程中,因为拍摄角度的问题以及ocr识别的过程中,也会出现误差,例如,两个关键词存在粘连。
[0020]综上所述,仅仅依赖规则很难覆盖现实中所有的情况。并且当获取到的样本比较多样化,而依赖的规则比较复杂时就容易出错,不鲁棒。因此,有必要提供一种图像的处理方法,可以通过考虑医疗化验单详情区域中各个字段对应文本框之间的相互位置关系来还
原详情区域的表格结构。实现解决现有技术中,对于医疗化验单的详情区域执行信息结构化不鲁棒的技术问题。
[0021]场景示例
[0022]本说明书中提供一种图像的处理系统的应用场景示例,该图像处理系统可以配置在服务器中或者直接配置在终端设备中。该一种图像的处理系统具体可以参阅图1和图2。具体以所述图像处理系统配置在服务器中的情形进行举例说明。在一个场景示例中,可以通过终端设备获取医疗化验单图像,该医疗化验单图像经过网络传输至配置有所述图像处理系统的服务器中。在服务器中,该医疗化验单图像同时分别传输至预先配置好的OCR(Optical Character Recognition)识别系统和图像检测系统中。
[0023]所述的OCR识别系统主要用于对所述医疗化验单图像中的文本字段执行文字检测(Text Detection)与文字识别(Text Recognition)。其中,所述文字检测是对所述医疗化验单图像中存在的文本字段的文本区域进行定位。也即是输出所述文本字段的文本框,该文本字段可以是单个字符或者多个字符组成的文本行的文本框。所述的文字识别是对文本框中的字符执行语义的识别。所述的图像检测系统可以采用预先本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像的处理方法,其特征在于,包括:接收包括有表格的图像;其中,所述表格中包括多个文本字段;针对所述图像进行文本区域识别,得到多个分别包括文本字段的目标文本区域;其中,每个所述目标文本区域包括有位置特征数据和文本特征数据;所述位置特征数据用于表征所述目标文本区域的位置;所述文本特征数据用于表征所述目标文本区域的文本字段;根据多个所述目标文本区域的位置特征数据确定所述表格的行和列;根据确定的所述表格的行和列,和所述目标文本区域中的文本特征数据,生成所述图像的表格中文本字段的结构化数据。2.根据权利要求1所述的方法,其特征在于,所述图像还包括位于所述表格之外的多个文本字段;所述针对所述图像进行文本区域识别,得到多个分别包括文本字段的目标文本区域的步骤,包括:针对所述图像进行文本区域识别,得到多个分别包括文本字段的文本区域;识别所述多个分别包括文本字段的文本区域对应的类别标签;其中,位于所述表格中的文本区域的类别标签与位于所述表格之外的文本区域的类别标签不相同;根据所述的类别标签,将位于所述表格中的文本区域确定为目标文本区域。3.根据权利要求1所述的方法,其特征在于,所述图像还包括位于所述表格之外的多个文本字段;所述针对所述图像进行文本区域识别,得到多个分别包括文本字段的目标文本区域的步骤,包括:确定所述图像中属于所述表格的表格区域;针对所述表格区域进行文本区域识别,得到多个分别包括文本字段的目标文本区域。4.根据权利要求2或者3所述的方法,其特征在于,所述的图像为医疗化验单图像;所述医疗化验单图像包括详情区域;其中,所述详情区域包括所述表格和所述表格中包括的多个文本字段。5.根据权利要求1所述的方法,其特征在于,所述的图像为医疗化验单图像,所述医疗化验单图像包括基本区域;其中,所述基本区域包括所述表格之外的多个文本字段,所述方法还包括:确定所述图像中的基本区域;针对所述基本区域进行文本区域识别,得到多个分别包括文本字段的文本区域...

【专利技术属性】
技术研发人员:陶提王永明杨涛
申请(专利权)人:浙江太美医疗科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1