表格图片的标注方法、系统、介质及装置制造方法及图纸

技术编号:26971542 阅读:11 留言:0更新日期:2021-01-06 00:02
本发明专利技术提供一种表格图片的标注方法、系统、介质及装置,所述方法包括以下步骤:获取表格图片,使用图片标注工具对所述表格图片的表格进行标注,以列为单位用框对所述表格图片进行标注;按照预设规则记录每个框的坐标信息。本发明专利技术的一种表格图片的标注方法、系统、介质及装置,用于为训练一个能够识别图片中的文字的模型提供有标注的表格图片,作为训练数据集,且提供一个方便、简单快速的表格图片的标注方法。

【技术实现步骤摘要】
表格图片的标注方法、系统、介质及装置
本专利技术涉及图像处理
,特别是涉及一种表格图片的标注方法、系统、介质及装置。
技术介绍
当训练文字检测模型即能够识别图片中的文字的模型时,用于判断图片是否是含文字图片时,通常需要先标注数据用于训练,对于表格类的图片,用横向的文本框标注方法,使得标注时间过长且浪费大量时间成本。对于表格类带文字图片,横向的标注数据量大,消耗大量时间。因此,希望能够解决如何节约标注时间的问题。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种表格图片的标注方法、系统、介质及装置,用于解决现有技术中如何节约标注时间的问题。为实现上述目的及其他相关目的,本专利技术提供一种表格图片的标注方法,包括以下步骤:获取表格图片,使用图片标注工具对所述表格图片的表格进行标注,以列为单位用框对所述表格图片进行标注;按照预设规则记录每个框的坐标信息。于本专利技术的一实施例中,所述图片标注工具为labelimg。于本专利技术的一实施例中,所述以列为单位用框对所述表格图片进行标注包括:以每列的任意一个角为起点,以所述任意一个角的对立角为终点,进行画框。于本专利技术的一实施例中,所述按照预设规则记录每个框的坐标信息包括:记录每个框为起点和终点的角的坐标。为实现上述目的,本专利技术还提供一种表格图片的标注系统,包括:标注模块和记录模块;所述标注模块用于获取表格图片,使用图片标注工具对所述表格图片的表格进行标注,以列为单位用框对所述表格图片进行标注;所述记录模块用于按照预设规则记录每个框的坐标信息。于本专利技术的一实施例中,所述图片标注工具为labelimg。于本专利技术的一实施例中,所述以列为单位用框对所述表格图片进行标注包括:以每列的任意一个角为起点,以所述任意一个角的对立角为终点,进行画框。于本专利技术的一实施例中,所述按照预设规则记录每个框的坐标信息包括:记录每个框为起点和终点的角的坐标。为实现上述目的,本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一上述表格图片的标注方法。为实现上述目的,本专利技术还提供一种表格图片的标注装置,包括:处理器和存储器;所述存储器用于存储计算机程序;所述处理器与所述存储器相连,用于执行所述存储器存储的计算机程序,以使所述表格图片的标注装置执行任一上述的表格图片的标注方法。如上所述,本专利技术的一种表格图片的标注方法、系统、介质及装置,具有以下有益效果:用于为训练一个能够识别图片中的文字的模型提供有标注的表格图片,作为训练数据集,且提供一个方便、简单快速的表格图片的标注方法。附图说明图1显示为本专利技术的表格图片的标注方法于一实施例中的流程图;图2显示为本专利技术的表格图片的标注系统于一实施例中的结构示意图;图3显示为本专利技术的表格图片的标注装置于一实施例中的结构示意图。元件标号说明21标注模块22记录模块31处理器32存储器具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,故图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。本专利技术的表格图片的标注方法、系统、介质及装置,为训练一个能够识别图片中的文字的模型提供有标注的表格图片,作为训练数据集,且提供一个方便、简单快速的表格图片的标注方法。如图1所示,于一实施例中,本专利技术的表格图片的标注方法,包括以下步骤:步骤S11、获取表格图片,使用图片标注工具对所述表格图片的表格进行标注,以列为单位用框对所述表格图片进行标注。具体地,当训练文字检测模型,用于判断图片是否是含文字图片时,通常需要先标注数据用于训练,对于表格类的图片,用横向的文本框标注方法,使得标注时间过长且浪费大量时间成本。对于表格类的文字图片,即图片的内容包含表格的图片,称为表格图片。具体地,所述图片标注工具为labelimg。labelimg可以为所有开发人员提供一个可以自定义创建数据集的平台,即用户可以自定义使用图片标注工具对图片进行标注。具体地,所述以列为单位用框对所述表格图片进行标注包括:以每列的任意一个角为起点,以所述任意一个角的对立角为终点,进行画框。例如,以每列的左上角为起点,以所述左上角的对立角右下角为终点,进行画框。或,以每列的右上角为起点,以所述右上角的对立角左下角为终点,进行画框。或,以每列的右下角为起点,以所述右下角的对立角左上角为终点,进行画框。或,以每列的左下角为起点,以所述左下角的对立角右上角为终点,进行画框。这样采用以列为单位用框对所述表格图片进行标注,与横向标注需要对表格的每个小格都标注相比节约需要标注的资源。因为,在训练文字检测模型之前,需要进行图片的标注,业界通常采用,横向的文本框标注方式对文字进行标注,即默认:所有的文字都为纵向排列;这样就会带来一个问题,针对于像表格类的图片,文本框的数量极其之多,采用手工的方式标注,会浪费大量的时间,使得模型迟迟不能被应用于生产。对于表格类的文字图片,采用纵向的文本框标注方式来标注。如:一张表格图片有10行10列,那么该方法只需要,纵向标注10(列)次即可,相比传统横向标注方式需要10(行)*10(列)次,大大减少了标注次数,从而节省了时间。步骤S12、按照预设规则记录每个框的坐标信息。具体地,所述按照预设规则记录每个框的坐标信息包括:记录每个框为起点和终点的角的坐标。例如,以每列的左上角为起点,以所述左上角的对立角右下角为终点,进行画框,记录所述左上角和右下角的坐标。或,以每列的右上角为起点,以所述右上角的对立角左下角为终点,进行画框,记录所述右上角和左下角的坐标。或,以每列的右下角为起点,以所述右下角的对立角左上角为终点,进行画框,记录所述右下角和左上角的坐标。或,以每列的左下角为起点,以所述左下角的对立角右上角为终点,进行画框,记录所述左下角和对立角的坐标。所述坐标为二维坐标系的坐标。具体地,以所述表格图片所在平面建立二维直角坐标系,从而所述表格图片上的每个点都关于所述二维直角坐标系有相应的坐标,而在所述表格图片上画框,所述框的角所在位置的坐标就是,角关于所述二维直角坐标系的坐标。如图2所示,于一实施例中,本专利技术的表格图片的标注系统,包括标注模块21和记录模块22;所述标注模块21用于获取表格图片,使用图片标注工具对所述表格图片的表格进行标注,以列为单位用框对所述表本文档来自技高网...

【技术保护点】
1.一种表格图片的标注方法,其特征在于,包括以下步骤:/n获取表格图片,使用图片标注工具对所述表格图片的表格进行标注,以列为单位用框对所述表格图片进行标注;/n按照预设规则记录每个框的坐标信息。/n

【技术特征摘要】
1.一种表格图片的标注方法,其特征在于,包括以下步骤:
获取表格图片,使用图片标注工具对所述表格图片的表格进行标注,以列为单位用框对所述表格图片进行标注;
按照预设规则记录每个框的坐标信息。


2.根据权利要求1所述的表格图片的标注方法,其特征在于,所述图片标注工具为labelimg。


3.根据权利要求1所述的表格图片的标注方法,其特征在于,所述以列为单位用框对所述表格图片进行标注包括:以每列的任意一个角为起点,以所述任意一个角的对立角为终点,进行画框。


4.根据权利要求1所述的表格图片的标注方法,其特征在于,所述按照预设规则记录每个框的坐标信息包括:记录每个框为起点和终点的角的坐标。


5.一种表格图片的标注系统,其特征在于,包括:标注模块和记录模块;
所述标注模块用于获取表格图片,使用图片标注工具对所述表格图片的表格进行标注,以列为单位用框对所述表格图片进行标注;
所述记录模块用于按照预设规则记录每...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:上海蜜度信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1