一种图像分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26172908 阅读:26 留言:0更新日期:2020-10-31 13:53
本发明专利技术实施例公开了一种图像分类方法、装置、电子设备及存储介质。该方法包括:获取待分类图像中全部文字字符串;根据所述文字字符串确定待匹配词组;其中,所述待匹配词组由所述文字字符串中连续预设个数的字符组成;将所述待匹配词组与模板词表中的词组匹配,以确定所述待匹配词组与所述模板词表中词组的匹配度;根据所述匹配度对图像进行分类。通过运行本发明专利技术实施例所提供的技术方案,可以解决现有方法针对性训练的图像分类模型准确率不高;训练针对性深度学习模型耗时较长,开发效率低;只能判断一种类型的图片,通用性不强的问题,实现提高图像分类的准确率、效率和通用性的效果。

【技术实现步骤摘要】
一种图像分类方法、装置、电子设备及存储介质
本专利技术实施例涉及计算机技术,尤其涉及一种图像分类方法、装置、电子设备及存储介质。
技术介绍
随着计算机技术的发展,如今图像的分类往往通过图像识别技术完成。目前判断图像类型主要采用的是基于深度学习的图像分类技术。首先,现有方法需要收集大量样本图片作为训练数据,但真实应用场景中,由于数据保密性等原因,难以获取足量的图片,因此导致针对性训练的图像分类模型准确率不高;其次,现有方法需要训练针对性深度学习模型,通常耗时较长,开发效率低;最后,现有方法训练的深度学习模型只能判断一种类型的图片,新增图片类型则需要重新收集数据、标注数据、训练模型,因此该方法通用性不强。
技术实现思路
本专利技术实施例提供一种图像分类方法、装置、电子设备及存储介质,以实现提高图像分类的准确率、效率和通用性的效果。第一方面,本专利技术实施例提供了一种图像分类方法,该方法包括:获取待分类图像中全部文字字符串;根据所述文字字符串确定待匹配词组;其中,所述待匹配词组由所述文字字符串中连续预设个数的字符组成;将所述待匹配词组与模板词表中的词组匹配,以确定所述待匹配词组与所述模板词表中词组的匹配度;根据所述匹配度对图像进行分类。可选的,所述模板词表的建立过程,包括:获取模板图像中全部模板文字字符串;其中,所述模板图像与模板类别关联;可选的,根据所述模板文字字符串确定模板词组,以构成所述模板类别的模板词表。根据所述匹配度对图像进行分类,包括:若所述匹配度大于预设阈值,则确定所述待分类图像与所述模板图像匹配;将所述模板图像关联的模板类别确定为待分类图像的类型。可选的,确定所述待匹配词组与所述模板词表中词组的匹配度,包括:判断所述模板词表中的词组中是否有与所述待匹配词组相同的词组;若是,则所述匹配度增加固定单位;遍历所述待匹配词组,以确定所述匹配度。可选的,获取待分类图像中全部文字字符串,包括:获取所述待分类图像中文字所处的矩形框位置;获取所述矩形框位置中的全部文字内容,以获取所述文字字符串。第二方面,本专利技术实施例还提供了一种图像分类装置,该装置包括:第一字符串获取模块,用于获取待分类图像中全部文字字符串;待匹配词组确定模块,用于根据所述文字字符串确定待匹配词组;其中,所述待匹配词组由所述文字字符串中连续预设个数的字符组成;匹配度确定模块,用于将所述待匹配词组与模板词表中的词组匹配,以确定所述待匹配词组与所述模板词表中词组的匹配度;图像分类模块,用于根据所述匹配度对图像进行分类。可选的,模板词表建立模块,所述模板词表建立模块,包括:第二字符串获取单元,用于获取模板图像中全部模板文字字符串;其中,所述模板图像与模板类别关联;模板词组确定单元,用于根据所述模板文字字符串确定模板词组,以构成所述模板类别的模板词表。可选的,所述图像分类模块,包括:图像匹配确定单元,用于若所述匹配度大于预设阈值,则确定所述待分类图像与所述模板图像匹配;图像类型确定单元,用于将所述模板图像关联的模板类别确定为待分类图像的类型。可选的,所述匹配度确定模块,包括:词组判断单元,用于判断所述模板词表中的词组中是否有与所述待匹配词组相同的词组;匹配度增加单元,用于若所述词组判断单元判断为是,则所述匹配度增加固定单位;匹配度确定单元,用于遍历所述待匹配词组,以确定所述匹配度。可选的,所述第一字符串获取模块,包括:矩形框位置获取单元,用于获取所述待分类图像中文字所处的矩形框位置;字符串获取单元,用于获取所述矩形框位置中的全部文字内容,以获取所述文字字符串。第三方面,本专利技术实施例还提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的图像分类方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的图像分类方法。本专利技术实施例通过获取待分类图像中全部文字字符串;根据所述文字字符串确定待匹配词组;其中,所述待匹配词组由所述文字字符串中连续预设个数的字符组成;将所述待匹配词组与模板词表中的词组匹配,以确定所述待匹配词组与所述模板词表中词组的匹配度;根据所述匹配度对图像进行分类。解决现有方法针对性训练的图像分类模型准确率不高;训练针对性深度学习模型耗时较长,开发效率低;只能判断一种类型的图片,通用性不强的问题,实现提高图像分类的准确率、效率和通用性的效果。附图说明图1为本专利技术实施例一提供的一种图像分类方法的流程图;图2为本专利技术实施例一提供的一种报销单示意图;图3为本专利技术实施例二提供的一种图像分类方法的流程图;图4为本专利技术实施例三提供的一种图像分类装置的结构示意图;图5为本专利技术实施例四提供的一种电子设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种图像分类方法的流程图,本实施例可适用于通过模板对图像进行分类情况,该方法可以由本专利技术实施例所提供的图像分类装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本实施例提供的图像分类方法,包括:步骤110、获取待分类图像中全部文字字符串。其中,待分类图像为文字类图像,示例性的,可以为报销单、请假单等。获取待分类图像中所有文字部分的文字内容,并以字符串的形式存储。文字内容包括图片标题和栏位名称,还可以包括栏位名称后填写的具体内容,本实施例对此不作限制。图2为本专利技术实施例一提供的一种报销单示意图。如图2所示:文字字符串内容为:邯郸分行本部、报销单、报销单编号、附件张数、报销事项、支付方式、电子支付、回单接收邮箱、是否国际收支、供应商编号、供应商名称等。本实施例中,可选的,获取待分类图像中全部文字字符串,包括:获取所述待分类图像中文字所处的矩形框位置;获取所述矩形框位置中的全部文字内容,以获取所述文字字符串。其中,文字所处矩形框为文字的最小外接矩形框。矩形框位置可以为矩形框中顶点的坐标位置,可以通过图像定位的深度学习模型获取,本实施例对此不作限制。再使用图像识别的深度学习模型等方式,得到每个矩形框中的文字内容,并以字符串的形式保存。其中深度学习模型用于学习样本数据的内在规律和表示层次,计算并训练出最终模型,使机器可以根据模型进行结果预测。...

【技术保护点】
1.一种图像分类方法,其特征在于,包括:/n获取待分类图像中全部文字字符串;/n根据所述文字字符串确定待匹配词组;其中,所述待匹配词组由所述文字字符串中连续预设个数的字符组成;/n将所述待匹配词组与模板词表中的词组匹配,以确定所述待匹配词组与所述模板词表中词组的匹配度;/n根据所述匹配度对图像进行分类。/n

【技术特征摘要】
1.一种图像分类方法,其特征在于,包括:
获取待分类图像中全部文字字符串;
根据所述文字字符串确定待匹配词组;其中,所述待匹配词组由所述文字字符串中连续预设个数的字符组成;
将所述待匹配词组与模板词表中的词组匹配,以确定所述待匹配词组与所述模板词表中词组的匹配度;
根据所述匹配度对图像进行分类。


2.根据权利要求1所述的方法,其特征在于,所述模板词表的建立过程,包括:
获取模板图像中全部模板文字字符串;其中,所述模板图像与模板类别关联;
根据所述模板文字字符串确定模板词组,以构成所述模板类别的模板词表。


3.根据权利要求2所述的方法,其特征在于,根据所述匹配度对图像进行分类,包括:
若所述匹配度大于预设阈值,则确定所述待分类图像与所述模板图像匹配;
将所述模板图像关联的模板类别确定为待分类图像的类型。


4.根据权利要求1所述的方法,其特征在于,确定所述待匹配词组与所述模板词表中词组的匹配度,包括:
判断所述模板词表中的词组中是否有与所述待匹配词组相同的词组;
若是,则所述匹配度增加固定单位;
遍历所述待匹配词组,以确定所述匹配度。


5.根据权利要求1所述的方法,其特征在于,获取待分类图像中全部文字字符串,包括:
获取所述待分类图像中文字所处的矩形框位置;
获取所述矩形框位置中的全部文字内容,以获取所述文字字符串。


6.一种图像分类装置,其特征在于,包括:
第一字符串获取模块,用于获取待分类图像中全部文字字符串;
待匹配词组确定模块,用于根据所述文字字符串确定待匹配词组;其中,所述待匹配词组由所述文字字符串中连续预设个数的字符组成;
匹配度确定模块,用于将所述待匹配词组与模板词表中的词组匹配,以确定所述待匹配词组与所述模板词表...

【专利技术属性】
技术研发人员:胡雅伦郑邦东车越云
申请(专利权)人:中国建设银行股份有限公司建信金融科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1