一种自动识别价签的方法、计算机可读介质及系统技术方案

技术编号:22330732 阅读:66 留言:0更新日期:2019-10-19 12:23
本发明专利技术涉及一种自动识别价签的方法,该方法包括以下步骤:步骤S1:获取包含价签的图片;步骤S2:检测并截取出图片中的价签图像;步骤S3:检测并截取价签图像中的文字图像,并对文字图像进行姿态矫正和尺寸对齐;及步骤S4:提取文字图像中的文字结构特征进行文字识别,以获得商品信息,以实现自动检测商品名称、价格及价格波动。本发明专利技术还提供一种计算机可读介质。本发明专利技术还提供一种系统。

A method, computer-readable medium and system for automatic identification of price tag

【技术实现步骤摘要】
一种自动识别价签的方法、计算机可读介质及系统
本专利技术涉及零售商品领域,尤其涉及一种自动识别价签的方法、计算机可读介质及系统。
技术介绍
目前的零售商品价格监控方式分为两种,一种为采用开放式的价格管控,通过出厂时的定价来约束市场分销终端的销售价格,这种方式无法了解和控制终端销售的最终价格;另一种则是通过业务代表手动录入分销终端的销售价格进行监控,这种方式的效率低下,而且难以保证录入价格的准确性和客观性。
技术实现思路
为克服现有技术存在的问题,本专利技术提供一种自动识别价签的方法、计算机可读介质及系统。本专利技术解决技术问题的方案是提供一种自动识别价签的方法,该方法包括以下步骤:步骤S1:获取包含价签的图片;步骤S2:检测并截取出图片中的价签图像;步骤S3:检测并截取价签图像中的文字图像,并对文字图像进行姿态矫正和尺寸对齐;及步骤S4:提取文字图像中的文字结构特征进行文字识别,以获得商品信息。优选地,步骤S3检测价签图像中的文字图像,并对文字图像进行姿态矫正和尺寸对齐,进一步包括以下步骤:步骤S31:使用深度学习模型结合包含文字图像的图片训练一文字检测模型;步骤S32:使用文字检测模型检测图片中文字图像的位置;步骤S33:根据文字图像的位置,使用矩形截取文字图像;步骤S34:根据矩形的坐标信息调整文字图像的大小、角度、位置及方向;及步骤S35:将调整后的文字图案组合为文字图像集。优选地,步骤S32使用文字检测模型检测图片中文字图像的位置,之前还包括以下步骤:步骤S321:对价签图像进行预处理,消除噪点干扰,并获得文字图像的有效区域;步骤S322:检测文字图像轮廓信息,并根据文字图像的有效区域过滤文字图像轮廓信息;步骤S323:将文字图像与价签图像进行融合;及步骤S324:提取文字图像的多个不同尺度的特征,并采用特征对齐和通道组合的方法融合不同尺度的特征。优选地,步骤S2检测并截取出图片中的价签图像,进一步包括以下步骤:步骤S21:使用深度学习模型结合包含价签图像的图片训练一价签检测模型;步骤S22:使用价签检测模型检测图片中价签图像的位置;及步骤S23:根据价签图像的位置截取价签图像,并将截取的价签图像组合为价签图像集。优选地,步骤S4提取文字图像中的文字结构特征进行文字识别,以获得商品信息,进一步包括以下步骤:步骤S41:使用深度学习模型结合文字的结构特征训练一文字识别模型;步骤S42:使用文字识别模型提取文字的结构特征;步骤S43:按照结构特征的位置逐点通过一个特征通道间的双线性耦合,提取双线性特征;步骤S44:将双线性特征根据位置序列转换为特征向量;步骤S45:根据特征向量输出文字识别结果;及步骤S46:获得商品信息。优选地,步骤S45输出文字识别结果,进一步包括以下步骤:步骤S451:根据特征向量获得文字概率信息;及步骤S452:根据文字概率信息及其对应的位置信息输出文字识别结果。优选地,步骤S46获得商品信息,进一步包括以下步骤:步骤S461:使用深度学习模型结合文字语义特征训练一个解释模块;步骤S462:将文字识别结果输入至解释模块;及步骤S463:根据文字语义特征解析出商品名称、价格及价格波动信息。本专利技术还提供一种计算机可读介质,所述计算机可读介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述的自动识别价签的方法。本专利技术还提供一种识别价签的系统,所述系统包括:读取模块,被配置为读取包含价签的图片;价签检测模块,被配置为检测并截取出图片中的价签图像;文字检测模块,被配置为检测并截取价签图像中的文字图像,并对文字图像进行姿态矫正和尺寸对齐;及文字识别模块,被配置为提取文字图像中的文字结构特征进行文字识别,以获得商品信息。优选地,文字检测模块中进一步包括:训练单元,被配置为使用深度学习模型结合包含文字图像的图片训练一文字检测模型;检测单元,被配置为使用文字检测模型检测图片中文字图像的位置;截取单元,被配置为根据文字图像的位置,使用矩形截取文字图像;调整单元,被配置为根据矩形的坐标信息调整文字图像的大小、角度、位置及方向;及组合单元,被配置为将调整后的文字图案组合为文字图像集。与现有技术相比,本专利技术的自动识别价签的方法、计算机可读介质及系统具有以下优点:1.通过获取包含价签的图片,然后检测并截取出价签图像,再从价签图像中检测出文字图像,并对文字图像进行姿态矫正和尺寸对齐,最后从文字图像中识别文字,并获得商品信息,以实现自动检测商品名称、价格及价格波动。2.通过对矩形截取文字图像,进而根据矩形的坐标信息调整文字图像的大小、角度、位置及方向,以便于文字识别模块识别文字,进而增加文字识别的准确率。3.通过对价签图像进行预处理,然后加强价签图像上的文字纹理,以消除价签图像上的噪点干扰,并使文字更清晰,以提升文字识别的准确率。4.通过将检测出的价签图像从获取的图片中提取出来,以便于文字检测模型从价签图像中检测文字,避免由于背景图像而影响文字检测的准确率。5.通过将检测出的文字图像从价签图像中提取出来,以便于文字识别模型从文字图像中识别文字,避免由于价签背景图像而影响文字识别的准确率。6.将自动识别价签的方法存储于计算机程序中,以便于计算机可读介质运行该计算机程序,以够获得商品信息。7.在识别价签的系统中设置读取模块、价签检测模块、文字检测模块及文字识别模块,以使系统能够获得商品信息。【附图说明】图1是本专利技术第一实施例自动识别价签的方法的流程示意图。图2是本专利技术第一实施例自动识别价签的方法中步骤S2的流程示意图。图3是本专利技术第一实施例自动识别价签的方法中步骤S3的流程示意图。图4是本专利技术第一实施例自动识别价签的方法中步骤S32的流程示意图。图5是本专利技术第一实施例自动识别价签的方法中截取的价签图像示意图。图6是本专利技术第一实施例自动识别价签的方法中对价签图像进行预处理的示意图。图7是本专利技术第一实施例自动识别价签的方法中融合不同尺度特征后的示意图。图8是本专利技术第一实施例自动识别价签的方法中使用矩形截取文字图像的示意图。图9是本专利技术第一实施例自动识别价签的方法中根据矩形调整文字图像的示意图。图10是本专利技术第一实施例自动识别价签的方法中步骤S4的流程示意图。图11是本专利技术第一实施例自动识别价签的方法中步骤S45的流程示意图。图12是本专利技术第一实施例自动识别价签的方法中步骤S46的流程示意图。图13是本专利技术第三实施例识别价签的系统的模块示意图。图14是本专利技术第三实施例识别价签的系统中文字检测模块的模块示意图。附图标记说明:1、识别价签的系统;11、读取模块;12、价签检测模块;13、文字检测模块;14、文字识别模块;131、训练单元;132、检测单元;133、截取单元;134、调整单元;135、组合单元。【具体实施方式】为了使本专利技术的目的,技术方案及优点更加清楚明白,以下结合附图及实施实例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。请参阅图1,本专利技术第一实施例提供一种自动识别价签的方法,该方法包括以下步骤:步骤S1:获取包含价签的图片;步骤S2:检测并截取出图片中的价签图像;步骤S3:检测并截取价签图像中的文字图像,并对文字图像进行姿本文档来自技高网...

【技术保护点】
1.一种自动识别价签的方法,其特征在于:该方法包括以下步骤:步骤S1:获取包含价签的图片;步骤S2:检测并截取出图片中的价签图像;步骤S3:检测并截取价签图像中的文字图像,并对文字图像进行姿态矫正和尺寸对齐;及步骤S4:提取文字图像中的文字结构特征进行文字识别,以获得商品信息。

【技术特征摘要】
1.一种自动识别价签的方法,其特征在于:该方法包括以下步骤:步骤S1:获取包含价签的图片;步骤S2:检测并截取出图片中的价签图像;步骤S3:检测并截取价签图像中的文字图像,并对文字图像进行姿态矫正和尺寸对齐;及步骤S4:提取文字图像中的文字结构特征进行文字识别,以获得商品信息。2.如权利要求1所述的自动识别价签的方法,其特征在于:步骤S3检测价签图像中的文字图像,并对文字图像进行姿态矫正和尺寸对齐,进一步包括以下步骤:步骤S31:使用深度学习模型结合包含文字图像的图片训练一文字检测模型;步骤S32:使用文字检测模型检测图片中文字图像的位置;步骤S33:根据文字图像的位置,使用矩形截取文字图像;步骤S34:根据矩形的坐标信息调整文字图像的大小、角度、位置及方向;及步骤S35:将调整后的文字图案组合为文字图像集。3.如权利要求2所述的自动识别价签的方法,其特征在于:步骤S32使用文字检测模型检测图片中文字图像的位置,之前还包括以下步骤:步骤S321:对价签图像进行预处理,消除噪点干扰,并获得文字图像的有效区域;步骤S322:检测文字图像轮廓信息,并根据文字图像的有效区域过滤文字图像轮廓信息;步骤S323:将文字图像与价签图像进行融合;及步骤S324:提取文字图像的多个不同尺度的特征,并采用特征对齐和通道组合的方法融合不同尺度的特征。4.如权利要求1所述的自动识别价签的方法,其特征在于:步骤S2检测并截取出图片中的价签图像,进一步包括以下步骤:步骤S21:使用深度学习模型结合包含价签图像的图片训练一价签检测模型;步骤S22:使用价签检测模型检测图片中价签图像的位置;及步骤S23:根据价签图像的位置截取价签图像,并将截取的价签图像组合为价签图像集。5.如权利要求1所述的自动识别价签的方法,其特征在于:步骤S4提取文字图像中的文字结构特征进行文字识别,以获得商品信息,进一步包括以下步骤:步骤S41:使用深度学习模型结合...

【专利技术属性】
技术研发人员:张发恩高达辉秦永强
申请(专利权)人:创新奇智南京科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1