招牌内容识别方法、装置及设备制造方法及图纸

技术编号:21185356 阅读:25 留言:0更新日期:2019-05-22 15:59
本发明专利技术提出了一种招牌内容识别方法、装置及设备,其中,方法包括:获取招牌内容,并根据招牌内容提取文字图像数据;将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型;当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;对第二类型的文字图像数据进行光学字符识别,生成识别结果。由此,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。

Signboard Content Recognition Method, Device and Equipment

The invention provides a method, device and device for signboard content recognition, which includes: acquiring signboard content and extracting text image data according to signboard content; inputting text image data into classification model for processing, acquiring font type of text image data; and inputting text image data when the font type of text image data is the first type. Processing in the conversion model to obtain the second type of text image data; optical character recognition of the second type of text image data to generate recognition results. As a result, the problem of low accuracy of OCR recognition in related technologies for the recognition of pictographs, artistic characters and other fonts in signboard characters is solved, which reduces the difficulty of the recognition of signboard characters and improves the accuracy of the recognition of signboard characters.

【技术实现步骤摘要】
招牌内容识别方法、装置及设备
本专利技术涉及文字识别
,尤其涉及一种招牌内容识别方法、装置及设备。
技术介绍
目前,商家设计的招牌内容多种多样,例如,考虑到大众审美与辨识度,商家通常会在招牌内容中加入艺术字等,以吸引用户。招牌内容识别是数据自动化生成中必不可少的环节。相关技术中,通常通过OCR(OpticalCharacterRecognition,光学字符识别)识别招牌内容,而针对招牌中的部分象形字或艺术字,OCR识别准确率低。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种招牌内容识别方法,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。本专利技术的第二个目的在于提出一种招牌内容识别装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术第一方面实施例提出了一种招牌内容识别方法,包括:获取招牌内容,并根据所述招牌内容提取文字图像数据;将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。本专利技术实施例的招牌内容识别方法,通过获取招牌内容,并根据招牌内容提取文字图像数据。进而将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型,当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据。进一步对第二类型的文字图像数据进行光学字符识别,生成识别结果,由此,通过分类模型对文字图像数据进行分类,并将第一类型的文字图像数据输入到转换模型中,以生成OCR识别准确率较高的第二类型的文字图像数据,实现了字体类型的转换,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。另外,根据本专利技术上述实施例的招牌内容识别方法还可以具有如下附加技术特征:可选地,所述第一类型包括象形字类型和/或艺术体类型,所述第二类型包括印刷体类型。可选地,在将所述文字图像数据输入到分类模型中进行处理之前,还包括:获取文字图像训练数据与对应的字体类型的训练集;根据所述训练集训练预设模型的参数,生成所述分类模型。可选地,在将第一类型的文字图像数据输入到转换模型中进行处理之前,还包括:获取所述第一类型的文字图像训练数据与对应的所述第二类型的文字图像训练数据的训练集;根据所述训练集训练预设模型的参数,生成所述转换模型。可选地,在获取所述文字图像数据的字体类型之后,还包括:当所述文字图像数据的字体类型为所述第二类型时,对所述文字图像数据进行光学字符识别,生成识别结果。可选地,所述根据所述招牌内容提取文字图像数据,包括:基于视觉算法对所述招牌内容进行分割,生成多个所述文字图像数据;在生成识别结果之后,还包括:对多个所述识别结果进行合并。本专利技术第二方面实施例提出了一种招牌内容识别装置,包括:获取模块,用于获取招牌内容,并根据所述招牌内容提取文字图像数据;分类模块,用于将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;转换模块,用于当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;识别模块,用于对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。本专利技术实施例的招牌内容识别装置,通过获取招牌内容,并根据招牌内容提取文字图像数据。进而将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型,当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据。进一步对第二类型的文字图像数据进行光学字符识别,生成识别结果,由此,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。另外,根据本专利技术上述实施例的招牌内容识别装置还可以具有如下附加技术特征:可选地,所述的装置,还包括:第一训练模块,用于获取文字图像训练数据与对应的字体类型的训练集;根据所述训练集训练预设模型的参数,生成所述分类模型。可选地,所述的装置,还包括:第二训练模块,用于获取所述第一类型的文字图像训练数据与对应的所述第二类型的文字图像训练数据的训练集;根据所述训练集训练预设模型的参数,生成所述转换模型。可选地,所述识别模块还用于:当所述文字图像数据的字体类型为所述第二类型时,对所述文字图像数据进行光学字符识别,生成识别结果。可选地,所述获取模块具体用于:基于视觉算法对所述招牌内容进行分割,生成多个所述文字图像数据;所述识别模块还用于对多个所述识别结果进行合并。本专利技术第三方面实施例提出了一种计算机设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的招牌内容识别方法。本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面实施例所述的招牌内容识别方法。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明图1为本专利技术实施例所提供的一种招牌内容识别方法的流程示意图;图2为本专利技术实施例所提供的一种训练分类模型的流程示意图;图3为本专利技术实施例所提供的一种训练转换模型的流程示意图;图4为本专利技术实施例所提供的另一种招牌内容识别方法的流程示意图;图5为本专利技术实施例所提供的一种应用场景流程示意图;图6为本专利技术实施例所提供的一种招牌内容识别装置的结构示意图;图7为本专利技术实施例所提供的另一种招牌内容识别装置的结构示意图;图8示出了适于用来实现本专利技术实施例的示例性计算机设备的框图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的招牌内容识别方法、装置及设备。图1为本专利技术实施例所提供的一种招牌内容识别方法的流程示意图,如图1所示,该方法包括:步骤101,获取招牌内容,并根据招牌内容提取文字图像数据。本实施例中,在进行招牌内容识别时,可以先获取招牌内容。例如,可以通过拍照设备拍摄招牌的图像。再例如,可以通过互联网下载招牌的图像。进而,可以根据招牌内容提取文字图像数据。作为一种示例,招牌内容为“XX牛肉面”,可以基于视觉算法对招牌图像进行分割,生成分别包括“X”“X”“牛”“肉”“面”的图像。需要说明的是,上述根据招牌内容提取文字图像数据的实现方式仅是一种示例,此处不作具体限制。步骤102,将文字图像数据输入到分类模型中进行处理,获取文本文档来自技高网...

【技术保护点】
1.一种招牌内容识别方法,其特征在于,包括:获取招牌内容,并根据所述招牌内容提取文字图像数据;将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。

【技术特征摘要】
1.一种招牌内容识别方法,其特征在于,包括:获取招牌内容,并根据所述招牌内容提取文字图像数据;将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。2.如权利要求1所述的招牌内容识别方法,其特征在于,所述第一类型包括象形字类型和/或艺术体类型,所述第二类型包括印刷体类型。3.如权利要求1所述的招牌内容识别方法,其特征在于,在将所述文字图像数据输入到分类模型中进行处理之前,还包括:获取文字图像训练数据与对应的字体类型的训练集;根据所述训练集训练预设模型的参数,生成所述分类模型。4.如权利要求1所述的招牌内容识别方法,其特征在于,在将第一类型的文字图像数据输入到转换模型中进行处理之前,还包括:获取所述第一类型的文字图像训练数据与对应的所述第二类型的文字图像训练数据的训练集;根据所述训练集训练预设模型的参数,生成所述转换模型。5.如权利要求1所述的招牌内容识别方法,其特征在于,在获取所述文字图像数据的字体类型之后,还包括:当所述文字图像数据的字体类型为所述第二类型时,对所述文字图像数据进行光学字符识别,生成识别结果。6.如权利要求1所述的招牌内容识别方法,其特征在于,所述根据所述招牌内容提取文字图像数据,包括:基于视觉算法对所述招牌内容进行分割,生成多个所述文字图像数据;在生成识别结果之后,还包括:对多个所述识别结果进行合并。7.一种招牌内容识别装置,其特征在于,包括:获取模块,用于获取招牌内容,并根据...

【专利技术属性】
技术研发人员:刘慧吴云鹏王洪志
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1