The invention provides a method, device and device for signboard content recognition, which includes: acquiring signboard content and extracting text image data according to signboard content; inputting text image data into classification model for processing, acquiring font type of text image data; and inputting text image data when the font type of text image data is the first type. Processing in the conversion model to obtain the second type of text image data; optical character recognition of the second type of text image data to generate recognition results. As a result, the problem of low accuracy of OCR recognition in related technologies for the recognition of pictographs, artistic characters and other fonts in signboard characters is solved, which reduces the difficulty of the recognition of signboard characters and improves the accuracy of the recognition of signboard characters.
【技术实现步骤摘要】
招牌内容识别方法、装置及设备
本专利技术涉及文字识别
,尤其涉及一种招牌内容识别方法、装置及设备。
技术介绍
目前,商家设计的招牌内容多种多样,例如,考虑到大众审美与辨识度,商家通常会在招牌内容中加入艺术字等,以吸引用户。招牌内容识别是数据自动化生成中必不可少的环节。相关技术中,通常通过OCR(OpticalCharacterRecognition,光学字符识别)识别招牌内容,而针对招牌中的部分象形字或艺术字,OCR识别准确率低。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种招牌内容识别方法,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。本专利技术的第二个目的在于提出一种招牌内容识别装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术第一方面实施例提出了一种招牌内容识别方法,包括:获取招牌内容,并根据所述招牌内容提取文字图像数据;将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。本专利技术实施例的招牌内容识别方法,通过获取招牌内容,并根据招牌内容提取文字图像数据。进而将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型 ...
【技术保护点】
1.一种招牌内容识别方法,其特征在于,包括:获取招牌内容,并根据所述招牌内容提取文字图像数据;将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。
【技术特征摘要】
1.一种招牌内容识别方法,其特征在于,包括:获取招牌内容,并根据所述招牌内容提取文字图像数据;将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。2.如权利要求1所述的招牌内容识别方法,其特征在于,所述第一类型包括象形字类型和/或艺术体类型,所述第二类型包括印刷体类型。3.如权利要求1所述的招牌内容识别方法,其特征在于,在将所述文字图像数据输入到分类模型中进行处理之前,还包括:获取文字图像训练数据与对应的字体类型的训练集;根据所述训练集训练预设模型的参数,生成所述分类模型。4.如权利要求1所述的招牌内容识别方法,其特征在于,在将第一类型的文字图像数据输入到转换模型中进行处理之前,还包括:获取所述第一类型的文字图像训练数据与对应的所述第二类型的文字图像训练数据的训练集;根据所述训练集训练预设模型的参数,生成所述转换模型。5.如权利要求1所述的招牌内容识别方法,其特征在于,在获取所述文字图像数据的字体类型之后,还包括:当所述文字图像数据的字体类型为所述第二类型时,对所述文字图像数据进行光学字符识别,生成识别结果。6.如权利要求1所述的招牌内容识别方法,其特征在于,所述根据所述招牌内容提取文字图像数据,包括:基于视觉算法对所述招牌内容进行分割,生成多个所述文字图像数据;在生成识别结果之后,还包括:对多个所述识别结果进行合并。7.一种招牌内容识别装置,其特征在于,包括:获取模块,用于获取招牌内容,并根据...
【专利技术属性】
技术研发人员:刘慧,吴云鹏,王洪志,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。