【技术实现步骤摘要】
中英文混合商户门店名称识别方法、系统、设备及介质
本公开涉及中英文混合商户门店名称识别方法、系统、设备及介质。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
,并不必然构成现有技术。目前,一些商家在与美团、银联等公司合作入网时,商户会提供门头正面照片信息供合作方审核,合作方需要人工审核照片中的字体信息与商家提供的文字信息是否一致;由于人工识别照片中的字体信息具有效率低下,工作量大,且错误率高的缺点,因此极其需要结合人工智能技术进行辅助。在实现本公开的过程中,专利技术人发现现有技术中存在以下技术问题:传统光学字符识别主要面向高质量的文档图像,此类技术假设输入图像背景干净、字体简单且文字排布整齐,在符合要求的情况下能够达到很高的识别水平。与文档文字识别不同,自然场景中的文字识别具有图像背景复杂、分辨率低下、字体多样、分布随意等不良条件,传统光学字符识别在此类情况下无法应用。作为大量相关技术的基础工作,自然场景文字识别的不断发展和突破具有深远的研究意义和实际价值。近年来由于深度学习的快速崛起和计算机计算能力的提升,人们开始尝试构建各种机器学习模型来解决这一难题。当前学术科研领域针对自然场景商户门店名称的的文本识别有如下几个问题:1.用户上传的照片中存在角度倾斜等干扰项,使得文字边缘清晰度下降,这会让模型识别正确率有所下降;2.由于大多数商户门店中会同时含有中文、英文字符,由于中文字符均为方块字而英文字符较为瘦长的特点,因此难以使用同一个模型对中文英文进行精准识别。
技术实现思路
为了解决现有技术的不足,本公开提供了中英文混合商户门店名称识别方法、系统、设备 ...
【技术保护点】
1.中英文混合商户门店名称识别方法,其特征是,包括:利用中文商户门店名称分割PixelLink模型对待识别的中英文混合商户门店名称图片的文字区域进行分割,分割出M个分割的文字区域;M为正整数;利用英文商户门店名称分割PixelLink模型对待识别的中英文混合商户门店名称图片的文字区域进行分割,分割出N个分割的文字区域;N为正整数;从M个分割的文字区域中选出面积最大的文字区域;同样的,从N个分割的文字区域中选出面积最大的文字区域;删除剩余的文字区域;将筛选的两个面积最大的文字区域进行拼接,得到最终分割的文字区域;使用STN空间变换网络对最终分割的文字区域进行偏移度校正;利用中英文混合识别CRNN模型对校正后的文字区域进行字符识别,得到中文识别结果和英文识别结果。
【技术特征摘要】
1.中英文混合商户门店名称识别方法,其特征是,包括:利用中文商户门店名称分割PixelLink模型对待识别的中英文混合商户门店名称图片的文字区域进行分割,分割出M个分割的文字区域;M为正整数;利用英文商户门店名称分割PixelLink模型对待识别的中英文混合商户门店名称图片的文字区域进行分割,分割出N个分割的文字区域;N为正整数;从M个分割的文字区域中选出面积最大的文字区域;同样的,从N个分割的文字区域中选出面积最大的文字区域;删除剩余的文字区域;将筛选的两个面积最大的文字区域进行拼接,得到最终分割的文字区域;使用STN空间变换网络对最终分割的文字区域进行偏移度校正;利用中英文混合识别CRNN模型对校正后的文字区域进行字符识别,得到中文识别结果和英文识别结果。2.如权利要求1所述的方法,其特征是,中英文混合商户门店名称识别方法,还包括:对英文识别结果进行英文字母数量统计,如果英文字母数量小于等于设定阈值,则将中文识别结果和英文识别结果输出;如果英文字母数量超过设定阈值;则利用英文识别CRNN模型对校正后的文字区域再次进行字符识别,得到最终的英文识别结果;最后,将中文识别结果和最终的英文识别结果输出。3.如权利要求1所述的方法,其特征是,中文商户门店名称分割PixelLink模型的获取步骤,包括:构建PixelLink模型;中文文字区域分割步骤:利用中文商户门店名称图片输入到PixelLink模型中,得到中文文字区域分割结果;更换中文商户门店名称图片,重复中文文字区域分割步骤,直至中文文字区域分割精确度超过设定阈值,所得到的PixelLink模型即为中文商户门店名称分割PixelLink模型;或者,英文商户门店名称分割PixelLink模型的获取步骤,包括:构建PixelLink模型;英文文字区域分割步骤:利用英文商户门店名称图片输入到PixelLink模型中,得到英文文字区域分割结果;更换英文商户门店名称图片,重复英文文字区域分割步骤,直至英文文字区域分割精确度超过设定阈值,所得到的PixelLink模型即为英文商户门店名称分割PixelLink模型。4.如权利要求1所述的方法,其特征是,中英文混合识别CRNN模型的获取步骤,包括:构建CRNN模型;从中文自然文本数据集CTW中随机抽取若干张单字图片和若干张词组图片;先将单字图片输入到CRNN模型中进行若干轮训练,待CRNN模型的损失函数值loss处于设定范围内,再输入词组图片进行若干轮训练,待CRNN模型的损失函数值loss再次处于设定范围内,就得到中文识别CRNN模型;从ICDAR2015的数据集中随机抽取若干张单字母图片和若干张单词图片;先将单字母图片输入到中文识别CRNN模型中进行若干轮训练,待中文识别CRNN模型的损失函数值loss处于设定范围内,再输入若干张单词图片进行若干轮训练,待中文识别CRNN模型的损失函数值loss再次处于设定范围内,就得...
【专利技术属性】
技术研发人员:刘卫国,张浩,殷泽坤,张雯,宋红磊,
申请(专利权)人:山东大学,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。