文本图片解析方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:24800538 阅读:44 留言:0更新日期:2020-07-07 21:12
本发明专利技术涉及文本图片解析方法、装置、计算机设备及存储介质,该方法包括获取需要解析的图片数据,以得到待解析图片;将待解析图片输入至文本方向识别模型内进行文本方向识别,以得到识别结果;利用识别结果对待解析图片进行预处理,以得到中间图片;将中间图片输入至文本区域定位模型内进行文本区域定位,以得到定位结果;根据所述定位结果对中间图片进行再次处理,以得到文本区域图片;对文本区域图片进行线段检测,以得到关键信息;根据所述关键信息截取所述文本区域图片,以得到关键文本图片;对关键文本图片进行解析,以形成解析结果;发送所述解析结果至终端,以使得终端显示所述解析结果。本发明专利技术实现高效率且高准确率地解析文本图片。

【技术实现步骤摘要】
文本图片解析方法、装置、计算机设备及存储介质
本专利技术涉及图片分析方法,更具体地说是指文本图片解析方法、装置、计算机设备及存储介质。
技术介绍
随着互联网的发展、移动手机的普及以及日常生活中对图片识别的需求,出现了众多识图软件,例如,提取身份证件照上的身份证号码,图片中门店的门牌号,图片中汽车的车牌号等。但是上述的识图软件解析图片后形成的文本信息的错误率较高,目前较为准确地解析图片的方式是人工识别和解析的方式,使用人工的方式对文本图片的关键信息进行提取,这种方式虽然准确率较高,但是效率十分低下,成本高并且时间消耗巨大。因此,有必要设计一种新的方法,实现高效率且高准确率地解析文本图片。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷,提供文本图片解析方法、装置、计算机设备及存储介质。为实现上述目的,本专利技术采用以下技术方案:文本图片解析方法,包括:获取需要解析的图片数据,以得到待解析图片;将待解析图片输入至文本方向识别模型内进行文本方向识别,以得到识别结果;利用识别结果本文档来自技高网...

【技术保护点】
1.文本图片解析方法,其特征在于,包括:/n获取需要解析的图片数据,以得到待解析图片;/n将待解析图片输入至文本方向识别模型内进行文本方向识别,以得到识别结果;/n利用识别结果对待解析图片进行预处理,以得到中间图片;/n将中间图片输入至文本区域定位模型内进行文本区域定位,以得到定位结果;/n根据所述定位结果对中间图片进行再次处理,以得到文本区域图片;/n对文本区域图片进行线段检测,以得到关键信息;/n根据所述关键信息截取所述文本区域图片,以得到关键文本图片;/n对关键文本图片进行解析,以形成解析结果;/n发送所述解析结果至终端,以使得终端显示所述解析结果;/n其中,所述文本方向识别模型是通过带...

【技术特征摘要】
1.文本图片解析方法,其特征在于,包括:
获取需要解析的图片数据,以得到待解析图片;
将待解析图片输入至文本方向识别模型内进行文本方向识别,以得到识别结果;
利用识别结果对待解析图片进行预处理,以得到中间图片;
将中间图片输入至文本区域定位模型内进行文本区域定位,以得到定位结果;
根据所述定位结果对中间图片进行再次处理,以得到文本区域图片;
对文本区域图片进行线段检测,以得到关键信息;
根据所述关键信息截取所述文本区域图片,以得到关键文本图片;
对关键文本图片进行解析,以形成解析结果;
发送所述解析结果至终端,以使得终端显示所述解析结果;
其中,所述文本方向识别模型是通过带有文本方向标签的文本图片作为样本集进行训练所得的;
所述文本区域定位模型是通过带有文本区域标签且文字朝上的文本图片作为样本集进行训练所得的。


2.根据权利要求1所述的文本图片解析方法,其特征在于,所述文本方向识别模型是通过带有文本方向标签的文本图片作为样本集进行训练所得的,包括:
获取带有文本方向标签的文本图片,以得到第一样本集,将第一样本集划分为第一训练集以及第一测试集;
构建第一卷积神经网络以及第一损失函数;
将第一训练集输入至第一卷积神经网络中进行卷积训练,以得到第一训练结果;
利用第一损失函数计算第一训练结果与文本方向标签的损失值,以得到第一损失值;
判断所述第一损失值是否维持不变;
若所述第一损失值不是维持不变,则调整所述第一卷积神经网络的参数,并执行所述将第一训练集输入至第一卷积神经网络中进行卷积训练,以得到第一训练结果;
若所述第一损失值维持不变,则将第一测试集输入至第一卷积神经网络内进行卷积测试,以得到第一测试结果;
判断所述第一测试结果是否符合条件;
若所述第一测试结果符合条件,则将所述第一卷积神经网络作为文本方向识别模型;
若所述第一测试结果不符合条件,则执行所述调整所述第一卷积神经网络的参数。


3.根据权利要求1所述的文本图片解析方法,其特征在于,所述文本区域定位模型是通过带有文本区域标签且文字朝上的文本图片作为样本集进行训练所得的,包括:
获取带有文本区域标签且文字朝上的文本图片,以得到第二样本集,将第二样本集划分为第二训练集以及第二测试集;
构建第二卷积神经网络以及第二损失函数;
将第二训练集输入至第二卷积神经网络中进行卷积训练,以得到第二训练结果;
利用第二损失函数计算第二训练结果与文本区域标签的损失值,以得到第二损失值;
判断所述第二损失值是否维持不变;
若所述第二损失值不是维持不变,则调整所述第二卷积神经网络的参数,并执行所述将第二训练集输入至第二卷积神经网络中进行卷积训练,以得到第二训练结果;
若所述第二损...

【专利技术属性】
技术研发人员:郑泽重范有文潭江龙
申请(专利权)人:深圳前海环融联易信息科技服务有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1