地址信息识别方法、装置、电子设备与计算机可读介质制造方法及图纸

技术编号:38992342 阅读:10 留言:0更新日期:2023-10-07 10:22
本公开的实施例公开了地址信息识别方法、装置、电子设备与计算机可读介质。该方法的一具体实施方式包括:将地址图像样本集和增强地址图像样本集作为训练样本集,对初始地址识别模型进行训练,得到训练完成的地址识别模型;响应于接收到待识别地址图像,将待识别地址图像输入至特征提取模型中,得到待识别地址特征信息;将待识别地址特征信息输入至地址字符识别模型中,得到地址字符信息集,其中,地址字符识别模型包括:多层输出层,每一输出层输出一类型的地址字符信息,地址字符识别模型还包括:多层次检测头模型组;根据地址字符信息集,生成地址信息。该实施方式提高了地址信息的识别精准度。别精准度。别精准度。

【技术实现步骤摘要】
地址信息识别方法、装置、电子设备与计算机可读介质


[0001]本公开的实施例涉及计算机
,具体涉及地址信息识别方法、装置、电子设备与计算机可读介质。

技术介绍

[0002]目前,为了识别地址图像中的地址信息,通常采用的方式为:通过预先训练的YOLO(You Only Look Once,目标检测模型)模型,识别地址图像中的地址信息。
[0003]然而,采用上述方式通常会存在以下技术问题:第一,针对地址字符的分类任务和回归任务的特征学习侧重点不同,导致YOLO v5的检测头模型所输出的地址信息不够精准;第二,在识别图像中的特征信息时,考虑的层次特征较少,导致所识别的地址信息不够准确。
[0004]该
技术介绍
部分中所公开的以上信息仅用于增强对本专利技术构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0006]本公开的一些实施例提出了地址信息识别方法、装置、电子设备与计算机可读介质,来解决以上
技术介绍
部分提到的技术问题中的一项或多项。
[0007]第一方面,本公开的一些实施例提供了一种地址信息识别方法,该方法包括:获取地址图像样本集;对上述地址图像样本集中的每个地址图像样本进行增强处理,以生成增强地址图像样本,得到增强地址图像样本集;将上述地址图像样本集和上述增强地址图像样本集作为训练样本集,对初始地址识别模型进行训练,得到训练完成的地址识别模型,其中,上述地址识别模型包括:特征提取模型与地址字符识别模型;响应于接收到待识别地址图像,将上述待识别地址图像输入至上述特征提取模型中,得到待识别地址特征信息,其中,上述待识别地址特征信息包括:多层次地址特征信息集;将上述待识别地址特征信息输入至上述地址字符识别模型中,得到地址字符信息集,其中,上述地址字符识别模型包括:多层输出层,每一输出层输出一类型的地址字符信息,上述地址字符识别模型还包括:多层次检测头模型组;根据上述地址字符信息集,生成地址信息。
[0008]第二方面,本公开的一些实施例提供了一种地址信息识别装置,装置包括:获取单元,被配置成获取地址图像样本集;增强单元,被配置成对上述地址图像样本集中的每个地址图像样本进行增强处理,以生成增强地址图像样本,得到增强地址图像样本集;训练单元,被配置成将上述地址图像样本集和上述增强地址图像样本集作为训练样本集,对初始地址识别模型进行训练,得到训练完成的地址识别模型,其中,上述地址识别模型包括:特
征提取模型与地址字符识别模型;第一输入单元,被配置成响应于接收到待识别地址图像,将上述待识别地址图像输入至上述特征提取模型中,得到待识别地址特征信息,其中,上述待识别地址特征信息包括:多层次地址特征信息集;第二输入单元,被配置成将上述待识别地址特征信息输入至上述地址字符识别模型中,得到地址字符信息集,其中,上述地址字符识别模型包括:多层输出层,每一输出层输出一类型的地址字符信息,上述地址字符识别模型还包括:多层次检测头模型组;生成单元,被配置成根据上述地址字符信息集,生成地址信息。
[0009]第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
[0010]第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
[0011]本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的地址信息识别方法,提升了所输出的地址信息的准确性。具体来说,导致YOLO v5的检测头模型所输出的地址信息不够精准的原因在于:针对地址字符的分类任务和回归任务的特征学习侧重点不同,导致YOLO v5的检测头模型所输出的地址信息不够精准。基于此,本公开的一些实施例的地址信息识别方法,首先,获取地址图像样本集。其次,对上述地址图像样本集中的每个地址图像样本进行增强处理,以生成增强地址图像样本,得到增强地址图像样本集。接着,将上述地址图像样本集和上述增强地址图像样本集作为训练样本集,对初始地址识别模型进行训练,得到训练完成的地址识别模型。其中,上述地址识别模型包括:特征提取模型与地址字符识别模型。由此,提升了地址识别模型识别地址信息的准确性。然后,响应于接收到待识别地址图像,将上述待识别地址图像输入至上述特征提取模型中,得到待识别地址特征信息。其中,上述待识别地址特征信息包括:多层次地址特征信息集。由此,通过特征提取模型可以生成针对待识别地址图像的层次特征信息,以提高后续地址识别的精准度。再然后,将上述待识别地址特征信息输入至上述地址字符识别模型中,得到地址字符信息集。其中,上述地址字符识别模型包括:多层输出层,每一输出层输出一类型的地址字符信息,上述地址字符识别模型还包括:多层次检测头模型组。由此,可以使得每个输出层输出一种类型的字符信息,不仅避免了检测头模型的输出层同时执行针对地址字符的相关回归任务和相关分类任务,也避免了字符特征学习侧重点不同导致最后字符信息输出不够精准的问题。最后,根据上述地址字符信息集,生成地址信息。由此,可以将针对地址字符的相关分类任务和相关回归任务的特征学习进行区分学习,从而提高了地址信息的识别精准度。
附图说明
[0012]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
[0013]图1是根据本公开的地址信息识别方法的一些实施例的流程图;图2是根据本公开的地址信息识别装置的一些实施例的结构示意图;
图3是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
[0014]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0015]另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0016]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0017]需要注意,本公开中提及的“一个”、“本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地址信息识别方法,包括:获取地址图像样本集;对所述地址图像样本集中的每个地址图像样本进行增强处理,以生成增强地址图像样本,得到增强地址图像样本集;将所述地址图像样本集和所述增强地址图像样本集作为训练样本集,对初始地址识别模型进行训练,得到训练完成的地址识别模型,其中,所述地址识别模型包括:特征提取模型与地址字符识别模型;响应于接收到待识别地址图像,将所述待识别地址图像输入至所述特征提取模型中,得到待识别地址特征信息,其中,所述待识别地址特征信息包括:多层次地址特征信息集;将所述待识别地址特征信息输入至所述地址字符识别模型中,得到地址字符信息集,其中,所述地址字符识别模型包括:多层输出层,每一输出层输出一类型的地址字符信息,所述地址字符识别模型还包括:多层次检测头模型组;根据所述地址字符信息集,生成地址信息。2.根据权利要求1所述的方法,其中,所述将所述待识别地址特征信息输入至所述地址字符识别模型中,得到地址字符信息集,包括:将所述多层次地址特征信息集中的每个多层次地址特征信息输入至对应的多层次检测头模型,以输出地址字符信息组,得到地址字符信息组集,其中,多层次检测头模型包括:输出层组,所述输出层组为所述输出层集中的子集;将所述地址字符信息组集确定为地址字符信息集。3.根据权利要求2所述的方法,其中,所述输出层组包括:字符类别输出层、字符位置输出层、字符概率输出层;以及所述将所述多层次地址特征信息集中的每个多层次地址特征信息输入至对应的多层次检测头模型,以输出地址字符信息组,包括:将所述多层次地址特征信息输入至所述多层次检测头模型包括的字符类别输出层,得到字符类别信息;将所述多层次地址特征信息输入至所述多层次...

【专利技术属性】
技术研发人员:徐起王晓萍郭冉吴江皓韩艺嘉
申请(专利权)人:中关村科学城城市大脑股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1