【技术实现步骤摘要】
图像边界框筛选方法、系统、电子装置及介质
[0001]本专利技术涉及图像处理领域,具体而言,涉及一种图像边界框筛选方法、系统、装置及介质。
技术介绍
[0002]在各种业务平台涉及数据、人员等的风险控制需求环境或者说风控场景里,经常需要从视频等图像影像中提取特定的文本信息(比如姓名、年龄等),供风控使用。而一般这些信息在不同的具体应用场景里,例如视频里的不同的图片中,因而需要从特定的图片里提取这些信息。而现有技术中,从监控视频、图像/图片等影像类中获取这些特定的图片的方式是通过通过目标检测算法从这些影像类的图像帧/图片帧中,获得许多大大小小的边界框,并且,需要提取特定的边界框中的文本信息。但是,由于检测出的边界框非常多且由于不同视频中获取到的所需边界框的大小也不一样,现有技术大多通过:定向训练仅有所需边界框的模型、手动设置筛选条件来获取所需边界框这两种方式来找到所需字段。而第一种方式需要耗费大量的人力;第二种方式虽然相对便捷,但手动设置的筛选条件准确度不够高,容易出现没有考虑到的异常情况。
[0003]因而针对上述两 ...
【技术保护点】
【技术特征摘要】
1.一种图像边界框筛选方法,其特征在于,包括:基于对目标图片的图像识别处理,获得一个或多个目标边界框;记录至少预设数量的所述目标图片所对应的目标边界框中的数据;将获得的一个或多个目标边界框在记录了数据的目标边界框所确定的大小范围之间进行遍历,以筛选出优选的边界框。2.如权利要求1所述的方法,其特征在于,基于对目标图片的图像识别处理,获得一个或多个目标边界框,具体包括:根据图像分类模型进行图像分类,以获得一个或多个目标图片集合;基于图像识别和目标检测算法,对每个所述目标图片集合中的图片进行识别和检测,以获得每个集合中对应每个目标图片的一个或多个目标边界框。3.如权利要求2所述的方法,其特征在于,所述图像分类模型至少包括:基于深度学习的通用图像分类模型;和/或,所述图像识别至少包括:图片的文本信息识别以及对应所述图片的文本信息识别的置信度;和/或,所述目标检测算法至少包括:基于深度学习的R
‑
CNN算法或YOLO算法;和/或,所述目标边界框至少包括边界框的坐标数据。4.如权利要求1至3任一项所述的方法,其特征在于,记录少量所述目标图片所对应的目标边界框中的数据,具体包括:从一所述目标图片集合中抽取至少预设数量的所述目标图片;将至少预设数量的所述目标图片所对应的一个或多个目标边界框的坐标数据进行记录,存储记录的坐标数据。5.如权利要求4所述的方法,其特征在于,将获得的一个或多个目标边界框在记录了数据的目标边界框所确定的大小范围之间进行遍历,以筛选出优选的边界框,具体包括:根据记录了数据的目标边界框的坐标数据确定筛选用的每个角的坐标位置的最大值和最小值范围,形成...
【专利技术属性】
技术研发人员:王守一,
申请(专利权)人:上海淇玥信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。