目标对象的检测方法、装置和服务器制造方法及图纸

技术编号:29089686 阅读:11 留言:0更新日期:2021-06-30 09:55
本说明书提供了目标对象的检测方法、装置和服务器。基于该方法,具体实施前,构建并训练得到至少包含有的改进的特征提取器的预设的处理模型,其中,改进的特征提取器至少包含有6层卷积层,且6层卷积层中的第六卷积层用于提取目标对象的深层特征;具体实施时,可以调用预设的处理模型处理目标场景中的目标图像,得到对应的目标处理结果;根据目标处理结果,确定出目标图像中是否包含有目标对象,以及目标对象的对象类别和位置信息。通过调用上述预设的处理模型处理目标图像,能够有效地提取得到针对目标图像中区域范围较小的目标对象的深层特征,进而可以利用深层特征结合浅层特征,较为精准地识别出目标图像中目标对象的对象类别和位置信息。类别和位置信息。类别和位置信息。

【技术实现步骤摘要】
目标对象的检测方法、装置和服务器


[0001]本说明书属于人工智能
,尤其涉及目标对象的检测方法、装置和服务器。

技术介绍

[0002]在一些数据处理场景(例如,银行的相关业务办理场景)中,有时需要对在数据处理过程中所以采集到的图像数据进行分析识别,通过识别确定图像中是否包含有相关的目标对象,来确定数据处理是否符合相关要求。例如,识别确定办理具体业务时,用户是否提供了完整的证件、单据等材料。
[0003]由于所采集到的上述图像数据中所包含的真正要识别确定的目标对象的所占的区域范围往往较小,导致基于现有方法在对所采集到的上述图像数据进行具体识别确定时,很容易出现误差,识别精度较低。
[0004]针对上述问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本说明书提供了一种目标对象的检测方法、装置和服务器,以精准地识别并确定出在目标场景采集得到的目标图像中目标对象的对象类别和位置信息,减少识别误差,提高识别精度。
[0006]本说明书提供了一种目标对象的检测方法,包括:
[0007]获取目标场景中待检测的目标图像;
[0008]调用预设的处理模型处理目标图像,得到对应的目标处理结果;其中,所述预设的处理模型为至少包含有改进的特征提取器的图像处理模型;所述改进的特征提取器至少包含有6层卷积层,且所述6层卷积层中的第六卷积层用于提取目标对象的深层特征;
[0009]根据所述目标处理结果,确定目标图像中是否包含有目标对象;并在确定所述目标图像中包含有目标对象的情况下,确定出目标对象的对象类别,以及位置信息。
[0010]在一个实施例中,所述预设的处理模型还包含有改进的定位结构;其中,所述改进的定位结构至少包含有依次相连的2层DBL模块、2层resnet unit单元。
[0011]在一个实施例中,所述预设的处理模型按照以下方式训练得到:
[0012]获取基于YOLO v3结构的模型,作为第一初始模型;
[0013]在所述第一初始模型的特征提取器中增设第六卷积层,得到包含有改进的初始特征提取器的第二初始模型;
[0014]根据预设的训练规则,利用标注后的训练数据,训练第二初始模型,得到中间模型;
[0015]对所述中间模型进行修改,得到包含有改进的初始定位结构的模型,作为第三初始模型;
[0016]利用所述标注后的训练数据,训练所述第三初始模型,得到符合要求的预设的处理模型。
[0017]在一个实施例中,所述标注后的训练数据按照以下方式获取;
[0018]采集与目标场景相关的样本图像;
[0019]使用相匹配的标注框标注出所述样本图像中的目标对象、目标对象的对象类别,得到标注后的样本图像,作为所述标注后的训练数据。
[0020]在一个实施例中,获取基于YOLO v3结构的模型,作为第一初始模型,包括:
[0021]构建基于YOLO v3结构的网络模型,作为初始模型;
[0022]获取通用场景中采集的样本图像,并进行标注,得到标注后的初始训练数据;
[0023]利用所述标注后的初始训练数据,训练所述初始模型,以得到所述第一初始模型。
[0024]在一个实施例中,在得到所述第一初始模型之后,所述方法还包括:
[0025]根据所述标注后的训练数据,通过进行关于目标对象的边界框的长宽参数的聚类处理,得到不同类别的目标对象的边界框的长宽参数的聚类结果;
[0026]根据所述不同类别的目标对象的边界框的长宽参数的聚类结果,调整所述第一初始模型中的相关模型参数,得到调整后的第一初始模型。
[0027]在一个实施例中,所述改进的初始特征提取器还包含有第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层;
[0028]相应的,根据预设的训练规则,利用标注后的训练数据,训练第二初始模型,得到中间模型,包括:
[0029]固定第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层,利用标注后的训练数据,训练所述第二初始模型,以得到第一中间模型;
[0030]固定第一卷积层、第二卷积层、第三卷积层和第四卷积层,利用标注后的训练数据,训练所述第一中间模型,以得到第二中间模型;
[0031]固定第一卷积层、第二卷积层和第三卷积层,利用标注后的训练数据,训练所述第二中间模型,以得到第三中间模型;
[0032]固定第一卷积层和第二卷积层,利用标注后的训练数据,训练所述第三中间模型,以得到第四中间模型;
[0033]固定第一卷积层,利用标注后的训练数据,训练所述第四中间模型,以得到第五中间模型;
[0034]利用标注后的训练数据,训练所述第五中间模型,以得到所述中间模型。
[0035]在一个实施例中,对所述中间模型进行修改,得到包含有改进的初始定位结构的模型,作为第三初始模型,包括:
[0036]删除所述中间模型中与所述第六卷积层相连的分类器;并增设包含有依次相连的2层DBL模块、2层resnet unit单元、1层卷积层和detection结构的改进的初始定位结构;
[0037]将中间模型的改进的特征提取器中的第六卷积层、第五卷积层、第四卷积层和第三卷积层与所述改进的初始定位结构相连,得到所述第三初始模型。
[0038]在一个实施例中,目标场景包括:基于远程授权的业务办理场景;相应的,所述目标对象的类别包括以下至少之一:用户的身份证件、用户的业务关联凭证、用户的业务单据。
[0039]在一个实施例中,在确定所述目标图像中包含有目标对象的情况下,确定出目标对象的对象类别,以及位置信息之后,所述方法还包括:
[0040]使用与目标对象的边界框相匹配的标注框,在目标图像中对应位置标注出目标对象,以及所述目标对象的对象类别,得到标注后的目标图像;
[0041]根据所述标注后的目标图像,检测是否满足预设的远程授权条件;
[0042]在确定满足预设的远程授权条件的情况下,响应用户要求,进行远程业务办理。
[0043]本说明书还提供了一种预设的处理模型的建立方法,包括:
[0044]获取基于YOLO v3结构的模型,作为第一初始模型;
[0045]在所述第一初始模型的特征提取器中增设第六卷积层,得到包含有改进的初始特征提取器的第二初始模型;
[0046]根据预设的训练规则,利用标注后的训练数据,训练第二初始模型,得到中间模型;
[0047]对所述中间模型进行修改,得到包含有改进的初始定位结构的模型,作为第三初始模型;
[0048]利用所述标注后的训练数据,训练所述第三初始模型,得到符合要求的预设的处理模型。
[0049]在一个实施例中,对所述中间模型进行修改,得到包含有改进的初始定位结构的模型,作为第三初始模型,包括:
[0050]删除所述中间模型中与所述第六卷积层相连的分类器;并增设包含有依次本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标对象的检测方法,其特征在于,包括:获取目标场景中待检测的目标图像;调用预设的处理模型处理目标图像,得到对应的目标处理结果;其中,所述预设的处理模型为至少包含有改进的特征提取器的图像处理模型;所述改进的特征提取器至少包含有6层卷积层,且所述6层卷积层中的第六卷积层用于提取目标对象的深层特征;根据所述目标处理结果,确定目标图像中是否包含有目标对象;并在确定所述目标图像中包含有目标对象的情况下,确定出目标对象的对象类别,以及位置信息。2.根据权利要求1所述的方法,其特征在于,所述预设的处理模型还包含有改进的定位结构;其中,所述改进的定位结构至少包含有依次相连的2层DBL模块、2层resnet unit单元。3.根据权利要求2所述的方法,其特征在于,所述预设的处理模型按照以下方式训练得到:获取基于YOLO v3结构的模型,作为第一初始模型;在所述第一初始模型的特征提取器中增设第六卷积层,得到包含有改进的初始特征提取器的第二初始模型;根据预设的训练规则,利用标注后的训练数据,训练第二初始模型,得到中间模型;对所述中间模型进行修改,得到包含有改进的初始定位结构的模型,作为第三初始模型;利用所述标注后的训练数据,训练所述第三初始模型,得到符合要求的预设的处理模型。4.根据权利要求3所述的方法,其特征在于,所述标注后的训练数据按照以下方式获取;采集与目标场景相关的样本图像;使用相匹配的标注框标注出所述样本图像中的目标对象、目标对象的对象类别,得到标注后的样本图像,作为所述标注后的训练数据。5.根据权利要求4所述的方法,其特征在于,获取基于YOLO v3结构的模型,作为第一初始模型,包括:构建基于YOLO v3结构的网络模型,作为初始模型;获取通用场景中采集的样本图像,并进行标注,得到标注后的初始训练数据;利用所述标注后的初始训练数据,训练所述初始模型,以得到所述第一初始模型。6.根据权利要求5所述的方法,其特征在于,在得到所述第一初始模型之后,所述方法还包括:根据所述标注后的训练数据,通过进行关于目标对象的边界框的长宽参数的聚类处理,得到不同类别的目标对象的边界框的长宽参数的聚类结果;根据所述不同类别的目标对象的边界框的长宽参数的聚类结果,调整所述第一初始模型中的相关模型参数,得到调整后的第一初始模型。7.根据权利要求3所述的方法,其特征在于,所述改进的初始特征提取器还包含有第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层;相应的,根据预设的训练规则,利用标注后的训练数据,训练第二初始模型,得到中间
模型,包括:固定第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层,利用标注后的训练数据,训练所述第二初始模型,以得到第一中间模型;固定第一卷积层、第二卷积层、第三卷积层和第四卷积层,利用标注后的训练数据,训练所述第一中间模型,以得到第二中间模型;固定第一卷积层、第二卷积层和第三卷积层,利用标注后的训练数据,训练所述第二中间模型,以得到第三中间模型;固定第一卷积层和第二卷积层,利用标注后的训练数据,训练所述第三中间模型,以得到第四中间模型;固定第一卷积层,利用标注后的训练数据...

【专利技术属性】
技术研发人员:杨瑞迪
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1