目标对象识别方法及装置制造方法及图纸

技术编号：27809592 阅读：20 留言：0更新日期：2021-03-30 09:37

本申请提供目标对象识别方法及装置，其中，所述方法包括将接收的初始图片输入第一检测模型，获得所述初始图片中一个或多个目标对象的初始位置；将所述初始位置对应的候选图片输入第二检测模型，获得所述候选图片中的验证对象以及所述验证对象在所述候选图片中的验证位置；基于所述验证位置对所述一个或多个目标对象的初始位置进行调整，以获得所述一个或多个目标对象的目标位置；将所述目标位置对应的目标图片输入识别模型，获得所述初始图片中的一个或多个目标对象。所述方法采用检测模型对不同场景的图片或者视频中的目标对象进行快速、精确的提取，还可以基于验证位置辅助目标对象的最终位置定位，从而获得目标对象精确的识别结果。的识别结果。的识别结果。

全部详细技术资料下载

【技术实现步骤摘要】
目标对象识别方法及装置

[0001]本申请涉及计算机
，特别涉及一种目标对象识别方法。本申请同时涉及一种目标对象识别装置，一种计算设备，以及一种计算机可读存储介质。

技术介绍

[0002]随着互联网和移动设备(例如手机、平板电脑等)的普及发展，在移动设备上进行各种娱乐活动的需求与日俱增。人们会在手机或其他移动设备上浏览网页、观看视频、参与游戏等。用户常常希望可以剪辑出游戏、比赛中与自身有关的精彩时刻，如击杀、助攻等。而视频网站也希望可以在识别出如进球或其他重要信息，便于展示和吸引用户。为了更方便图片和视频的处理，需要对图片或者视频中的重要信息(例如比赛的得分)进行识别。而现有技术中对图片或者视频中的重要信息进行识别的方法不能很好的适配各种应用场景，且识别精确度较差。

技术实现思路

[0003]有鉴于此，本申请实施例提供了一种目标对象识别方法。本申请同时涉及一种目标对象识别装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的对图片或者视频中的重要信息识别精确度差的技术缺陷。
[0004]根据本申请实施例的第一方面，提供了一种目标对象识别方法，包括：
[0005]将接收的初始图片输入第一检测模型，获得所述初始图片中一个或多个目标对象的初始位置；
[0006]将所述初始位置对应的候选图片输入第二检测模型，获得所述候选图片中的验证对象以及所述验证对象在所述候选图片中的验证位置；
[0007]基于所述验证位置对所述一个或多个目标对象的初始位置进行调整，以获...

【技术保护点】

【技术特征摘要】
1.一种目标对象识别方法，其特征在于，包括：将接收的初始图片输入第一检测模型，获得所述初始图片中一个或多个目标对象的初始位置；将所述初始位置对应的候选图片输入第二检测模型，获得所述候选图片中的验证对象以及所述验证对象在所述候选图片中的验证位置；基于所述验证位置对所述一个或多个目标对象的初始位置进行调整，以获得所述一个或多个目标对象的目标位置；将所述目标位置对应的目标图片输入识别模型，获得所述初始图片中的一个或多个目标对象。2.根据权利要求1所述的目标对象识别方法，其特征在于，所述将接收的初始图片输入第一检测模型之前，还包括：接收待处理视频，基于预设提取规则从所述待处理视频中提取i个视频帧作为初始图片，其中，i∈[1，n]，且i为正整数。3.根据权利要求2所述的目标对象识别方法，其特征在于，所述将接收的初始图片输入第一检测模型，获得所述初始图片中一个或多个目标对象的初始位置，包括：将接收的第i个初始图片输入第一检测模型，获得所述第i个初始图片中一个或多个目标对象的初始位置；相应的，所述将所述目标位置对应的目标图片输入识别模型，获得所述初始图片中的目标对象，包括：将所述目标位置对应的目标图片输入识别模型，获得所述第i个初始图片中的一个或多个目标对象；判断i是否大于n，若是，则统计出每个初始图片中的一个或多个目标对象，若否，则将i自增1，继续执行将接收的第i个初始图片输入第一检测模型。4.根据权利要求3所述的目标对象识别方法，其特征在于，所述将接收的第i个初始图片输入第一检测模型，获得所述第i个初始图片中一个或多个目标对象的初始位置，包括：将接收的第i个初始图片输入第一检测模型；判断所述第i个初始图片中是否包括目标对象，若是，则获得所述第i个初始图片中一个或多个目标对象的初始位置，若否，则将i自增1，继续执行将接收的第i个初始图片输入第一检测模型。5.根据权利要求3或4所述的目标对象识别方法，其特征在于，所述将所述目标位置对应的目标图片输入识别模型，获得所述第i个初始图片中的一个或多个目标对象，包括：将所述目标位置对应的目标图片输入识别模型，若所述第i个初始图片的图片背景不满足预定条件，则将第i
‑
1个初始图片中的一个或多个目标对象作为所述第i个初始图片中的一个或多个目标对象。6.根据权利要求3或4所述的目标对象识别方法，其特征在于，所述统计出每个初始图片中的一个或多个目标对象之后，还包括：在所述第i个初始图片中的一个或多个目标对象不满足...

【专利技术属性】
技术研发人员：徐宝函，李佩易，
申请(专利权)人：上海哔哩哔哩科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人