目标对象识别方法及装置制造方法及图纸

技术编号:27809592 阅读:20 留言:0更新日期:2021-03-30 09:37
本申请提供目标对象识别方法及装置,其中,所述方法包括将接收的初始图片输入第一检测模型,获得所述初始图片中一个或多个目标对象的初始位置;将所述初始位置对应的候选图片输入第二检测模型,获得所述候选图片中的验证对象以及所述验证对象在所述候选图片中的验证位置;基于所述验证位置对所述一个或多个目标对象的初始位置进行调整,以获得所述一个或多个目标对象的目标位置;将所述目标位置对应的目标图片输入识别模型,获得所述初始图片中的一个或多个目标对象。所述方法采用检测模型对不同场景的图片或者视频中的目标对象进行快速、精确的提取,还可以基于验证位置辅助目标对象的最终位置定位,从而获得目标对象精确的识别结果。的识别结果。的识别结果。

【技术实现步骤摘要】
目标对象识别方法及装置


[0001]本申请涉及计算机
,特别涉及一种目标对象识别方法。本申请同时涉及一种目标对象识别装置,一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]随着互联网和移动设备(例如手机、平板电脑等)的普及发展,在移动设备上进行各种娱乐活动的需求与日俱增。人们会在手机或其他移动设备上浏览网页、观看视频、参与游戏等。用户常常希望可以剪辑出游戏、比赛中与自身有关的精彩时刻,如击杀、助攻等。而视频网站也希望可以在识别出如进球或其他重要信息,便于展示和吸引用户。为了更方便图片和视频的处理,需要对图片或者视频中的重要信息(例如比赛的得分)进行识别。而现有技术中对图片或者视频中的重要信息进行识别的方法不能很好的适配各种应用场景,且识别精确度较差。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种目标对象识别方法。本申请同时涉及一种目标对象识别装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的对图片或者视频中的重要信息识别精确度差的技术缺陷。
[0004]根据本申请实施例的第一方面,提供了一种目标对象识别方法,包括:
[0005]将接收的初始图片输入第一检测模型,获得所述初始图片中一个或多个目标对象的初始位置;
[0006]将所述初始位置对应的候选图片输入第二检测模型,获得所述候选图片中的验证对象以及所述验证对象在所述候选图片中的验证位置;
[0007]基于所述验证位置对所述一个或多个目标对象的初始位置进行调整,以获得所述一个或多个目标对象的目标位置;
[0008]将所述目标位置对应的目标图片输入识别模型,获得所述初始图片中的一个或多个目标对象。
[0009]根据本申请实施例的第二方面,提供了一种目标对象识别装置,包括:
[0010]初始位置确定模块,被配置为将接收的初始图片输入第一检测模型,获得所述初始图片中一个或多个目标对象的初始位置;
[0011]验证位置确定模块,被配置为将所述初始位置对应的候选图片输入第二检测模型,获得所述候选图片中的验证对象以及所述验证对象在所述候选图片中的验证位置;
[0012]目标位置确定模块,被配置为基于所述验证位置对所述一个或多个目标对象的初始位置进行调整,以获得所述一个或多个目标对象的目标位置;
[0013]目标对象获得模块,被配置为将所述目标位置对应的目标图片输入识别模型,获得所述初始图片中的一个或多个目标对象。
[0014]根据本申请实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储
在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述目标对象识别方法的步骤。
[0015]根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述目标对象识别方法的步骤。
[0016]本申请提供的所述目标对象识别方法及装置,其中,所述目标对象识别方法包括将接收的初始图片输入第一检测模型,获得所述初始图片中一个或多个目标对象的初始位置;将所述初始位置对应的候选图片输入第二检测模型,获得所述候选图片中的验证对象以及所述验证对象在所述候选图片中的验证位置;基于所述验证位置对所述一个或多个目标对象的初始位置进行调整,以获得所述一个或多个目标对象的目标位置;将所述目标位置对应的目标图片输入识别模型,获得所述初始图片中的一个或多个目标对象。具体的,所述目标对象识别方法采用预先训练的轻量级神经网络的第一检测模型和第二检测模型,可以对不同场景不同版式的图片或者视频中的目标对象进行快速、精确的提取,并且还可以基于验证位置辅助目标对象的最终位置定位,从而通过识别模型获得目标对象更加精确的识别结果。
附图说明
[0017]图1是本申请一实施例提供的一种目标对象识别方法的具体应用结构示意图;
[0018]图2是本申请一实施例提供的一种目标对象识别方法的流程图;
[0019]图3是本申请一实施例提供的一种目标对象识别方法中初始图片的示意图;
[0020]图4是本申请一实施例提供的一种目标对象识别方法应用在游戏比赛场景的流程图;
[0021]图5是本申请一实施例提供的一种目标对象识别装置的结构示意图;
[0022]图6是本申请一实施例提供的一种计算设备的结构框图。
具体实施方式
[0023]在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
[0024]在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0025]应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0026]首先,对本申请一个或多个实施例涉及的名词术语进行解释。
[0027]模板匹配:模板匹配是在一幅图片中寻找与另一幅模板图片最相似部分的技术,通常通过滑窗等传统图片处理方法。
[0028]目标检测:通过模板匹配或者神经网络,找出图片中所有感兴趣的目标。
[0029]OCR:Optical Character Recognition,光学字符识别,指对文本资料的图片文件进行分析识别处理,获取文字及版面信息的过程。
[0030]MobileNet:轻量化网络。
[0031]SSD:Single Shot MultiBox Detector,目标检测算法。
[0032]Faster

RCNN:一种CNN(Convolutional Neural Networks,卷积神经网络)网络目标检测方法,一个完全end

to

end的CNN对象检测模型。
[0033]Logo:一种设计的名称,指的是商品、企业、网站等为自己主题或者活动等设计标志的一种行为。
[0034]现有技术中,在游戏图片或者游戏视频中,通常需要对游戏角色和击杀提示等重要信息进行提取,由于用户常常更关心涉及自身的信息,为了定位是否为该类信息,也常需要识别其他关键部分,例如用户本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标对象识别方法,其特征在于,包括:将接收的初始图片输入第一检测模型,获得所述初始图片中一个或多个目标对象的初始位置;将所述初始位置对应的候选图片输入第二检测模型,获得所述候选图片中的验证对象以及所述验证对象在所述候选图片中的验证位置;基于所述验证位置对所述一个或多个目标对象的初始位置进行调整,以获得所述一个或多个目标对象的目标位置;将所述目标位置对应的目标图片输入识别模型,获得所述初始图片中的一个或多个目标对象。2.根据权利要求1所述的目标对象识别方法,其特征在于,所述将接收的初始图片输入第一检测模型之前,还包括:接收待处理视频,基于预设提取规则从所述待处理视频中提取i个视频帧作为初始图片,其中,i∈[1,n],且i为正整数。3.根据权利要求2所述的目标对象识别方法,其特征在于,所述将接收的初始图片输入第一检测模型,获得所述初始图片中一个或多个目标对象的初始位置,包括:将接收的第i个初始图片输入第一检测模型,获得所述第i个初始图片中一个或多个目标对象的初始位置;相应的,所述将所述目标位置对应的目标图片输入识别模型,获得所述初始图片中的目标对象,包括:将所述目标位置对应的目标图片输入识别模型,获得所述第i个初始图片中的一个或多个目标对象;判断i是否大于n,若是,则统计出每个初始图片中的一个或多个目标对象,若否,则将i自增1,继续执行将接收的第i个初始图片输入第一检测模型。4.根据权利要求3所述的目标对象识别方法,其特征在于,所述将接收的第i个初始图片输入第一检测模型,获得所述第i个初始图片中一个或多个目标对象的初始位置,包括:将接收的第i个初始图片输入第一检测模型;判断所述第i个初始图片中是否包括目标对象,若是,则获得所述第i个初始图片中一个或多个目标对象的初始位置,若否,则将i自增1,继续执行将接收的第i个初始图片输入第一检测模型。5.根据权利要求3或4所述的目标对象识别方法,其特征在于,所述将所述目标位置对应的目标图片输入识别模型,获得所述第i个初始图片中的一个或多个目标对象,包括:将所述目标位置对应的目标图片输入识别模型,若所述第i个初始图片的图片背景不满足预定条件,则将第i

1个初始图片中的一个或多个目标对象作为所述第i个初始图片中的一个或多个目标对象。6.根据权利要求3或4所述的目标对象识别方法,其特征在于,所述统计出每个初始图片中的一个或多个目标对象之后,还包括:在所述第i个初始图片中的一个或多个目标对象不满足...

【专利技术属性】
技术研发人员:徐宝函李佩易
申请(专利权)人:上海哔哩哔哩科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1