【技术实现步骤摘要】
图像识别方法、装置、设备、存储介质及程序产品
[0001]本公开涉及人工智能领域,具体涉及计算机视觉和深度学习技术,具体可用于智慧城市和智能交通场景下,尤其涉及一种图像识别方法、装置、设备、存储介质及程序产品。
技术介绍
[0002]在人体动作识别领域,经常需要识别做出动作的人体以及动作对应的物体,这个识别过程被称为人物交互关系检测。具体的,人物交互关系检测是指给定一张图像,根据图像定位出所有做动作的人体和物体,以及他们的交互关系。
[0003]在图像中包含人体和物体数量较多,且动作复杂的情况下,如何对人物交互关系进行检测是一个挑战。
技术实现思路
[0004]本公开提供了一种图像识别方法、装置、设备以及存储介质。
[0005]根据本公开的一方面,提供了一种图像识别方法,包括:
[0006]分别确定待检测图像的对象解码特征和对象交互关系的原始交互解码特征;
[0007]确定与原始交互解码特征所关联的对象解码特征,并采用关联的对象解码特征对原始交互解码特征进行更新,得到新的交互解 ...
【技术保护点】
【技术特征摘要】
1.一种图像识别方法,包括:分别确定待检测图像的对象解码特征和对象交互关系的原始交互解码特征;确定与原始交互解码特征所关联的对象解码特征,并采用关联的对象解码特征对原始交互解码特征进行更新,得到新的交互解码特征;根据待检测图像的对象解码特征和新的交互解码特征,确定待检测图像中对象交互关系所属的至少两个对象。2.根据权利要求1所述的方法,其中,确定与原始交互解码特征所关联的对象解码特征,包括:针对每一网络层,根据该网络层中对象解码单元所输出的对象解码特征,确定对象解码特征的对象语义嵌入;根据该网络层中交互解码单元所输出的原始交互解码特征,确定原始交互解码特征的预测人体语义嵌入和预测物体语义嵌入;根据该网络层的对象语义嵌入,以及原始交互解码特征的预测人体语义嵌入和预测物体语义嵌入,从对象解码特征中选择与原始交互解码特征匹配的至少一个人体解码特征和至少一个物体解码特征。3.根据权利要求2所述的方法,其中,根据该网络层的对象语义嵌入,以及原始交互解码特征的预测人体语义嵌入和预测物体语义嵌入,从对象解码特征中选择与原始交互解码特征匹配的至少一个人体解码特征和至少一个物体解码特征,包括:计算预测人体语义嵌入和每个对象语义嵌入之间的第一欧式距离,并根据所述第一欧式距离从对象解码特征中确定与原始交互解码特征匹配的至少一个人体解码特征;计算预测物体语义嵌入和每个对象语义嵌入之间的第二欧式距离,并根据所述第二欧式距离从对象解码特征中确定与原始交互解码特征匹配的至少一个物体解码特征。4.根据权利要求2所述的方法,其中,采用关联的对象解码特征对原始交互解码特征进行更新,得到新的交互解码特征,包括:将原始交互解码特征匹配的至少一个人体解码特征进行拼接,得到人体拼接解码特征,将原始交互解码特征匹配的至少一个物体解码特征进行拼接,得到物体拼接解码特征;将所述人体拼接解码特征和物体拼接解码特征进行空间变化后,与原始交互解码特征进行叠加,得到新的交互解码特征。5.根据权利要求3所述的方法,其中,根据所述第一欧式距离从对象解码特征中确定与原始交互解码特征匹配的至少一个人体解码特征,包括:按照所述第一欧式距离将对象语义嵌入进行排序,根据排序结果和网络层的层级,筛选设定数量的对象语义嵌入,并将所选择的对象语义嵌入对应的对象解码特征确定为与原始交互解码特征匹配的人体解码特征;根据所述第二欧式距离从对象解码特征中确定与原始交互解码特征匹配的至少一个物体解码特征,包括:按照所述第二欧式距离将对象语义嵌入进行排序,根据排序结果和网络层的层级,筛选设定数量的对象语义嵌入,并将所选择的对象语义嵌入对应的对象解码特征确定为与原始交互解码特征匹配的物体解码特征;其中,网络层的层级越低,选择对象语义嵌入的数量越大。
6.根据权利要求2所述的方法,其中,根据待检测图像的对象解码特征和新的交互解码特征,确定待检测图像中对象交互关系所属的至少两个对象,包括:根据尾部网络层中对象解码单元输出的对象解码特征和新的交互解码特征,确定待检测图像中对象交互关系所属的人体和物体。7.根据权利要求1所述的方法,在分别确定待检测图像的对象解码特征和对象交互关系的原始交互解码特征之前,还包括:将待检测图像输入至主干残差网络中进行图像特征提取,得到待检测图像的图像特征;将待检测图像的图像特征输入至图像编码器中,得到图像编码器输出的图像编码特征,所述图像编码特征用于确定首部网络层的对象解码特征和交互解码特征。8.一种图像识别装置,包括:解码特征确定模块,用于分别确定待检测图像的对象解码特征和对象交互关系的原始交互解码特征;交互解码特征更新模块,用于确定与原始交互解码特征所关联的对象解码特征,并采用关联的对象解码特征对原始交互解码特征进行更新,得到...
【专利技术属性】
技术研发人员:周德森,王健,孙昊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。