【技术实现步骤摘要】
目标区域识别方法、装置、设备及可读存储介质
本申请实施例涉及人工智能领域,特别涉及一种目标区域识别方法、装置、设备及可读存储介质。
技术介绍
人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。其中,神经网络模型是人工智能的一种实现方式。相关技术中,在对图像中的图像内容进行区域确定时,通常机器学习模型对图像内容对应的区域进行确定,且通过预测卷积核的采样位置偏移量改变卷积核的采样位置,从而进行卷积处理,并对处理后的特征进行识别,得到图像区域。然而,由于图像内容通常在图像中以不规则的角度进行排列,针对一些在图像中以各种角度排列的图像内容,以上述方式进行识别时,由于无法将角度结合在识别过程中,从而导致识别准确率较低。
技术实现思路
本申请实施例提供了一种目标区域识别方法、装置、设备及可读存储介质,可以提高对图像内容对应的区域进行识别的准确率。所
【技术保护点】
1.一种目标区域识别方法,其特征在于,所述方法包括:/n获取输入图像,所述输入图像中包括待识别的图像内容;/n预测所述图像内容在所述输入图像中的第一旋转角度;/n以所述第一旋转角度对目标识别模型中的卷积核进行旋转后,以旋转后的所述卷积核对所述输入图像的图像特征进行卷积处理,得到目标特征;/n对所述目标特征进行识别,得到所述图像内容对应的区域数据,其中,所述区域数据中包括旋转角度,所述旋转角度用于指示所述图像内容在所述输入图像中相对默认角度的偏转角度;/n通过所述区域数据在所述输入图像中确定所述图像内容对应的所述目标区域。/n
【技术特征摘要】
1.一种目标区域识别方法,其特征在于,所述方法包括:
获取输入图像,所述输入图像中包括待识别的图像内容;
预测所述图像内容在所述输入图像中的第一旋转角度;
以所述第一旋转角度对目标识别模型中的卷积核进行旋转后,以旋转后的所述卷积核对所述输入图像的图像特征进行卷积处理,得到目标特征;
对所述目标特征进行识别,得到所述图像内容对应的区域数据,其中,所述区域数据中包括旋转角度,所述旋转角度用于指示所述图像内容在所述输入图像中相对默认角度的偏转角度;
通过所述区域数据在所述输入图像中确定所述图像内容对应的所述目标区域。
2.根据权利要求1所述的方法,其特征在于,所述以所述第一旋转角度对所述目标识别模型中的卷积核进行旋转后,对所述图像特征进行旋转卷积处理,得到目标特征,包括:
以所述第一旋转角度对至少两种卷积核进行旋转;
将所述图像特征通过所述至少两种卷积核进行卷积处理,得到所述目标特征。
3.根据权利要求2所述的方法,其特征在于,所述将所述图像特征通过所述至少两种卷积核进行卷积处理,得到所述目标特征,包括:
将所述图像特征通过所述至少两种卷积核以所述旋转卷积方式进行特征处理,得到至少两个旋转卷积特征,其中,每种卷积核对应一个所述旋转卷积特征;
将所述至少两个旋转卷积特征通过注意力机制进行卷积,生成至少两个注意力图,其中,每个注意力图对应一个旋转卷积特征;
结合所述至少两个旋转卷积特征和所述至少两个注意力图,生成所述输入图像的所述目标特征。
4.根据权利要求3所述的方法,其特征在于,所述结合所述至少两个旋转卷积特征和所述至少两个注意力图,生成所述输入图像的所述目标特征,包括:
对所述至少两个注意力图进行归一化,得到归一化特征;
将所述归一化特征与所述至少两个旋转卷积特征分别相乘取加权和,并通过所述注意力机制进行卷积,生成所述目标特征。
5.根据权利要求1至4任一所述的方法,其特征在于,所述对所述目标特征进行识别,得到所述图像内容对应的区域数据,包括:
对所述目标特征进行识别,得到所述图像内容对应的尺寸数据和位置数据;将所述第一旋转角度、所述尺寸数据和所述位置数据确定为所述图像内容对应的所述区域数据;
或,
对所述目标特征进行识别,得到所述图像内容对应的第二旋转角度、尺寸数据和位置数据;将所述第二旋转角度、所述尺寸数据和所述位置数据确定为所述图像内容对应的所述区域数据。
6.根据权利要求5所述的方法,其特征在于,所述位置数据中包括中心点数据和偏移值;
所述方法还包括:
通过所述目标特征对所述图像内容的中心点进行预测,得到所述中心点数据;
通过所述目标特征对所述中心点在图像特征缩放过程中的偏移量进行预测,得到所述偏移值。
7.一种目标区域识别装置,其特征在于,所述装置包括:
获取模块,用于获取输入图像,所述输入图像中包括待识别的图像内容;
预测模块,...
【专利技术属性】
技术研发人员:任玉强,潘兴甲,董未名,朱旭东,袁豪磊,郭晓威,徐常胜,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。