一种景别识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：25757285 阅读：24 留言：0更新日期：2020-09-25 21:06

本发明专利技术实施例提供了一种景别识别方法、装置、电子设备及可读存储介质，所述方法包括：获取待处理图像，并对所述待处理图像进行识别得到目标人物；对所述目标人物进行检测，得到针对所述目标人物的人体姿态信息；对所述人体姿态信息进行编码，得到人体姿态编码向量；对所述人体姿态编码向量进行回归预测，生成针对所述待处理图像的景别分数；所述景别分数包括离散化的景别分数；根据所述离散化的景别分数识别所述待处理图像的景别。本发明专利技术实施例基于目标人物的人体姿态的景别分数，精细衡量待处理图像的景别特点，且在离散化景别分数的情况下，实现任意粒度以及直观地识别待处理图像的景别。

全部详细技术资料下载

【技术实现步骤摘要】
一种景别识别方法、装置、电子设备及可读存储介质
本专利技术涉及图像识别
，特别是涉及一种景别识别方法、一种景别识别装置、一种电子设备和一种计算机可读存储介质。
技术介绍
景别是指由于摄影机与被摄体的距离不同，而造成被摄体在摄影机寻像器中所呈现出的范围大小的区别。由近至远可粗略分为特写、近景、中景、全景、远景。在视频作品中交替地使用各种不同的景别，可以使影片剧情的叙述、人物思想感情的表达、人物关系的处理更具有表现力，从而增强影片的艺术感染力。有效的识别视频图像画面的景别，一方面有助于提高后期检索素材的效率，另一方面也能有效的丰富智能剪辑创作的表现形式。现有方法多采用直接对图像进行分类，来识别画面景别，这种分类方法一方面受类别数的限制，只能以较粗的粒度进行识别；另一方面，由于针对景别的定义具有一定的要求，例如，将画面限定在胸部以上的景别定义为近景，以及将画面限定在腰部以上的景别定义为中景，对于模棱两可的景别，即对于画面位于胸部与腰部之间的景别，难以准确的识别出其特点；同时，这种分类方法对数据采集的要求较高。而为了有效的辅助视频后期创作，不仅要识别粗略的特写、近景、中景、全景、远景等，对于模棱两可的景别，也需要准确的识别出其特点，以便进行简单的裁剪，调整为合适的景别类型。
技术实现思路
本专利技术实施例的目的在于提供一种景别识别方法、一种景别识别装置、一种电子设备和一种计算机可读存储介质，以实现准确识别模棱两可的景别。具体技术方案如下：在本专利技术实施的第一方面，首先提供了一种景别...

【技术保护点】
1.一种景别识别方法，其特征在于，所述方法包括：/n获取待处理图像，并对所述待处理图像进行识别得到目标人物；/n对所述目标人物进行检测，得到针对所述目标人物的人体姿态信息；/n对所述人体姿态信息进行编码，得到人体姿态编码向量；/n对所述人体姿态编码向量进行回归预测，生成针对所述待处理图像的景别分数；所述景别分数包括离散化的景别分数；/n根据所述离散化的景别分数识别所述待处理图像的景别。/n

【技术特征摘要】
1.一种景别识别方法，其特征在于，所述方法包括：
获取待处理图像，并对所述待处理图像进行识别得到目标人物；
对所述目标人物进行检测，得到针对所述目标人物的人体姿态信息；
对所述人体姿态信息进行编码，得到人体姿态编码向量；
对所述人体姿态编码向量进行回归预测，生成针对所述待处理图像的景别分数；所述景别分数包括离散化的景别分数；
根据所述离散化的景别分数识别所述待处理图像的景别。

2.根据权利要求1所述的方法，其特征在于，所述待处理图像包括人物图像；所述从所述待处理图像中进行识别得到目标人物，包括：
根据所述人物图像生成对应的人体框；
获取所述待处理图像的中心点坐标与尺寸大小，以及所述人体框的坐标信息；
根据所述待处理图像的中心点坐标与尺寸大小，以及所述人体框的坐标信息，计算得到针对所述人体框的衡量指标；所述衡量指标用于衡量所述人体框与所述待处理图像之间的位置与大小关系；
将所述衡量指标最大的人体框对应的人物图像确定为所述待处理图像的目标人物。

3.根据权利要求2所述的方法，其特征在于，所述坐标信息包括针对所述人体框的边角坐标以及中心点坐标；所述根据所述待处理图像的中心点坐标与尺寸大小，以及所述人体框的坐标信息，计算得到针对所述人体框的衡量指标，包括：
根据所述人体框的边角坐标计算得到针对所述人体框的区域大小；
根据所述待处理图像的中心点坐标以及所述人体框的中心点坐标，计算得到针对所述待处理图像与所述人体框的相对中心点距离；
采用所述相对中心点距离，所述人体框的区域大小以及所述待处理图像的尺寸大小，计算得到针对所述人体框的衡量指标。

4.根据权利要求1或2所述的方法，其特征在于，所述从所述待处理图像中进行识别得到目标人物，还包括：
获取与预设人脸信息匹配的目标人脸框；所述预设人脸信息为针对指定人物的人脸信息；
将所述目标人脸框与所述人体框进行匹配确定所述目标人脸框与所述人体框的重叠度；
将所述重叠度最大的人体框对应的人物图像确定为所述待处理图像的目标人物。

5.根据权利要求2或4所述的方法，其特征在于，所述对所述目标人物进行检测，得到针对所述目标人物的人体姿态信息，包括：
获取针对人体姿态的估计模型；
将所述目标人物的人体框，以及与所述目标人物的人体框对应的人物图像输入所述估计模型，得到针对所述目标人物的关键点坐标以及与所述关键点坐标对应的置信度；
将所述目标人物的关键点坐标以及与所述关键点坐标对应的置信度作为所述目标人物的人体姿态信息。

【专利技术属性】
技术研发人员：李天琦，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人