一种景别识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:25757285 阅读:24 留言:0更新日期:2020-09-25 21:06
本发明专利技术实施例提供了一种景别识别方法、装置、电子设备及可读存储介质,所述方法包括:获取待处理图像,并对所述待处理图像进行识别得到目标人物;对所述目标人物进行检测,得到针对所述目标人物的人体姿态信息;对所述人体姿态信息进行编码,得到人体姿态编码向量;对所述人体姿态编码向量进行回归预测,生成针对所述待处理图像的景别分数;所述景别分数包括离散化的景别分数;根据所述离散化的景别分数识别所述待处理图像的景别。本发明专利技术实施例基于目标人物的人体姿态的景别分数,精细衡量待处理图像的景别特点,且在离散化景别分数的情况下,实现任意粒度以及直观地识别待处理图像的景别。

【技术实现步骤摘要】
一种景别识别方法、装置、电子设备及可读存储介质
本专利技术涉及图像识别
,特别是涉及一种景别识别方法、一种景别识别装置、一种电子设备和一种计算机可读存储介质。
技术介绍
景别是指由于摄影机与被摄体的距离不同,而造成被摄体在摄影机寻像器中所呈现出的范围大小的区别。由近至远可粗略分为特写、近景、中景、全景、远景。在视频作品中交替地使用各种不同的景别,可以使影片剧情的叙述、人物思想感情的表达、人物关系的处理更具有表现力,从而增强影片的艺术感染力。有效的识别视频图像画面的景别,一方面有助于提高后期检索素材的效率,另一方面也能有效的丰富智能剪辑创作的表现形式。现有方法多采用直接对图像进行分类,来识别画面景别,这种分类方法一方面受类别数的限制,只能以较粗的粒度进行识别;另一方面,由于针对景别的定义具有一定的要求,例如,将画面限定在胸部以上的景别定义为近景,以及将画面限定在腰部以上的景别定义为中景,对于模棱两可的景别,即对于画面位于胸部与腰部之间的景别,难以准确的识别出其特点;同时,这种分类方法对数据采集的要求较高。而为了有效的辅助视频后期创作,不仅要识别粗略的特写、近景、中景、全景、远景等,对于模棱两可的景别,也需要准确的识别出其特点,以便进行简单的裁剪,调整为合适的景别类型。
技术实现思路
本专利技术实施例的目的在于提供一种景别识别方法、一种景别识别装置、一种电子设备和一种计算机可读存储介质,以实现准确识别模棱两可的景别。具体技术方案如下:在本专利技术实施的第一方面,首先提供了一种景别识别方法,所述方法包括:获取待处理图像,并对所述待处理图像进行识别得到目标人物;对所述目标人物进行检测,得到针对所述目标人物的人体姿态信息;对所述人体姿态信息进行编码,得到人体姿态编码向量;对所述人体姿态编码向量进行回归预测,生成针对所述待处理图像的景别分数;所述景别分数包括离散化的景别分数;根据所述离散化的景别分数识别所述待处理图像的景别。在本专利技术实施的第二方面,还提供了一种景别识别装置,所述装置包括:目标人物识别模块,用于获取待处理图像,并对所述待处理图像进行识别得到目标人物;目标人物检测模块,用于对所述目标人物进行检测,得到针对所述目标人物的人体姿态信息;人体姿态信息编码模块,用于对所述人体姿态信息进行编码,得到人体姿态编码向量;景别分数生成模块,用于对所述人体姿态编码向量进行回归预测,生成针对所述待处理图像的景别分数;所述景别分数包括离散化的景别分数;景别识别模块,用于根据所述离散化的景别分数识别所述待处理图像的景别。在本专利技术实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现任一所述的景别识别方法步骤。在本专利技术实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的景别识别方法。在本专利技术实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的景别识别方法。本专利技术实施例提供的景别识别方法及景别识别装置,通过对待处理图像中的目标人物的人体姿态信息转化为人体姿态编码向量,并对人体姿态编码向量进行回归预测,生成表征不同景别的景别分数,以采用景别分数对待处理图像进行景别识别。基于目标人物的人体姿态的景别分数对待处理图像的景别进行识别,可以在离散化景别分数的情况下,实现任意粒度以及直观地确定待处理图像的景别。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。图1为本专利技术实施例中的一种景别识别方法实施例一的步骤流程图;图2为本专利技术实施例中的一种景别识别方法实施例二的步骤流程图;图2A-2F为本专利技术实施例中的一种景别识别方法实施例二的子步骤流程图;图3为本专利技术实施例中的一种景别识别方法实施例的识别流程图;图4是本专利技术实施例中的一种景别识别装置实施例的结构框图;图4A-4F为本专利技术实施例中的一种景别识别装置实施例的结构子框图;图5为本专利技术实施例中的一种电子设备实施例的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行描述。景别是指由于摄影机与被摄体的距离不同,而造成被摄体在摄影机寻像器中所呈现出的范围大小的区别。由近至远可粗略分为特写、近景、中景、全景、远景等。在视频作品中交替地使用各种不同的景别,可以使影片剧情的叙述、人物思想感情的表达、人物关系的处理更具有表现力,从而增强影片的艺术感染力。有效的识别视频图像画面的景别,一方面有助于提高后期检索素材的效率,另一方面也能有效的丰富智能剪辑创作的表现形式。参照图1,示出了本专利技术的一种景别识别方法实施例一的步骤流程图,具体可以包括如下步骤:步骤101,获取待处理图像,并对所述待处理图像进行识别得到目标人物;在本专利技术的一种实施例中,对视频图像画面的景别进行识别以及处理,首先可以获取待处理图像,以及从待处理图像中进行识别得到目标人物,以便根据目标人物的相关特征信息,对目标人物所在的待处理图像的景别进行识别。具体的,待处理图像可以是某个视频图像画面的某一帧或某一组图像,待处理图像的获取方式可以通过图像采集设备进行实时采集,也可以通过从本地存储数据库或其它存储设备中获取,对此,本专利技术实施例不加以限制。在实际应用中,当对待处理图像进行识别时,可以出现待处理图像中不存在人物,即不包括人物图像的情况,在这种情况下,可以选择不对待处理图像中的目标人物进行识别,而是选择将待处理图像中可以用于传达影片剧情的物体作为目标物体,例如,在空中随风飘扬的五星红旗或正在摇摆的古老时钟等活动的物体;在这种情况下,还可以选取视频图像画面中的另一个待处理图像进行识别,以得到目标人物。步骤102,对所述目标人物进行检测,得到针对所述目标人物的人体姿态信息;在本专利技术的一种实施例中,在获取待处理图像,并识别出目标人物之后,可以待处理图像中的目标人物进行检测,以得到针对目标人物的人体姿态信息,以便根据目标人物的人体姿态信息,对目标人物所在的待处理图像的景别进行识别。在实际应用中,景别的定义具有一定的要求,例如,将画面限定在胸部以上的景别定义为近景,将画面限定在腰部以上的景别定义为中景,为了对画面位于胸部与腰部之间的景别,即对定义上存在模棱两可的景别进行识别,可以在依据景别定义进行粗粒度识别的基础上,根据检测得到的针对目标人物的人体姿态信息,对待处理图像进行比较细粒度的景别识别。步骤103,对所述人体姿态信息进行编码,得到人体姿态编码向量;在本专利技术的一种实施例中,对待本文档来自技高网...

【技术保护点】
1.一种景别识别方法,其特征在于,所述方法包括:/n获取待处理图像,并对所述待处理图像进行识别得到目标人物;/n对所述目标人物进行检测,得到针对所述目标人物的人体姿态信息;/n对所述人体姿态信息进行编码,得到人体姿态编码向量;/n对所述人体姿态编码向量进行回归预测,生成针对所述待处理图像的景别分数;所述景别分数包括离散化的景别分数;/n根据所述离散化的景别分数识别所述待处理图像的景别。/n

【技术特征摘要】
1.一种景别识别方法,其特征在于,所述方法包括:
获取待处理图像,并对所述待处理图像进行识别得到目标人物;
对所述目标人物进行检测,得到针对所述目标人物的人体姿态信息;
对所述人体姿态信息进行编码,得到人体姿态编码向量;
对所述人体姿态编码向量进行回归预测,生成针对所述待处理图像的景别分数;所述景别分数包括离散化的景别分数;
根据所述离散化的景别分数识别所述待处理图像的景别。


2.根据权利要求1所述的方法,其特征在于,所述待处理图像包括人物图像;所述从所述待处理图像中进行识别得到目标人物,包括:
根据所述人物图像生成对应的人体框;
获取所述待处理图像的中心点坐标与尺寸大小,以及所述人体框的坐标信息;
根据所述待处理图像的中心点坐标与尺寸大小,以及所述人体框的坐标信息,计算得到针对所述人体框的衡量指标;所述衡量指标用于衡量所述人体框与所述待处理图像之间的位置与大小关系;
将所述衡量指标最大的人体框对应的人物图像确定为所述待处理图像的目标人物。


3.根据权利要求2所述的方法,其特征在于,所述坐标信息包括针对所述人体框的边角坐标以及中心点坐标;所述根据所述待处理图像的中心点坐标与尺寸大小,以及所述人体框的坐标信息,计算得到针对所述人体框的衡量指标,包括:
根据所述人体框的边角坐标计算得到针对所述人体框的区域大小;
根据所述待处理图像的中心点坐标以及所述人体框的中心点坐标,计算得到针对所述待处理图像与所述人体框的相对中心点距离;
采用所述相对中心点距离,所述人体框的区域大小以及所述待处理图像的尺寸大小,计算得到针对所述人体框的衡量指标。


4.根据权利要求1或2所述的方法,其特征在于,所述从所述待处理图像中进行识别得到目标人物,还包括:
获取与预设人脸信息匹配的目标人脸框;所述预设人脸信息为针对指定人物的人脸信息;
将所述目标人脸框与所述人体框进行匹配确定所述目标人脸框与所述人体框的重叠度;
将所述重叠度最大的人体框对应的人物图像确定为所述待处理图像的目标人物。


5.根据权利要求2或4所述的方法,其特征在于,所述对所述目标人物进行检测,得到针对所述目标人物的人体姿态信息,包括:
获取针对人体姿态的估计模型;
将所述目标人物的人体框,以及与所述目标人物的人体框对应的人物图像输入所述估计模型,得到针对所述目标人物的关键点坐标以及与所述关键点坐标对应的置信度;
将所述目标人物的关键点坐标以及与所述关键点坐标对应的置信度作为所述目标人物的人体姿态信息。

【专利技术属性】
技术研发人员:李天琦
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1