【技术实现步骤摘要】
一种音视频处理方法、装置、设备及介质
[0001]本申请涉及计算机
,尤其涉及一种音视频处理方法、装置、设备及介质。
技术介绍
[0002]目前,很多监控设备可以同时采集图像和声音,生成音视频数据,播放设备播放该音视频数据时,用户可以同时查看视频画面和收听声音。但是,现有技术中播放设备只是对监控设备采集的原始音视频数据进行重放,智能性差,当播放到有人声的视频画面时,如果视频画面中有多个人,用户难区分是哪个人发出了声音,影响用户体验。
技术实现思路
[0003]本申请提供一种音视频处理方法、装置、设备及介质,用于提高音视频播放的智能性,进而提高用户体验。
[0004]第一方面,本申请实施例提供一种音视频处理方法,应用于第一设备,包括:获取摄像机采集的第一音视频数据;其中,所述第一音视频数据包括第一音频数据和第一视频数据;从所述第一音频数据中提取至少一个第一声音特征,从所述第一视频数据中提取至少一个第一人物特征;根据声音特征和人物特征的映射信息,确定所述至少一个第一声音特征与所述至少一个第一人物特征的对应关系,其中所述映射信息用于指示至少一个第二声音特征与至少一个第二人物特征的对应关系;根据所述至少一个第一声音特征与所述至少一个第一人物特征的对应关系处理所述第一音视频数据,得到第二音视频数据,向第二设备发送所述第二音视频数据;其中,所述第二音视频数据包括第二音频数据和第二视频数据,所述第二视频数据中包含标记信息,所述标记信息用于指示在所述第二音视频数据中说话的人。
[0005]在本方
【技术保护点】
【技术特征摘要】
1.一种音视频处理方法,其特征在于,所述方法应用于第一设备,包括:获取摄像机采集的第一音视频数据;其中,所述第一音视频数据包括第一音频数据和第一视频数据;从所述第一音频数据中提取至少一个第一声音特征,从所述第一视频数据中提取至少一个第一人物特征;根据声音特征和人物特征的映射信息,确定所述至少一个第一声音特征与所述至少一个第一人物特征的对应关系,其中所述映射信息用于指示至少一个第二声音特征与至少一个第二人物特征的对应关系;根据所述至少一个第一声音特征与所述至少一个第一人物特征的对应关系处理所述第一音视频数据,得到第二音视频数据,向第二设备发送所述第二音视频数据;其中,所述第二音视频数据包括第二音频数据和第二视频数据,所述第二视频数据中包含标记信息,所述标记信息用于指示在所述第二音视频数据中说话的人。2.如权利要求1所述的方法,其特征在于,所述声音特征包括以下一项或多项:声纹、音调、音色、语调、语义分析结果。3.如权利要求1所述的方法,其特征在于,所述人物特征包括以下一项或多项:人脸特征、肢体特征、衣着特征、步态特征、唇语分析结果。4.如权利要求1所述的方法,其特征在于,所述第一设备为所述摄像机,或者,所述第一设备为与所述摄像机通信连接的网络设备。5.如权利要求1
‑
4任一项所述的方法,其特征在于,在根据声音特征和人物特征的映射信息,确定所述至少一个第一声音特征与所述至少一个第一人物特征的对应关系,还包括:从本地预配置信息中读取所述映射信息;或者,从其它设备获取所述映射信息;或者,获取所述摄像机采集的第三音视频数据,所述第三音视频数据中包括第三音频数据和第三视频数据;根据所述第三音视频数据生成所述映射信息。6.如权利要求5所述的方法,其特征在于,所述根据所述第三音视频数据生成所述映射信息,包括:从所述第三音视频数据中提取所述至少一个第二声音特征和所述至少一个第二人物特征;其中,所述第二声音特征至少包括语义分析结果,所述第二人物特征至少包括唇语分析结果;从所述至少一个第二声音特征和所述至少一个第二人物特征中确定出语义分析结果和唇语分析结果相匹配的第二声音特征和第二人物特征;在语义分析结果和唇语分析结果相匹配的第二声音特征和第二人物特征之间建立对应关系。7.如权利要求5所述的方法,其特征在于,在所述获取所述摄像机采集的第三音视频数据之前,还包括:控制所述摄像机的摄像头转动至发声位置,以使所述摄像机采集所述第三音视频数据;所述根据所述第三音视频数据生成所述映射信息,包括:从所述第三音频数据中提取一个第二声音特征,从所述第三视频数据中提取一个第二人物特征;建立所述一个第二声音特征和所述一个第二人物特征的对应关系。
8.如权利要求1
‑
4任一项所述的方法,其特征在于,所述根据声音特征和人物特征的绑定关系,确定所述至少一个第一声音特征与所述至少一个第一人物特征的对应关系,包括:确定所述至少一个第一声音特征中的一个第一声音特征与所述映射关系中的一个第二声音特征的相似度高于第一阈值;根据所述映射关系确定与所述一个第二声音特征相对应的第二人物特征;根据所述与所述一个第二声音特征相对应的第二人物特征,从所述至少一个第一人物特征中确定出与所述一个第一声音特征相对应的第一人物特征,其中...
【专利技术属性】
技术研发人员:豆红雷,
申请(专利权)人:杭州华橙软件技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。