【技术实现步骤摘要】
视频处理方法、装置、电子设备以及可读存储介质
[0001]本申请涉及通信
,特别是涉及一种视频处理方法、装置、电子设备以及可读存储介质。
技术介绍
[0002]近年来,随着网络技术的不断发展,视频会议得到了越来越广泛的应用。
[0003]相关技术中,在进行视频会议时,用户想要对视频进行渲染处理,以使视频的展示效果更好,就需要升级参会终端系统或是升级参会终端的硬件配置,来满足用户需要的视频处理能力,但升级系统或升级硬件配置的方式成本较高。
技术实现思路
[0004]鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频处理方法和相应的一种视频处理装置、电子设备以及可读存储介质。
[0005]为了解决上述问题,本申请实施例公开了一种视频处理方法,应用于视频处理终端,所述方法包括:
[0006]获取视频会议的原始音视频流;所述原始音视频流包括原始音频流以及原始视频流;
[0007]基于所述原始音频流,识别所述原始视频流中所述视频会议的发言人 ...
【技术保护点】
【技术特征摘要】
1.一种视频处理方法,其特征在于,所述方法包括:获取视频会议的原始音视频流;所述原始音视频流包括原始音频流以及原始视频流;基于所述原始音频流,识别所述原始视频流中所述视频会议的发言人对应的发言视频段;对所述发言视频段进行渲染处理;所述渲染处理至少包括用于对所述发言视频段中指定视频帧的画面的美化操作;基于经过所述渲染处理的发言视频段以及所述原始音频流,生成所述视频会议的目标音视频流。2.根据权利要求1所述的方法,其特征在于,所述基于所述原始音频流,识别所述原始视频流中所述视频会议的发言人对应的发言视频段,包括:基于所述原始音频流,识别所述原始音频流中的发言音频段;从所述原始视频流中截取与所述发言音频段对应的视频段,得到所述发言视频段。3.根据权利要求2所述的方法,其特征在于,在获取到的所述原始音视频流对应的时长不小于预设时长阈值的情况下,所述基于所述原始音频流,识别所述原始音频流中的发言音频段,包括:对所述原始音频流进行人声检测,以确定所述原始音频流中存在人声且人声变化规律符合预设要求的音频段,得到所述发言音频段;或者,对所述原始音频流进行转文本操作,得到所述原始音频流对应的文本;从所述文本中识别文本内容特征符合预设发言文本特征的文本段;将所述原始音频流中与文本段对应的音频段确定为所述发言音频段。4.根据权利要求2或3所述的方法,其特征在于,所述从所述原始视频流中截取与所述发言音频段对应的视频段,得到所述发言视频段,包括:对于任一所述发言音频段,基于所述发言音频段的音频起始时间和音频结束时间,确定与所述发言音频段对应的视频段的视频起始时间和视频结束时间;截取所述原始视频流中从所述视频起始时间开始至所述视频结束时间结束的视频段,得到所述发言视频段。5.根据权利要求4所述的方法,其特征在于,所述美化操作至少包括整体美化操作以及对象精修操作;所述对所述发言视频段进行渲染处理,包括:对所述指定视频帧中的整体画面执行整体美化操作,并对所述指定视频帧中的指定对象执行对象精修操作;所述基于经过所述渲染处理的发言视频段以及所述原始音频流,生成所述视频会议的目标音视频流,包括:将...
【专利技术属性】
技术研发人员:邢宝栋,卢燕青,安君超,王艳辉,
申请(专利权)人:视联动力信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。