视频处理方法、装置、电子设备以及可读存储介质制造方法及图纸

技术编号:37150573 阅读:12 留言:0更新日期:2023-04-06 22:06
本申请实施例提供了一种视频处理方法、装置、电子设备以及可读存储介质,通过获取视频会议的原始音视频流;基于原始音频流,识别原始视频流中视频会议的发言人对应的发言视频段;对发言视频段进行指定处理;渲染处理至少包括用于对发言视频段中指定视频帧的画面的美化操作;基于经过指定处理的发言视频段以及原始音频流,生成视频会议的目标音视频流。这样,通过视频处理终端对视频会议的发言人的发言视频段进行渲染处理,可以在不升级参会终端系统且不升级参会终端的硬件配置的情况下,对发言人的视频流进行渲染处理,降低了使用成本的同时,达到了更好的会议展示效果。达到了更好的会议展示效果。达到了更好的会议展示效果。

【技术实现步骤摘要】
视频处理方法、装置、电子设备以及可读存储介质


[0001]本申请涉及通信
,特别是涉及一种视频处理方法、装置、电子设备以及可读存储介质。

技术介绍

[0002]近年来,随着网络技术的不断发展,视频会议得到了越来越广泛的应用。
[0003]相关技术中,在进行视频会议时,用户想要对视频进行渲染处理,以使视频的展示效果更好,就需要升级参会终端系统或是升级参会终端的硬件配置,来满足用户需要的视频处理能力,但升级系统或升级硬件配置的方式成本较高。

技术实现思路

[0004]鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频处理方法和相应的一种视频处理装置、电子设备以及可读存储介质。
[0005]为了解决上述问题,本申请实施例公开了一种视频处理方法,应用于视频处理终端,所述方法包括:
[0006]获取视频会议的原始音视频流;所述原始音视频流包括原始音频流以及原始视频流;
[0007]基于所述原始音频流,识别所述原始视频流中所述视频会议的发言人对应的发言视频段;
[0008]对所述发言视频段进行渲染处理;所述渲染处理至少包括用于对所述发言视频段中指定视频帧的画面的美化操作;
[0009]基于经过所述渲染处理的发言视频段以及所述原始音频流,生成所述视频会议的目标音视频流。
[0010]可选地,所述基于所述原始音频流,识别所述原始视频流中所述视频会议的发言人对应的发言视频段,包括:
[0011]基于所述原始音频流,识别所述原始音频流中的发言音频段;
[0012]从所述原始视频流中截取与所述发言音频段对应的视频段,得到所述发言视频段。
[0013]可选地,在获取到的所述原始音视频流对应的时长不小于预设时长阈值的情况下,所述基于所述原始音频流,识别所述原始音频流中的发言音频段,包括:
[0014]对所述原始音频流进行人声检测,以确定所述原始音频流中存在人声且人声变化规律符合预设要求的音频段,得到所述发言音频段;
[0015]或者,
[0016]对所述原始音频流进行转文本操作,得到所述原始音频流对应的文本;
[0017]从所述文本中识别文本内容特征符合预设发言文本特征的文本段;
[0018]将所述原始音频流中与文本段对应的音频段确定为所述发言音频段。
[0019]可选地,所述从所述原始视频流中截取与所述发言音频段对应的视频段,得到所述发言视频段,包括:
[0020]对于任一所述发言音频段,基于所述发言音频段的音频起始时间和音频结束时间,确定与所述发言音频段对应的视频段的视频起始时间和视频结束时间;
[0021]截取所述原始视频流中从所述视频起始时间开始至所述视频结束时间结束的视频段,得到所述发言视频段。
[0022]可选地,所述美化操作至少包括整体美化操作以及对象精修操作;所述对所述发言视频段进行渲染处理,包括:
[0023]对所述指定视频帧中的整体画面执行整体美化操作,并对所述指定视频帧中的指定对象执行对象精修操作;
[0024]所述基于经过所述渲染处理的发言视频段以及所述原始音频流,生成所述视频会议的目标音视频流,包括:
[0025]将经过所述整体美化操作以及所述对象精修操作后的发言视频段与其他视频段进行拼接,得到待编码视频流;所述其他视频段包括所述原始视频流中除所述发言视频段之外的视频段;
[0026]将所述待编码视频流与所述原始音频流进行编码,得到所述视频会议的目标音视频流。
[0027]可选地,所述基于所述原始音频流,识别所述原始视频流中所述视频会议的发言人对应的发言视频段,包括:
[0028]持续采集所述原始音频流中的声学信号;
[0029]在采集到的所述声学信号属于人声声学信号的情况下,将所述原始视频流确定为所述发言视频段。
[0030]可选地,所述美化操作至少包括整体美化操作以及对象精修操作;在获取到的所述原始音视频流对应的时长小于预设时长阈值的情况下,所述对所述发言视频段进行渲染处理,包括:
[0031]对所述指定视频帧中的整体画面执行整体美化操作,并对所述指定视频帧中的指定对象执行对象精修操作;
[0032]所述基于经过所述渲染处理的发言视频段以及所述原始音频流,生成所述视频会议的目标音视频流,包括:
[0033]将经过所述整体美化操作以及所述对象精修操作后的发言视频段以及所述原始音频流进行编码,得到所述视频会议的目标音视频流。
[0034]本申请实施例公开了一种视频处理装置,应用于视频处理终端,所述装置包括:
[0035]第一获取模块,用于获取视频会议的原始音视频流;所述原始音视频流包括原始音频流以及原始视频流;
[0036]第一识别模块,用于基于所述原始音频流,识别所述原始视频流中所述视频会议的发言人对应的发言视频段;
[0037]第一处理模块,用于对所述发言视频段进行渲染处理;所述渲染处理至少包括用于对所述发言视频段中指定视频帧的画面的美化操作;
[0038]第一生成模块,用于基于经过所述指定处理的发言视频段以及所述原始音频流,生成所述视频会议的目标音视频流。
[0039]所述第一识别模块包括:
[0040]第一识别子模块,用于基于所述原始音频流,识别所述原始音频流中的发言音频段;
[0041]第一截取模块,用于从所述原始视频流中截取与所述发言音频段对应的视频段,得到所述发言视频段。
[0042]可选地,所述第一识别模块包括:
[0043]第一检测模块,用于对所述原始音频流进行人声检测,以确定所述原始音频流中存在人声且人声变化规律符合预设要求的音频段,得到所述发言音频段。
[0044]或者,
[0045]第一转换模块,用于对所述原始音频流进行转文本操作,得到所述原始音频流对应的文本;
[0046]第一识别模块,用于从所述文本中识别文本内容特征符合预设发言文本特征的文本段;
[0047]第二确定模块,用于将所述原始音频流中与文本段对应的音频段确定为所述发言音频段。
[0048]可选地,所述第一截取模块包括以下模块:
[0049]第三确定模块,用于对于任一所述发言音频段,基于所述发言音频段的音频起始时间和音频结束时间,确定与所述发言音频段对应的视频段的视频起始时间和视频结束时间;
[0050]第一截取子模块,用于截取所述原始视频流中从所述视频起始时间开始至所述视频结束时间结束的视频段,得到所述发言视频段。
[0051]可选地,所述美化操作至少包括整体美化操作以及对象精修操作;第一处理模块包括:
[0052]第一处理子模块,用于对所述指定视频帧中的整体画面执行整体美化操作,并对所述指定视频帧中的指定对象执行对象精修操作。
[0053]相应的,所述第一生成模块包括:
[0054]第一拼接模块本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频处理方法,其特征在于,所述方法包括:获取视频会议的原始音视频流;所述原始音视频流包括原始音频流以及原始视频流;基于所述原始音频流,识别所述原始视频流中所述视频会议的发言人对应的发言视频段;对所述发言视频段进行渲染处理;所述渲染处理至少包括用于对所述发言视频段中指定视频帧的画面的美化操作;基于经过所述渲染处理的发言视频段以及所述原始音频流,生成所述视频会议的目标音视频流。2.根据权利要求1所述的方法,其特征在于,所述基于所述原始音频流,识别所述原始视频流中所述视频会议的发言人对应的发言视频段,包括:基于所述原始音频流,识别所述原始音频流中的发言音频段;从所述原始视频流中截取与所述发言音频段对应的视频段,得到所述发言视频段。3.根据权利要求2所述的方法,其特征在于,在获取到的所述原始音视频流对应的时长不小于预设时长阈值的情况下,所述基于所述原始音频流,识别所述原始音频流中的发言音频段,包括:对所述原始音频流进行人声检测,以确定所述原始音频流中存在人声且人声变化规律符合预设要求的音频段,得到所述发言音频段;或者,对所述原始音频流进行转文本操作,得到所述原始音频流对应的文本;从所述文本中识别文本内容特征符合预设发言文本特征的文本段;将所述原始音频流中与文本段对应的音频段确定为所述发言音频段。4.根据权利要求2或3所述的方法,其特征在于,所述从所述原始视频流中截取与所述发言音频段对应的视频段,得到所述发言视频段,包括:对于任一所述发言音频段,基于所述发言音频段的音频起始时间和音频结束时间,确定与所述发言音频段对应的视频段的视频起始时间和视频结束时间;截取所述原始视频流中从所述视频起始时间开始至所述视频结束时间结束的视频段,得到所述发言视频段。5.根据权利要求4所述的方法,其特征在于,所述美化操作至少包括整体美化操作以及对象精修操作;所述对所述发言视频段进行渲染处理,包括:对所述指定视频帧中的整体画面执行整体美化操作,并对所述指定视频帧中的指定对象执行对象精修操作;所述基于经过所述渲染处理的发言视频段以及所述原始音频流,生成所述视频会议的目标音视频流,包括:将...

【专利技术属性】
技术研发人员:邢宝栋卢燕青安君超王艳辉
申请(专利权)人:视联动力信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1