视频数据处理方法及装置、存储介质、计算机设备制造方法及图纸

技术编号:36330462 阅读:11 留言:0更新日期:2023-01-14 17:40
本申请公开了一种视频数据处理方法及装置、存储介质、计算机设备,该方法包括:基于应用运行终端的视频播放请求,通过源进程向应用运行终端推送源语言的初始视频数据;当接收到视频语言切换指令时,断开源进程与应用运行终端之间的连接,通过目标语言对应的目标进程建立与源进程之间的连接,并通过源进程向目标进程发送待推送视频数据;建立目标进程与应用运行终端之间的连接,结束源进程,利用目标进程将待推送视频数据解析为待推送图像数据和待推送声音数据;基于目标进程将待推送声音数据从源语言转换为目标语言,并将待推送图像数据以及转换后的待推送声音数据合成为目标推送视频数据,通过目标进程向应用运行终端推送目标推送视频数据。标推送视频数据。标推送视频数据。

【技术实现步骤摘要】
视频数据处理方法及装置、存储介质、计算机设备


[0001]本申请涉及数据处理
,尤其是涉及到一种视频数据处理方法及装置、存储介质、计算机设备。

技术介绍

[0002]随着通信技术的不断发展,用户除了使用手机、平板电脑、台式电脑等智能终端设备进行通话或者查询信息之外,对其他功能的应用也越发广泛,目前随着视频直播平台、短视频平台的飞速发展,通过各类视频平台观看视频的用户遍布全球。
[0003]目前的视频观看过程中,视频生产者将录制的音频视频数据发送到视频服务器中,再由视频服务器将视频生产者录制的视频转发给视频观看者的终端进行播放。然而,观看视频的用户可能是世界各地的用户,并不能完全理解视频生产者上传的音频视频中的语言,导致观看视频体验差,视频平台的视频播放量难以提高。

技术实现思路

[0004]有鉴于此,本申请提供了一种视频数据处理方法及装置、存储介质、计算机设备,通过线程切换的方式,实现对视频数据的实时转换,有助于在应用服务器内实现视频语言的切换,通过线程之间数据传输,将待推送视频数据传递至目标线程中,以便及时对应用运行终端内尚未播放的视频进行语言转换,有助于快速切换语言。
[0005]根据本申请的一个方面,提供了一种视频数据处理方法,包括:
[0006]基于应用运行终端的视频播放请求,通过源进程向所述应用运行终端推送源语言的初始视频数据;
[0007]当接收到视频语言切换指令时,断开所述源进程与所述应用运行终端之间的连接,基于所述视频语言切换指令指示的目标语言,通过所述目标语言对应的目标进程建立与所述源进程之间的连接,并通过所述源进程向所述目标进程发送待推送视频数据;
[0008]建立所述目标进程与所述应用运行终端之间的连接,结束所述源进程,利用所述目标进程将所述待推送视频数据解析为待推送图像数据和待推送声音数据;
[0009]基于所述目标进程将所述待推送声音数据从所述源语言转换为所述目标语言,并将所述待推送图像数据以及转换后的待推送声音数据合成为目标推送视频数据,通过所述目标进程向所述应用运行终端推送所述目标推送视频数据。
[0010]可选地,所述基于所述目标进程将所述待推送声音数据从所述源语言转换为所述目标语言,具体包括:
[0011]基于所述目标进程,对所述待推送声音数据进行语音识别得到待翻译文本数据,以及对所述待推送声音数据进行声音特征识别得到声音特征信息;
[0012]将所述待翻译文本数据翻译为基于所述目标语言的翻译文本数据,并基于所述声音特征信息对所述翻译文本数据进行声音合成,得到所述转换后的待推送声音数据。
[0013]可选地,所述声音特征信息包括音速特征、音量特征、音色特征、音高特征、语调特
征以及韵律节奏特征中至少一种;
[0014]所述基于所述声音特征信息对所述翻译文本数据进行声音合成,得到所述转换后的待推送声音数据,具体包括:
[0015]基于基准声音特征以及所述声音特征信息,对所述基准声音特征对应的基准声音参数进行调节,获得所述声音特征信息对应的声音特征参数,其中,所述基准声音参数包括基准音速参数、基准音量参数、基准音色参数、基准音高参数、基准语调参数以及基准韵律节奏参数;
[0016]利用语音合成技术,基于所述声音特征参数对所述翻译文本数据进行声音合成,得到所述转换后的待推送声音数据。
[0017]可选地,所述将所述待推送图像数据以及转换后的待推送声音数据合成为目标推送视频数据,具体包括:
[0018]将所述待翻译文本数据和所述翻译文本数据作为所述待推送图像数据的字幕,逐帧为所述待推送图像数据添加字幕;
[0019]基于添加字幕后的待推送图像数据以及所述转换后的待推送声音数据,合成为所述目标推送视频数据。
[0020]可选地,所述将所述待翻译文本数据翻译为基于所述目标语言的翻译文本数据,具体包括:
[0021]通过所述目标线程,根据预设翻译线路对应的输入参数拼装规则对所述待翻译文本数据进行拼装,得到与所述待翻译文本数据对应的翻译输入数据;
[0022]调用所述预设翻译线路,将所述翻译输入数据输入至所述预设翻译线路中进行翻译,得到翻译输出数据;
[0023]根据所述预设翻译线路对应的输出参数解析规则,对所述翻译输出数据进行解析,得到所述翻译文本数据。
[0024]可选地,所述通过所述源进程向所述目标进程发送待推送视频数据,具体包括:
[0025]通过所述源进程向所述目标进程发送所述待推送视频数据以及已推送视频帧数;
[0026]相应地,所述建立所述目标进程与所述应用运行终端之间的连接之后,所述方法还包括:
[0027]通过所述目标进程从所述应用运行终端获取已播放视频帧数,并基于所述已播放视频帧数和所述已推送视频帧数,确定所述应用运行终端的当前缓存视频帧数;
[0028]通过所述目标进程获取与所述当前缓存视频帧数对应的终端缓存视频数据。
[0029]可选地,所述利用所述目标进程将所述待推送视频数据解析为待推送图像数据和待推送声音数据,具体包括:
[0030]利用所述目标进程,将所述待推送视频数据以及所述终端缓存视频数据解析为所述待推送图像数据和所述待推送声音数据。
[0031]根据本申请的另一方面,提供了一种视频数据处理装置,包括:
[0032]第一推送模块,用于基于应用运行终端的视频播放请求,通过源进程向所述应用运行终端推送源语言的初始视频数据;
[0033]连接模块,用于当接收到视频语言切换指令时,断开所述源进程与所述应用运行终端之间的连接,基于所述视频语言切换指令指示的目标语言,通过所述目标语言对应的
目标进程建立与所述源进程之间的连接,并通过所述源进程向所述目标进程发送待推送视频数据;
[0034]进程切换模块,用于建立所述目标进程与所述应用运行终端之间的连接,结束所述源进程,利用所述目标进程将所述待推送视频数据解析为待推送图像数据和待推送声音数据;
[0035]第二推送模块,用于基于所述目标进程将所述待推送声音数据从所述源语言转换为所述目标语言,并将所述待推送图像数据以及转换后的待推送声音数据合成为目标推送视频数据,通过所述目标进程向所述应用运行终端推送所述目标推送视频数据。
[0036]可选地,所述第二推送模块,具体用于:
[0037]基于所述目标进程,对所述待推送声音数据进行语音识别得到待翻译文本数据,以及对所述待推送声音数据进行声音特征识别得到声音特征信息;
[0038]将所述待翻译文本数据翻译为基于所述目标语言的翻译文本数据,并基于所述声音特征信息对所述翻译文本数据进行声音合成,得到所述转换后的待推送声音数据。
[0039]可选地,所述声音特征信息包括音速特征、音量特征、音色特征、音高特征、语调特征以及韵律节奏特征中至少一种;
[0040]所述第二推送模块,具体用于:
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频数据处理方法,其特征在于,包括:基于应用运行终端的视频播放请求,通过源进程向所述应用运行终端推送源语言的初始视频数据;当接收到视频语言切换指令时,断开所述源进程与所述应用运行终端之间的连接,基于所述视频语言切换指令指示的目标语言,通过所述目标语言对应的目标进程建立与所述源进程之间的连接,并通过所述源进程向所述目标进程发送待推送视频数据;建立所述目标进程与所述应用运行终端之间的连接,结束所述源进程,利用所述目标进程将所述待推送视频数据解析为待推送图像数据和待推送声音数据;基于所述目标进程将所述待推送声音数据从所述源语言转换为所述目标语言,并将所述待推送图像数据以及转换后的待推送声音数据合成为目标推送视频数据,通过所述目标进程向所述应用运行终端推送所述目标推送视频数据。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标进程将所述待推送声音数据从所述源语言转换为所述目标语言,具体包括:基于所述目标进程,对所述待推送声音数据进行语音识别得到待翻译文本数据,以及对所述待推送声音数据进行声音特征识别得到声音特征信息;将所述待翻译文本数据翻译为基于所述目标语言的翻译文本数据,并基于所述声音特征信息对所述翻译文本数据进行声音合成,得到所述转换后的待推送声音数据。3.根据权利要求2所述的方法,其特征在于,所述声音特征信息包括音速特征、音量特征、音色特征、音高特征、语调特征以及韵律节奏特征中至少一种;所述基于所述声音特征信息对所述翻译文本数据进行声音合成,得到所述转换后的待推送声音数据,具体包括:基于基准声音特征以及所述声音特征信息,对所述基准声音特征对应的基准声音参数进行调节,获得所述声音特征信息对应的声音特征参数,其中,所述基准声音参数包括基准音速参数、基准音量参数、基准音色参数、基准音高参数、基准语调参数以及基准韵律节奏参数;利用语音合成技术,基于所述声音特征参数对所述翻译文本数据进行声音合成,得到所述转换后的待推送声音数据。4.根据权利要求2所述的方法,其特征在于,所述将所述待推送图像数据以及转换后的待推送声音数据合成为目标推送视频数据,具体包括:将所述待翻译文本数据和所述翻译文本数据作为所述待推送图像数据的字幕,逐帧为所述待推送图像数据添加字幕;基于添加字幕后的待推送图像数据以及所述转换后的待推送声音数据,合成为所述目标推送视频数据。5.根据权利要求2所述的方法,其特征在于,所述将所述待翻译文本数据翻译为基于所述目标语言的翻译文本数据,具体包括:通过所述目标线程,根据预设翻译线路对应的输入参数拼装规则对所述待翻译文本数据进行拼装,得到与所述待翻译文本数据对应的翻译输入数据;调用所述预设翻译线路,将所述翻译输入数据输入至所述预设翻译线路中进行翻译,得到翻译输出数据;
根据所述预设翻译线路对应的输出参数解析规则,对所述翻译输出数据进行解析,得到所述翻译文本数据。6.根据权利要求1至5中任一项所述的方法,其特征在于,所述通过所述源进程向所述目标进程发送待推送视频数据,具体包括:通过所述源进程向所述目标进程发送所述待推送视频数据以及已推送视频帧数;相应地,所述建立所述目标进程与所述应用运行终端之间的连接之后,所述方法还包括:通过所述目标进程从所述应用运行终端获取已播放视频帧数,并基于所述已播放视频帧数和所述已推送视频帧数,确定所述应用运行终端的当前缓存视频帧数;通过所述目标进程获取与所述当前缓存视频帧数对应的终端缓存视频数据。7.根据权利要求6所述的方法,其特征在于,所述利用所述目标进程将所述待推送视频数据解析为待推送图像数据和待推送声音数据,具体包括:利用所述目标进程,将所述待推送视频数据以及所述终端缓存视频数据解析为所述待推送图像数据和所述待推送声音数据。8.一种视频数据处理装置,其特征在于...

【专利技术属性】
技术研发人员:刘超董志蔡家敏
申请(专利权)人:六安科亚信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1