一种视频同声翻译配置字幕方法及终端技术

技术编号:25695525 阅读:52 留言:0更新日期:2020-09-18 21:06
本发明专利技术提出了一种视频同声翻译配置字幕方法和终端,所述方法包括:接收用户选择的目标语言操作指令,提取视频文件中的图像信号和音频信号;将所述目标语言和音频信号发送至云端服务器或第三方语音转文字翻译软件进行同步翻译后,回传以所述目标语言的文字形式显示的目标字幕;基于时间同步信息,将所述目标字幕与图像信号进行实时匹配;当出现所述图像信号或音频信号与目标字幕不同步时,接收用户选择的音画延迟操作指令,以延迟所述图像信号或音频信号的输出时间;所述终端,通过实施上述方法,解决了视频文件没有字幕或者字幕不是用户所熟悉的语言的问题,保证了翻译后的所述目标字幕与视频图像同步,提高了用户观看视频过程中的用户体验。

【技术实现步骤摘要】
一种视频同声翻译配置字幕方法及终端
本专利技术涉及多媒体
,尤其涉及一种视频同声翻译配置字幕方法及终端。
技术介绍
随着互联网和智能终端的发展,人们越来越多地使用诸如移动终端、平板电脑、台式电脑和智能电视等智能终端观看电影和视频,但是部分国外影视作品或视频会存在没有字幕,或者字幕不是用户熟悉的语言的情况,用户在观看的过程中会存在较差的观影体验。因此,现有技术还有待改进和发展。
技术实现思路
鉴于上述状况,实有必要提供一种视频同声翻译配置字幕方法和终端,以解决上述问题。本专利技术提供了一种视频同声翻译配置字幕方法,所述方法包括:接收用户选择的目标语言操作指令,提取视频文件中的图像信号和音频信号;将所述目标语言和所述音频信号发送至云端服务器或第三方语音转文字翻译软件;所述云端服务器或第三方语音转文字翻译软件对提取的所述音频信号进行同步翻译后,回传以所述目标语言的文字形式显示的目标字幕;基于时间同步信息,将所述目标字幕与所述图像信号进行实时匹配,在显示界面上同步显示所述目标字幕;当播放过程中出现所述图像信号或所述音频信号与所述目标字幕不同步时,接收用户选择的音画延迟操作指令,以延迟所述图像信号或所述音频信号的输出时间,使得所述图像信号、所述音频信号与所述目标字幕同步匹配。进一步地,将所述目标字幕与所述图像信号进行实时匹配,具体包括:获取所述音频信号包括的至少一个音频数据帧,并确定所述音频数据帧的时间戳;获取所述音频数据帧的时间戳所对应的所述图像信号,及所述图像信号包括的图像数据帧;基于所述音频数据帧的时间戳,将所述音频数据帧所对应的所述目标字幕与所述图像数据帧相结合并进行实时匹配。进一步地,接收用户选择的所述目标语言操作指令,提取所述图像信号和所述音频信号,具体包括:在所述显示界面中设定悬浮按钮;接收用户对所述悬浮按钮的点击选择所述目标语言操作指令;基于选择的所述目标语言,提取所述图像信号和所述音频信号。进一步地,在所述显示界面上同步显示所述目标字幕,具体包括:所述悬浮按钮转变为悬浮窗口,所述悬浮窗口用于在所述显示界面上显示所述目标字幕;通过点击操作所述悬浮窗口,选择字幕样式操作指令或音画延迟操作指令或音量调节操作指令,所述字幕样式包括字幕颜色、字幕透明度以及字体大小。进一步地,所述悬浮窗口可通过手势操作,移动所述悬浮窗口在所述显示界面上的显示位置,或缩放所述悬浮窗口的显示比例。进一步地,本专利技术还提供了一种终端,所述终端包括:存储模块,用于存储视频播放程序和视频同声翻译配置字幕程序;配置模块,用于接收用户选择的目标语言操作指令,接收用户选择的音画延迟操作指令,并显示配置后的字幕;提取模块,用于提取视频文件中的图像信号和音频信号;发送模块,用于将所述目标语言和所述音频信号发送至云端服务器或第三方语音转文字翻译软件进行翻译,并接收所述云端服务器或第三方语音转文字翻译软件回传以所述目标语言的文字形式显示的目标字幕;同步模块,用于基于时间同步信息,将所述图像信号与所述目标字幕进行实时匹配;视听模块,用于显示所述图像信号和播放所述音频信号。进一步地,所述同步模块还用于:获取所述音频信号包括的至少一个音频数据帧,并确定所述音频数据帧的时间戳;获取所述音频数据帧的时间戳所对应的所述图像信号,及所述图像信号包括的图像数据帧;基于所述音频数据帧的时间戳,将所述音频数据帧对应的所述目标字幕与所述图像数据帧相结合并进行实时匹配。进一步地,所述配置模块还包括:悬浮按钮模块,用于接收用户选择的所述目标语言操作指令;悬浮窗口模块,用于显示所述目标字幕。进一步地,所述悬浮窗口模块还用于:接收用户选择的字幕样式操作指令或音画延迟操作指令或音量调节操作指令,所述字幕样式包括字幕颜色、字幕透明度以及字体大小。进一步地,所述悬浮窗口模块还用于:接收用户的手势操作指令,移动所述悬浮窗口在显示界面上的显示位置,或缩放所述悬浮窗口的显示比例。本专利技术提供的一种视频同声翻译配置字幕方法和终端,通过在视频播放过程中,根据用户对语种的需求,将提取到的所述音频信号发送至所述云端服务器或所述第三方语音转文字翻译软件,转化成用户所需语种形式的所述目标字幕,并与视频图像同步显示,当出现所述图像信号与所述目标字幕不同步时,根据用户选择的所述音画延迟操作指令,以延迟所述图像信号或所述音频信号的输出时间,从而使得所述目标字幕、所述图像信号和所述音频信号同步播放,解决了现有技术方案中视频文件没有字幕或者字幕不是用户所熟悉的语言的问题,保证了翻译后的所述目标字幕、所述图像信号与所述音频信号的同步率,提高了用户观看视频过程中的用户体验。附图说明图1是本专利技术的一个实施例中的视频同声翻译配置字幕方法的流程图。图2是本专利技术的一个实施例中的设定悬浮按钮的显示界面示意图。图3是本专利技术的一个实施例中的点击悬浮按钮后的显示界面示意图。图4是本专利技术的一个实施例中的悬浮按钮转变为悬浮窗口的显示界面示意图。图5是本专利技术的一个实施例中的点击悬浮窗口后的显示界面示意图。图6是本专利技术的一个实施例中的通过手势操作变更悬浮窗口显示位置后的显示界面示意图。图7是本专利技术的一个实施例中的通过手势操作缩放悬浮窗口显示比例后的显示界面示意图。图8是本专利技术的一个实施例中的视频同声翻译配置字幕方法中步骤S40的流程图。图9是本专利技术的一个实施例中的终端的模块示意图。主要元件符号说明11显示界面12悬浮按钮13悬浮窗口100终端110存储模块120配置模块121悬浮按钮模块122悬浮窗口模块130提取模块140发送模块150同步模块160视听模块如下具体实施方式将结合上述附图进一步说明本专利技术。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。请参阅图1,本专利技术提供了一种视频同声翻译配置字幕方法,所述视频同声翻译配置字幕方法包括以下步骤:步骤S10、接收用户选择的目标语言操作指令,提取视频文件中的图像信号和音频信号。在本实本文档来自技高网
...

【技术保护点】
1.一种视频同声翻译配置字幕方法,其特征在于,所述方法包括:/n接收用户选择的目标语言操作指令,提取视频文件中的图像信号和音频信号;/n将所述目标语言和所述音频信号发送至云端服务器或第三方语音转文字翻译软件;/n所述云端服务器或第三方语音转文字翻译软件对提取的所述音频信号进行同步翻译后,回传以所述目标语言的文字形式显示的目标字幕;/n基于时间同步信息,将所述目标字幕与所述图像信号进行实时匹配,在显示界面上同步显示所述目标字幕;/n当播放过程中出现所述图像信号或所述音频信号与所述目标字幕不同步时,接收用户选择的音画延迟操作指令,以延迟所述图像信号或所述音频信号的输出时间,使得所述图像信号、所述音频信号与所述目标字幕同步匹配。/n

【技术特征摘要】
1.一种视频同声翻译配置字幕方法,其特征在于,所述方法包括:
接收用户选择的目标语言操作指令,提取视频文件中的图像信号和音频信号;
将所述目标语言和所述音频信号发送至云端服务器或第三方语音转文字翻译软件;
所述云端服务器或第三方语音转文字翻译软件对提取的所述音频信号进行同步翻译后,回传以所述目标语言的文字形式显示的目标字幕;
基于时间同步信息,将所述目标字幕与所述图像信号进行实时匹配,在显示界面上同步显示所述目标字幕;
当播放过程中出现所述图像信号或所述音频信号与所述目标字幕不同步时,接收用户选择的音画延迟操作指令,以延迟所述图像信号或所述音频信号的输出时间,使得所述图像信号、所述音频信号与所述目标字幕同步匹配。


2.如权利要求1所述的视频同声翻译配置字幕方法,其特征在于,将所述目标字幕与所述图像信号进行实时匹配,具体包括:
获取所述音频信号包括的至少一个音频数据帧,并确定所述音频数据帧的时间戳;
获取所述音频数据帧的时间戳所对应的所述图像信号,及所述图像信号包括的图像数据帧;
基于所述音频数据帧的时间戳,将所述音频数据帧所对应的所述目标字幕与所述图像数据帧相结合并进行实时匹配。


3.如权利要求1所述的视频同声翻译配置字幕方法,其特征在于,接收用户选择的所述目标语言操作指令,提取所述图像信号和所述音频信号,具体包括:
在所述显示界面中设定悬浮按钮;
接收用户对所述悬浮按钮的点击选择所述目标语言操作指令;
基于选择的所述目标语言,提取所述图像信号和所述音频信号。


4.如权利要求3所述的视频同声翻译配置字幕方法,其特征在于,在所述显示界面上同步显示所述目标字幕,具体包括:
所述悬浮按钮转变为悬浮窗口,所述悬浮窗口用于在所述显示界面上显示所述目标字幕;
通过点击操作所述悬浮窗口,选择字幕样式操作指令或音画延迟操作指令或音量调节操作指令,所述字幕样式包括字幕颜色、字幕透明度以及字体大小。
...

【专利技术属性】
技术研发人员:郭铭煌周春林蔡权权黄智全颜林明刘奕成
申请(专利权)人:厦门盈趣科技股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1