一种视频字幕生成方法、电子设备、存储介质技术

技术编号:39304923 阅读:8 留言:0更新日期:2023-11-12 15:54
本申请涉及计算机技术领域,尤其是涉及一种视频字幕生成方法、电子设备、存储介质。本申请视频字幕生成方法中,视频终端设备获取字幕生成指令与目标视频文件,并基于目标视频文件进行音频提取,得到目标音频文件;将目标音频文件上传至资源服务器,以使资源服务器形成资源属性数据;当目标音频文件存入资源服务器,从资源服务器获取资源属性数据;基于字幕生成指令,将资源属性数据发送至字幕生成服务器,以使字幕生成服务器根据资源属性数据与预训练的音频识别模型生成视频字幕文件;从字幕生成服务器获取视频字幕文件。因此,本申请视频字幕生成方法中能够在视频终端设备实现自动添加字幕的功能的同时,减缓视频终端设备上的算力负担。算力负担。算力负担。

【技术实现步骤摘要】
一种视频字幕生成方法、电子设备、存储介质


[0001]本申请涉及计算机
,尤其是涉及一种视频字幕生成方法、电子设备、存储介质。

技术介绍

[0002]目前,如果用户想要在视频文件中添加字幕,需要使用单独的软件工具去自行编辑,从而实现字幕的添加,这种方式所需要的时间花费较长、效率低下。针对一些业务领域的从业人员(例如保险领域的保险代理人),很大一部分并没有视频编辑经验,而时常又需要使用一些设备来拍摄、制作一些业务领域相关的短视频用于宣传、推广,此时从业人员很难做到自主给视频文件添加字幕。
[0003]相关技术中,若需要实现在视频中自动添加字幕,则需要在设备上配置语音识别、音视频处理等类型的算法工具包,并通过这些算法工具包来实现自动添加字幕的功能。然而,字幕生成功能在视频终端设备(例如手机、摄像机等)中并非主要的功能模块,若仅仅为了实现字幕生成功能而另外配置语音识别、音视频处理等类型的算法工具包,既会占用视频终端设备的存储空间,又会影响视频终端设备的运行速度。因此,如何在实现自动添加字幕的功能的同时,减缓视频终端设备上的算力负担,以及成为业内亟待解决的一个问题。

技术实现思路

[0004]本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种视频字幕生成方法、电子设备、存储介质,能够在实现自动添加字幕的功能的同时,减缓视频终端设备上的算力负担。
[0005]根据本申请的第一方面实施例的视频字幕生成方法,应用于视频终端设备,包括:
[0006]获取字幕生成指令与目标视频文件,并基于所述目标视频文件进行音频提取,得到目标音频文件;
[0007]将所述目标音频文件上传至资源服务器,以使所述资源服务器形成资源属性数据;
[0008]当所述目标音频文件存入所述资源服务器,从所述资源服务器获取所述资源属性数据;
[0009]基于所述字幕生成指令,将所述资源属性数据发送至字幕生成服务器,以使所述字幕生成服务器根据所述资源属性数据与预训练的音频识别模型生成视频字幕文件;
[0010]从所述字幕生成服务器获取所述视频字幕文件。
[0011]根据本申请的一些实施例,所述目标视频文件包括多个短视频片段,所述基于所述目标视频文件进行音频提取,得到目标音频文件,包括:
[0012]遍历所述短视频片段,得到每一所述短视频片段对应的片段排列信息;
[0013]基于所述片段排列信息对所述短视频片段进行音频提取,得到与所述短视频片段对应的音频片段;
[0014]将多个所述音频片段进行整合,得到所述目标音频文件。
[0015]根据本申请的一些实施例,所述将所述目标音频文件上传至资源服务器,以使所述资源服务器形成资源属性数据,包括:
[0016]获取与所述目标音频文件对应的存储标识信息,所述存储标识信息用于标识与所述目标音频文件对应的项目部署环境;
[0017]基于所述存储标识信息,将所述目标音频文件上传至所述资源服务器,以使所述资源服务器形成所述资源属性数据。
[0018]根据本申请的一些实施例,所述从所述字幕生成服务器获取所述视频字幕文件,包括:
[0019]基于预设时间间隔向所述字幕生成服务器查询所述视频字幕文件的生成情况,得到结果反馈信息;
[0020]基于所述结果反馈信息,从所述字幕生成服务器获取所述视频字幕文件。
[0021]根据本申请的一些实施例,所述基于所述结果反馈信息,从所述字幕生成服务器获取所述视频字幕文件,包括:
[0022]当所述视频字幕文件生成失败,基于所述结果反馈信息得到故障索引数据;
[0023]基于所述故障索引数据,执行故障反馈动作。
[0024]根据本申请的第二方面实施例的视频字幕生成方法,应用于字幕生成服务器,包括:
[0025]从视频终端设备获取资源属性数据,并对所述资源属性数据进行解析处理,得到资源定位链接、视频标识信息与音频标识信息;
[0026]基于所述资源定位链接,从所述资源服务器下载目标音频文件;
[0027]基于所述音频标识信息,通过预训练的音频识别模型对所述目标音频文件进行音频识别处理,得到目标识别文本;
[0028]基于所述视频标识信息将所述目标识别文本进行整合,得到视频字幕文件;
[0029]将所述视频字幕文件发送至所述视频终端设备。
[0030]根据本申请的一些实施例,所述基于所述音频标识信息,通过预训练的音频识别模型对所述目标音频文件进行音频识别处理,得到目标识别文本,包括:
[0031]基于所述音频标识信息,通过预训练的音频识别模型对所述目标音频文件进行音频识别处理,得到初步识别文本;
[0032]基于预设的业务用语规范对所述初步识别文本进行矫正处理,得到所述目标识别文本。
[0033]根据本申请的一些实施例,在所述基于所述音频标识信息,通过预训练的音频识别模型对所述目标音频文件进行音频识别处理,得到目标识别文本之前,所述方法还包括对所述音频识别模型进行预训练,具体包括:
[0034]获取训练音频集,所述训练音频集包括训练音频和所述训练音频的音频转换标签;
[0035]通过所述原始识别模型识别所述训练音频,得到训练识别数据;
[0036]将所述训练识别数据与所述音频转换标签进行比对,得到识别准确率;
[0037]当所述识别准确率低于预设的准确率阈值,则基于所述识别准确率更新所述原始
识别模型;
[0038]基于所述训练音频与所述音频转换标签,对更新后的所述原始识别模型进行迭代训练,直至所述识别准确率不低于所述准确率阈值,得到所述音频识别模型。
[0039]第三方面,本申请实施例提供了一种电子设备,包括:存储器、处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如本申请第一方面实施例中任意一项所述的视频字幕生成方法。
[0040]第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行实现如本申请第一方面实施例中任意一项所述的视频字幕生成方法。
[0041]根据本申请实施例的视频字幕生成方法、电子设备、存储介质,至少具有如下有益效果:
[0042]本申请视频字幕生成方法中,视频终端设备先获取字幕生成指令与目标视频文件,并基于目标视频文件进行音频提取,得到目标音频文件,再将目标音频文件上传至资源服务器,以使资源服务器形成资源属性数据,当目标音频文件存入资源服务器,从资源服务器获取资源属性数据,进一步,基于字幕生成指令,将资源属性数据发送至字幕生成服务器,字幕生成服务器从视频终端设备获取资源属性数据之后,对资源属性数据进行解析处理,得到资源定位链接、视频标识信息与音频标识信息,并基于资源定位链接,从资源服务器下载目标音频文件,再进一步,基于音频标识信息,通过预训练的音频识别模型对目标音频文件进行音频识别处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频字幕生成方法,应用于视频终端设备,其特征在于,包括:获取字幕生成指令与目标视频文件,并基于所述目标视频文件进行音频提取,得到目标音频文件;将所述目标音频文件上传至资源服务器,以使所述资源服务器形成资源属性数据;当所述目标音频文件存入所述资源服务器,从所述资源服务器获取所述资源属性数据;基于所述字幕生成指令,将所述资源属性数据发送至字幕生成服务器,以使所述字幕生成服务器根据所述资源属性数据与预训练的音频识别模型生成视频字幕文件;从所述字幕生成服务器获取所述视频字幕文件。2.根据权利要求1所述的方法,其特征在于,所述目标视频文件包括多个短视频片段,所述基于所述目标视频文件进行音频提取,得到目标音频文件,包括:遍历所述短视频片段,得到每一所述短视频片段对应的片段排列信息;基于所述片段排列信息对所述短视频片段进行音频提取,得到与所述短视频片段对应的音频片段;将多个所述音频片段进行整合,得到所述目标音频文件。3.根据权利要求1所述的方法,其特征在于,所述将所述目标音频文件上传至资源服务器,以使所述资源服务器形成资源属性数据,包括:获取与所述目标音频文件对应的存储标识信息,所述存储标识信息用于标识与所述目标音频文件对应的项目部署环境;基于所述存储标识信息,将所述目标音频文件上传至所述资源服务器,以使所述资源服务器形成所述资源属性数据。4.根据权利要求1至3任一项所述的方法,其特征在于,所述从所述字幕生成服务器获取所述视频字幕文件,包括:基于预设时间间隔向所述字幕生成服务器查询所述视频字幕文件的生成情况,得到结果反馈信息;基于所述结果反馈信息,从所述字幕生成服务器获取所述视频字幕文件。5.根据权利要求4所述的方法,其特征在于,所述基于所述结果反馈信息,从所述字幕生成服务器获取所述视频字幕文件,包括:当所述视频字幕文件生成失败,基于所述结果反馈信息得到故障索引数据;基于所述故障索引数据,执行故障反馈动作。6.一种视频字幕生成方法,应用于字幕生成服务器,其特征在...

【专利技术属性】
技术研发人员:杨丹
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1