一种音视频字幕生成方法及系统技术方案

技术编号:13455298 阅读:56 留言:0更新日期:2016-08-02 20:03
本发明专利技术适用计算机技术领域,提供了一种音视频字幕生成方法及系统,所述方法包括:获取音视频数据,提取音视频数据中的音频数据;根据说话的时间间隔、及视频画面大小,对音频数据进行切分,得到符合说话方式、及适应视频画面大小的音频数据段,并记录音频数据段的时间信息;将音频数据段通过语音识别得到对应的文本数据段,并根据音频数据段的时间信息,得到对应的文本数据段的开始时间和结束时间,形成字幕文本。本发明专利技术摆脱了人工录入字幕的繁杂工作量,实现通过识别音频数据得到文本数据,简单高效地生成完整的字幕。

【技术实现步骤摘要】

【技术保护点】
一种音视频字幕生成方法,其特征在于,所述方法包括如下步骤:获取音视频数据,提取所述音视频数据中的音频数据;根据说话的时间间隔、及视频画面大小,对所述音频数据进行切分,得到符合说话方式、及适应视频画面大小的音频数据段,并记录所述音频数据段的时间信息;将所述音频数据段通过语音识别得到对应的文本数据段,并根据所述音频数据段的时间信息,得到对应的文本数据段的开始时间和结束时间,形成字幕文本。

【技术特征摘要】

【专利技术属性】
技术研发人员:王金龙丁小响
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1