一种音视频字幕生成方法及系统技术方案

技术编号：13455298 阅读：56 留言：0更新日期：2016-08-02 20:03

本发明专利技术适用计算机技术领域，提供了一种音视频字幕生成方法及系统，所述方法包括：获取音视频数据，提取音视频数据中的音频数据；根据说话的时间间隔、及视频画面大小，对音频数据进行切分，得到符合说话方式、及适应视频画面大小的音频数据段，并记录音频数据段的时间信息；将音频数据段通过语音识别得到对应的文本数据段，并根据音频数据段的时间信息，得到对应的文本数据段的开始时间和结束时间，形成字幕文本。本发明专利技术摆脱了人工录入字幕的繁杂工作量，实现通过识别音频数据得到文本数据，简单高效地生成完整的字幕。

全部详细技术资料下载

【技术实现步骤摘要】

【技术保护点】
一种音视频字幕生成方法，其特征在于，所述方法包括如下步骤：获取音视频数据，提取所述音视频数据中的音频数据；根据说话的时间间隔、及视频画面大小，对所述音频数据进行切分，得到符合说话方式、及适应视频画面大小的音频数据段，并记录所述音频数据段的时间信息；将所述音频数据段通过语音识别得到对应的文本数据段，并根据所述音频数据段的时间信息，得到对应的文本数据段的开始时间和结束时间，形成字幕文本。

【技术特征摘要】

【专利技术属性】
技术研发人员：王金龙，丁小响，
申请(专利权)人：广东小天才科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人