一种在音频中切分句子的方法和系统及视频文件的字幕自动生成方法和系统技术方案

技术编号：13516718 阅读：37 留言：0更新日期：2016-08-12 04:43

本发明专利技术实施例公开了一种在音频中切分句子的方法和系统，及视频文件的字幕自动生成方法和系统，包括：识别第一停顿；识别第一句子；识别第二停顿；判断音频是否结束，如未结束则重复上述识别句子/停顿的步骤，结束则结束；其中，所述停顿具有最小长度限制，所述句子具有最小长度限制，所述句子还具有最大长度限制。由此提高了语音识别率，使得全自动的字幕制作成为可能。

全部详细技术资料下载

【技术实现步骤摘要】
201610178500

【技术保护点】
一种在音频中切分句子的方法，其特征在于，包括以下步骤：S1、识别第一停顿，所述停顿包括静音段和/或非语音段，并记录所述第一停顿的开始时间和结束时间；S2、识别第一句子，所述句子包括语音段，并设置所述第一句子的开始时间为所述第一停顿的结束时间；S3、识别第二停顿，并记录所述第二停顿的开始时间和结束时间，设置第一句子的结束时间为所述第二停顿的开始时间，完成所述第一句子的切分；S4、判断音频是否结束，如未结束则重复所述步骤S2‑S3，结束则执行步骤S5；S5、结束；其中，所述停顿具有最小长度限制，用于忽略短伴音信息；所述句子具有最小长度限制，用于滤除掉音频中的短时无效信息；所述句子还具有最大长度限制，用于限制句子的长度,提高该句的识别准确率。

【技术特征摘要】

【专利技术属性】
技术研发人员：蔡炜，
申请(专利权)人：乐视控股北京有限公司，乐视致新电子科技天津有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人