【技术实现步骤摘要】
从音频文件中提取有声片段的方法、装置设备及存储介质
本专利技术涉及语音识别领域,尤其涉及一种从音频文件中提取有声片段的方法、装置、设备及计算机可读存储介质。
技术介绍
随着语音识别技术日趋成熟,语音识别技术已经被广泛应用于各个行业领域,伴随各种领域语音识别软件的出现,用户可以通过语音识别软件,将语音转换为相应的文字,使得用户无需再手动输入文字,给用户的生活和工作带来很大的便利。在处理长音频文件时,一般为了避免遗漏内容,会选择从头到尾完整听一遍音频文件,这样会花费大量时间,而长音频文件中往往包含大量冗余空白内容,这些空白内容音频不属于有效内容,耗费时间浪费人力,针对处理长音频文件的效率低下等问题,目前尚未提出有效的解决方案。
技术实现思路
有鉴于此,本专利技术提供一种从音频文件中提取有声片段的方法、装置、设备及计算机可读存储介质,能够快速有效地在长音频文件中提取有用的音频文件,节约时间,提高工作效率。为解决上述技术问题,一方面,本专利技术实施例提供一种从音频文件中提取有声片段的方法,包括:< ...
【技术保护点】
1.一种从音频文件中提取有声片段的方法,其特征在于,包括:/n获取待处理音频文件;/n对所述待处理音频文件进行分割,得到多个音频片段;/n对每个所述音频片段进行语音识别,得到语音识别结果;/n基于所述音频文件的语音识别结果判断有声片段并提取所述有声片段。/n
【技术特征摘要】
1.一种从音频文件中提取有声片段的方法,其特征在于,包括:
获取待处理音频文件;
对所述待处理音频文件进行分割,得到多个音频片段;
对每个所述音频片段进行语音识别,得到语音识别结果;
基于所述音频文件的语音识别结果判断有声片段并提取所述有声片段。
2.根据权利要求1所述的方法,其特征在于,所述语音识别结果包括以字为单位的文本,以及每个字在所述音频文件中的偏移位置。
3.根据权利要求2所述的方法,其特征在于,在得到多个音频片段后攒批进行所述语音识别处理,得到各个批次的所述语音识别结果。
4.根据权利要求3所述的方法,其特征在于,对于各个批次的所述语音识别进行排序合并,得到排序后的完整的所述语音识别结果。
5.根据权利要求4所述的方法,其特征在于,基于所述语音识别结果判断有声片段并提取,具体包括:
从头开始遍历所述语音识别结果,并基于所述语音识别结果是否存在文本判断当前音频片段是否有声;
当所述语音识别结果中存在文本时,判断为当前的音频片段有声;
根据该文本中的首字的偏移位置,记录有声片段的开始位置;
继续遍历所述文本,直至出现一个不存在文本的音频片段,以上一个音频片段中的文本中最后一个字所对应的偏移位置作为该有...
【专利技术属性】
技术研发人员:张天祥,范磊,杨丽涛,
申请(专利权)人:上海依图信息技术有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。