The invention discloses an audio acquisition method and a device. The method includes acquiring the recorded TS fragment video, extracting the audio data from the TS fragment video, determining the end position of the sentence according to the mute length of the audio data, and acquiring the target audio data according to the ending position of the sentence. Through the technical scheme of the invention, we can ensure that the target audio data obtained from the fragmentation video is a complete audio statement or audio paragraph, which is conducive to audio recognition at later stage.
【技术实现步骤摘要】
一种音频获取方法及装置
本专利技术涉及音频
,特别涉及一种音频获取方法及装置。
技术介绍
目前,在很多场景下都会使用到音频识别技术,而相关技术中在从视频中获取音频时,无法确保每次获取的音频都是完整的音频语句或音频段落,这不利于后期进行音频识别。
技术实现思路
本专利技术提供一种音频获取方法及装置,用以在从TS(TransportStream,是日本高清摄像机拍摄下进行的封装格式,全称为MPEG2-TS)碎片视频中提取音频数据时,可根据音频数据的静音长度确定该音频数据中的语句结束位置,进而根据所述语句结束位置,获取目标音频数据,从而确保从碎片视频中获得的目标音频数据为完整的音频语句或者音频段落,以有利于后期进行音频识别。本专利技术提供一种音频获取方法,包括:获取录制的TS碎片视频;从所述TS碎片视频中提取音频数据;根据所述音频数据的静音长度确定语句结束位置;根据所述语句结束位置,获取目标音频数据。在一个实施例中,在从所述TS碎片视频中提取音频数据之前,所述方法还包括:将预设数目个TS碎片视频进行合并。在一个实施例中,所述方法还包括:将所述语句结束位置之后的剩余语音 ...
【技术保护点】
一种音频获取方法,其特征在于,包括:获取录制的TS碎片视频;从所述TS碎片视频中提取音频数据;根据所述音频数据的静音长度确定语句结束位置;根据所述语句结束位置,获取目标音频数据。
【技术特征摘要】
1.一种音频获取方法,其特征在于,包括:获取录制的TS碎片视频;从所述TS碎片视频中提取音频数据;根据所述音频数据的静音长度确定语句结束位置;根据所述语句结束位置,获取目标音频数据。2.根据权利要求1所述的方法,其特征在于,在从所述TS碎片视频中提取音频数据之前,所述方法还包括:将预设数目个TS碎片视频进行合并。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:将所述语句结束位置之后的剩余语音与下一相邻预设数目个TS碎片视频的音频数据进行合并。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述音频数据的静音长度确定语句结束位置,包括:当所述音频数据的静音长度达到预设静音时长时,将不超过预设音频时长所述音频数据的静音开始位置确定为所述语句结束位置。5.一种音频获取位置,其特征在于,包括:...
【专利技术属性】
技术研发人员:郭建辉,
申请(专利权)人:天脉聚源北京传媒科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。