【技术实现步骤摘要】
一种完整的语音数据获得方法及装置
本专利技术涉及语音处理
,特别是涉及一种完整的语音数据获得方法及装置。
技术介绍
随着人工智能的发展和语音处理技术的日渐成熟,自然语音交互技术也得到了快速发展。目前,云端模式逐渐兴起,终端负责简单的语音信号处理运算,将超规模计算托付给云端,这样可以降低终端的运行压力,也为语音交互提供了更多选择。相应的,各大语音云服务厂商已经推出了各种语音接入方案,终端只需将实时的语音信号数据发送至语音云服务厂商的语音处理引擎中,即可对语音数据做进一步处理。在这种情况下,终端如何在实时接收到的麦克风采样数据中保证获得的语音数据的完整性,是当前关注重点问题之一。在现有技术中,为解决上述问题,常使用的方法是,当检测到语音信号的前端点时开始录入语音数据,在检测到语音信号的后端点时即停止录入语音数据,即将相邻的前端点和后端点之间的数据作为完整的语音数据。这种方法过于依赖于语音端点检测技术,目前语音端点检测技术虽在准确率上有较大提升,但是仍有误判的可能。如果存在误判,则获得的语音数据的起始位置可能被延后截取,结束位置又可能被提前,从而导致语音数据的不完 ...
【技术保护点】
一种完整的语音数据获得方法,其特征在于,包括:在接收麦克风采样数据的过程中,利用所述采样数据实时刷新前向语音帧缓存器中的缓存数据;在检测到所述采样数据中存在语音信号的前端点时,开始记录所述采样数据,并将所述前向语音帧缓存器中当前缓存数据确定为第一缓存数据;在检测到所述采样数据中存在语音信号的后端点时,停止记录所述采样数据,并开始在空的后向语音帧缓存器中填充所述采样数据,直至达到设定条件时,将所述后向语音帧缓存器中当前缓存数据确定为第二缓存数据;在记录得到的所述采样数据的前部添加所述第一缓存数据,在记录得到的所述采样数据的尾部添加所述第二缓存数据,获得完整的语音数据。
【技术特征摘要】
1.一种完整的语音数据获得方法,其特征在于,包括:在接收麦克风采样数据的过程中,利用所述采样数据实时刷新前向语音帧缓存器中的缓存数据;在检测到所述采样数据中存在语音信号的前端点时,开始记录所述采样数据,并将所述前向语音帧缓存器中当前缓存数据确定为第一缓存数据;在检测到所述采样数据中存在语音信号的后端点时,停止记录所述采样数据,并开始在空的后向语音帧缓存器中填充所述采样数据,直至达到设定条件时,将所述后向语音帧缓存器中当前缓存数据确定为第二缓存数据;在记录得到的所述采样数据的前部添加所述第一缓存数据,在记录得到的所述采样数据的尾部添加所述第二缓存数据,获得完整的语音数据。2.根据权利要求1所述的方法,其特征在于,所述直至达到设定条件时,将所述后向语音帧缓存器中当前缓存数据确定为第二缓存数据,包括:直至所述后向语音帧缓存器填满时,将所述后向语音帧缓存器中当前缓存数据确定为第二缓存数据。3.根据权利要求2所述的方法,其特征在于,还包括:如果在所述后向语音帧缓存器未填满时,再次检测到所述采样数据中存在语音信号的前端点,则将所述后向语音帧缓存器清空,并继续记录所述采样数据,直至再次检测到所述采样数据中存在语音信号的后端点时,重复执行所述停止记录所述采样数据,并开始在空的后向语音帧缓存器中填充所述采样数据,直至所述后向语音帧缓存器填满时,将所述后向语音帧缓存器中当前缓存数据确定为第二缓存数据的步骤。4.根据权利要求1至3任一项所述的方法,其特征在于,所述前向语音帧缓存器中初始预存有设定长度的随机数据。5.根据权利要求4所述的方法,其特征在于,所述前向语音帧缓存器和所述后向语音帧缓存器均为数据先进先出缓存结构。6.一种完整的语音数据获...
【专利技术属性】
技术研发人员:张浩川,洪奕鑫,吴哲顺,余荣,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。