一种改进的蓝牙智能云音箱语音交互端点检测方法技术

技术编号:18239119 阅读:56 留言:0更新日期:2018-06-17 03:03
本发明专利技术涉及一种改进的蓝牙智能云音箱语音交互端点检测方法,包括智能云音箱、智能设备、数据分析处理软件APP和蓝牙模块。其中智能设备为手机、平板电脑等;其中智能设备包括蓝牙模块和数据分析处理软件APP;其中智能云音箱包括云端服务器;数据分析处理软件APP是安装在智能设备上的;蓝牙模块与蓝牙智能云音箱建立音频道的连接;智能设备的数据分析处理软件APP通过蓝牙模块与蓝牙智能云音箱建立控制指令的连接,实现数据分析处理软件APP与蓝牙智能云音箱的控制数据交互;本发明专利技术的有益效果是:解决现有相关技术中的因环境差异导致识别率差、端点误判等问题,提高了人机语音交互效率和体验。提高了效率,改善了用户体验。 1

An improved Bluetooth Intelligent Cloud speaker voice interaction endpoint detection method

The invention relates to an improved method for detecting the voice interaction endpoint of Bluetooth Intelligent Cloud sound box, including intelligent cloud speaker, intelligent device, data analysis and processing software APP and Bluetooth module. Intelligent devices include the mobile phone and the tablet computer, which include the Bluetooth module and the data analysis and processing software APP; the Intelligent Cloud speakers include the cloud server; the data analysis and processing software APP is installed on the intelligent device; the Bluetooth module is connected with the Bluetooth Intelligent Cloud sound box; the intelligent device is the intelligent device. The data analysis and processing software APP connects the Bluetooth module with the Bluetooth Intelligent Cloud sound box to realize the control data interaction between the data analysis and processing software APP and the Bluetooth Intelligent Cloud sound box. The beneficial effect of the invention is to solve the problem of poor recognition rate and endpoint misjudgment caused by the environmental difference in the existing related technologies. It improves the efficiency and experience of human-machine interaction. It improves the efficiency and improves the user experience. One

【技术实现步骤摘要】
一种改进的蓝牙智能云音箱语音交互端点检测方法
本专利技术涉及蓝牙低能耗技术应用领域,特别涉及一种改进的蓝牙智能云音箱语音交互端点检测方法。
技术介绍
在人机交互领域中,语音活动检测(VoiceActivityDetection,VAD)是一项非常关键的工作,其算法的优劣在某种程度上也直接决定了整个语音交互系统的成败,作为一个完整的语音交互系统,其最终实现及使用的效果不仅仅取决于识别的算法,许多相关因素都直接影响着应用系统的成功与否,端点检测的目的就是在复杂的应用环境下的信号流中分辨出语音信号和非语音信号,并确定语音信号的开始及结束,好的端点检测方法能改变语音识别软件存在的检测效果不理想、识别率低等问题,端点检测的高精度能确保输入的信号是有效完整的语音信号,使识别效果更准确快速。传统的端点检测方法是使用短时能量和过零率的双门限检测,首先在音频的短时能量上进行第一次判别,这个会选取一个高门限进行一次粗判决;然后使用平均过零率上进行第二次判别。虽然使用双门限端点检测计算量小,且在安静的环境啃较好的识别率,但是它也有很多不足,例如,门限值需要由经验来设置,是一个固定的参数;在时时语音交互中,涉及上下文停顿的场景也容易误判,导致人机交互效果不理想。因此,在日常生活中,涉及人机交领域,如何准确检测出音频信号的端点位置是技术人员亟待需要解决的问题。
技术实现思路
本专利技术所要解决的技术问题是:提供一种改进的蓝牙智能云音箱语音交互端点检测方法,克服现有相关技术中的因环境差异导致识别率差、端点误判等问题,提高了人机语音交互效率和体验。为解决上述技术问题,本专利技术提供一种改进的蓝牙智能云音箱语音交互端点检测方法,包括智能云音箱、智能设备、数据分析处理软件APP和蓝牙模块。其中智能设备为手机、平板电脑等;其中智能设备包括蓝牙模块和数据分析处理软件APP;其中智能云音箱包括云端服务器;所述数据分析处理软件APP是安装在智能设备上的;所述蓝牙模块与蓝牙智能云音箱建立音频道的连接;进一步优化,智能设备的数据分析处理软件APP通过蓝牙模块与蓝牙智能云音箱建立控制指令的连接,实现数据分析处理软件APP与蓝牙智能云音箱的控制数据交互;进一步优化,正常数据分析处理软件APP处于待机状态,当智能设备端唤醒语音交互时,数据分析处理软件APP启动蓝牙模块连接,并开始录音,采集音频信号,同时与蓝牙智能云音箱的云端服务器建立数据传输通道。进一步优化,数据分析处理软件APP设置一个静音保护时间,所述保护时间长由数据分析处理软件APP与云服务器一起协定;当唤醒语音交互时,即使不说话,也会有3秒的静音采集时间,避免在唤醒语音交互时,用户来不及说话,整个系统就判停;另外,蓝牙模块的面向连接方式SCO在极短时间内太频繁操作,会引起系统级的异常,所述的静音保护时间控制蓝牙模块的面向连接方式SCO在极短时间内太频繁操作。进一步优化,智能设备的数据分析处理软件APP时时提取每一帧音频信号;数据分析处理软件APP将每一帧的音频信号的持续时间设置为10ms。进一步优化,智能手机的数据分析处理软件APP计算每帧音频信号的短时能量,短时能量信号的计算公式为:;进一步优化,智能设备的数据分析处理软件APP动态判断每帧音频信号是否为语音帧;其中短时能量直接反应语音信号能量及幅度大小,根据短时能量对有声段和无声段进行判断,数据分析处理软件APP动态寻找每个帧与之前的音频帧中的最大能量值,后面的音频帧只要小于最大能量帧*门限值(M),当前短时能量小时,就动态调小门限值,当音量衰减的幅值太大,就定义为非语音帧,启动非语音计数,非语音帧连续计数达200,相当于停顿2秒,则表示讲话结束,若中间有语音帧数据,则计数器复位,重新计数。自适应门限值的公式为:;进一步优化,智能设备的数据分析处理软件APP进行有效端点判断;进一步优化,智能设备的数据分析处理软件APP向云端服务器发送采集结束,启动语音识别;数据分析处理软件APP根据结束语音采集的结果后,停止录音,并向云端服务器发送采集完成指令,开始语音识别,通过蓝牙智能云音箱中大量语音交互测试中,准确地判断出语音的端点。进一步优化,一种改进的蓝牙智能云音箱语音交互端点检测方法的工作步骤:a、智能设备的数据分析处理软件APP与蓝牙智能云音箱建立连接;b、智能设备端唤醒语音交互;c、智能设备的数据分析处理软件APP启动静音保护时间计数器;d、智能设备的数据分析处理软件APP时时提取每一帧音频信号;e、智能设备的数据分析处理软件APP计算每帧音频信号的短时能量;f、智能设备的数据分析处理软件APP动态判断每帧音频信号是否为语音帧;h、智能设备的数据分析处理软件APP进行有效端点判断;i、智能设备的数据分析处理软件APP向云端服务器发送采集结束,启动语音识别。采用了上述技术方案后,本专利技术的有益效果是:相对于现有的技术方案,提供一种改进的蓝牙智能云音箱语音交互端点检测方法,解决现有相关技术中的因环境差异导致识别率差、端点误判等问题,提高了人机语音交互效率和体验。提高了效率,改善了用户体验。附图说明图1是一种改进的蓝牙智能云音箱语音交互端点检测方法工作模块图图2是一种改进的蓝牙智能云音箱语音交互端点检测方法工作流程图具体实施方式下面结合附图1至附图2和具体实施例对本专利技术进行详细描述,但不作为对本专利技术的限定。如附图1至附图2所示,一种改进的蓝牙智能云音箱语音交互端点检测方法,包括智能云音箱、智能设备、数据分析处理软件APP和蓝牙模块。其中智能设备为手机、平板电脑等;其中智能设备包括蓝牙模块和数据分析处理软件APP;其中智能云音箱包括云端服务器;数据分析处理软件APP是安装在智能设备上的;蓝牙模块与蓝牙智能云音箱建立音频道的连接;智能设备的数据分析处理软件APP通过蓝牙模块与蓝牙智能云音箱建立控制指令的连接,实现数据分析处理软件APP与蓝牙智能云音箱的控制数据交互;正常数据分析处理软件APP处于待机状态,当智能设备端唤醒语音交互时,数据分析处理软件APP启动蓝牙模块连接,并开始录音,采集音频信号,同时与蓝牙智能云音箱的云端服务器建立数据传输通道。数据分析处理软件APP设置一个静音保护时间,所述保护时间长由数据分析处理软件APP与云服务器一起协定;当唤醒语音交互时,即使不说话,也会有3秒的静音采集时间,避免在唤醒语音交互时,用户来不及说话,整个系统就判停;另外,蓝牙模块的面向连接方式SCO在极短时间内太频繁操作,会引起系统级的异常,所述的静音保护时间控制蓝牙模块的面向连接方式SCO在极短时间内太频繁操作。智能设备的数据分析处理软件APP时时提取每一帧音频信号;数据分析处理软件APP将每一帧的音频信号的持续时间设置为10ms。智能手机的数据分析处理软件APP计算每帧音频信号的短时能量,短时能量信号的计算公式为:;智能设备的数据分析处理软件APP动态判断每帧音频信号是否为语音帧;其中短时能量直接反应语音信号能量及幅度大小,根据短时能量对有声段和无声段进行判断,数据分析处理软件APP动态寻找每个帧与之前的音频帧中的最大能量值,后面的音频帧只要小于最大能量帧*门限值(M),当前短时能量小时,就动态调小门限值,当音量衰减的幅值太大,就定义为非语音帧,启动非语音计数,非本文档来自技高网...
一种改进的蓝牙智能云音箱语音交互端点检测方法

【技术保护点】
1.一种改进的蓝牙智能云音箱语音交互端点检测方法,包括智能云音箱、智能设备、数

【技术特征摘要】
1.一种改进的蓝牙智能云音箱语音交互端点检测方法,包括智能云音箱、智能设备、数据分析处理软件APP和蓝牙模块;其特征在于:其中智能设备为手机、平板电脑等;其中智能设备包括蓝牙模块和数据分析处理软件APP;其中智能云音箱包括云端服务器;所述数据分析处理软件APP是安装在智能设备上的;所述蓝牙模块与蓝牙智能云音箱建立音频道的连接;所述智能设备的数据分析处理软件APP通过蓝牙模块与蓝牙智能云音箱建立控制指令的连接,实现数据分析处理软件APP与蓝牙智能云音箱的控制数据交互。2.根据权利要求1所述的一种改进的蓝牙智能云音箱语音交互端点检测方法,其特征在于:一种改进的蓝牙智能云音箱语音交互端点检测方法的工作步骤:a、智能设备的数据分析处理软件APP与蓝牙智能云音箱建立连接;b、智能设备端唤醒语音交互;c、智能设备的数据分析处理软件APP启动静音保护时间计数器;d、智能设备的数据分析处理软件APP时时提取每一帧音频信号;e、智能设备的数据分析处理软件APP计算每帧音频信号的短时能量;f、智能设备的数据分析处理软件APP动态判断每帧音频信号是否为语音帧;h、智能设备的数据分析处理软件APP进行有效端点判断;i、智能设备的数据分析处理软件APP向云端服务器发送采集结束,启动语音识别。3.根据权利要求2所述的一种改进的蓝牙智能云音箱语音交互端点检测方法,其特征在于:正常数据分析处理软件APP处于待机状态,当智能设备端唤醒语音交互时,数据分析处理软件APP启动蓝牙模块连接,并开始录音,采集音频信号,同时与蓝牙智能云音箱的云端服务器建立数据传输通道。4.根据权利要求2所述的一种改进的蓝牙智能云音箱语音交互端点检测方法,其特征在于:数据分析处理软件APP设置一个静音保护时间,所述保护时间长由数据分析处理软件APP与云服务器一起协定;当唤醒语音交互时,即使不说话,也会有3秒的静音采集时间,避免在唤醒语音交互时,用户来...

【专利技术属性】
技术研发人员:鲁霖
申请(专利权)人:深圳市芯中芯科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1