语音的连续交互法及相关产品制造技术

技术编号：37878060 阅读：27 留言：0更新日期：2023-06-15 21:06

本申请实施例提供一种语音的连续交互方法及相关产品，该方法包括：终端获取目标对象输入的第一语音数据，对第一语音数据识别确定为唤醒语音后，将缓存中预设的数据发送至终端的语音活动检测VAD引擎；终端的VAD引擎持续监测目标对象和车机对话，对该对话进行处理；终端的VAD引擎在检测到目标对象说话完毕后，将缓存中预设的数据再次发送至终端的VAD引擎实现连续语音交互。本申请提供的技术方案具有实现连续交互，提高用户体验度的优点。提高用户体验度的优点。提高用户体验度的优点。

全部详细技术资料下载

【技术实现步骤摘要】
语音的连续交互法及相关产品

[0001]本申请涉及语音处理
，尤其涉及一种语音的连续交互方法及相关产品。

技术介绍

[0002]车载语音交互在车联网产品中至关重要，现在驾车过程中通过语音操作导航，听多媒体，已经越来越普及，现有的车载语音交互无法实现连续的交互，这样影响了用户的体验度。

技术实现思路

[0003]本申请实施例公开了一种语音的连续交互方法及相关产品，能够实现车载语音交互的连续，提高用户的体验度。
[0004]第一方面，提供一种语音的连续交互方法，所述方法包括如下步骤：
[0005]终端获取目标对象输入的第一语音数据，对第一语音数据识别确定为唤醒语音后，将缓存中预设的数据发送至终端的语音活动检测V AD引擎；
[0006]终端的VAD引擎持续监测目标对象和车机对话，对该对话进行处理；
[0007]终端的VAD引擎在检测到目标对象说话完毕后，将缓存中预设的数据再次发送至终端的VAD引擎实现连续语音交互。
[0008]可选的，所述方法还包括：
[00...

【技术保护点】

【技术特征摘要】
1.一种语音的连续交互方法，其特征在于，所述方法包括如下步骤：终端获取目标对象输入的第一语音数据，对第一语音数据识别确定为唤醒语音后，将缓存中预设的数据发送至终端的语音活动检测VAD引擎；终端的VAD引擎持续监测目标对象和车机对话，对该对话进行处理；终端的VAD引擎在检测到目标对象说话完毕后，将缓存中预设的数据再次发送至终端的VAD引擎实现连续语音交互。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：若检测到目标对象说话完毕后，检测是否满足连续语音结束条件，若满足连续语音结束条件，停止将缓存中预设的数据发送至终端的VAD引擎以停止连续语音交互。3.根据权利要求2所述的方法，其特征在于，所述检测是否满足连续语音结束条件具体包括：在目标对象说话完毕后，启动计时器，所述计时器用于再次接收到目标对象的语音数据时停止，获取计时器的第一时长，若第一时长大于时间阈值，确定满足连续语音结束条件。4.根据权利要求2所述的方法，其特征在于，所述检测是否满足连续语音结束条件具体包括：在目标对象说话完毕后，再次接受目标对象输入的第二语音数据，对第二语音数据识别确定属于结束连续语音交互的特定语音时，确定满足连续语音结束条件。5.根据权利要求1所述的方法，其特征在于，所述缓存中预设的数据具体包括：终端获取预设的录音数据，对录音数据经过降噪、回声消除处理后得到处理数据，将该处理数据存入到缓存中作为预设的数据。6.根据权利要求4所述的方法，其特征在于，所述对第二语音数据识别确定属于结束连续语音交互的特定语音具体包括：对第二语音数据采用RNN识别算法确定语音数据中每个发音组对应x个词的x个置信率；采用LSTM识别算法确定语音数据中每个发音组对应的y个词的y个置信率；终端设备将第一发音组中x个词和y个词中相同的第一词的两个置信率相加得到该第一词的置信率和，遍历x个词和y个词中相同的词得到每个相同词的置信率和，将置信率和最大值对应的词确定为该第一发音...

【专利技术属性】
技术研发人员：雍小文，
申请(专利权)人：博泰车联网科技上海股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人