对话方法、装置、服务器及存储介质制造方法及图纸

技术编号：28673511 阅读：25 留言：0更新日期：2021-06-02 02:49

本发明专利技术公开了一种对话方法、装置、服务器及存储介质。其中，方法包括：获取音频数据；所述音频数据是从客户端获取的；将所述音频数据发送给第二服务器；所述音频数据用于供所述第二服务器确定对应的识别文本和所述识别文本的置信度以及检测当前的声学环境；接收所述第二服务器发送的所述识别文本、所述识别文件的置信度和当前的声学环境；基于所述识别文件、所述识别文本的置信度和所述当前的声学环境，生成与所述音频数据对应的应答文本；将所述应答文本发送给所述客户端。

全部详细技术资料下载

【技术实现步骤摘要】
对话方法、装置、服务器及存储介质
本专利技术涉及语音交互
，具体涉及一种对话方法、装置、服务器及存储介质。
技术介绍
随着语音识别和终端技术的快速发展，语音交互的应用场景越来越多，例如，通过语音控制智能设备与用户完成人机交互。通常，智能设备先获取用户输入的音频数据，然后通过特征提取和语音识别模型得到与所述音频数据对应的识别文本，最后基于该识别文本得到对应的对答文本。但是，实际应用时，基于该识别文本得到的对答文本未必能够反映用户的真实意思，导致人机交互体验较差。
技术实现思路
有鉴于此，本专利技术实施例期望提供一种对话方法、装置、服务器及存储介质。本专利技术的技术方案是这样实现的：本专利技术实施例提供一种对话方法，应用于第一服务器，所述方法包括：获取音频数据；所述音频数据是从客户端获取的；将所述音频数据发送给第二服务器；所述音频数据用于供所述第二服务器确定对应的识别文本和所述识别文本的置信度以及检测当前的声学环境；接收所述第二服务器发送的所述识别文本、所述识别文...

【技术保护点】
1.一种对话方法，其特征在于，应用于第一服务器，所述方法包括：/n获取音频数据；所述音频数据是从客户端获取的；/n将所述音频数据发送给第二服务器；所述音频数据用于供所述第二服务器确定对应的识别文本和所述识别文本的置信度以及检测当前的声学环境；/n接收所述第二服务器发送的所述识别文本、所述识别文件的置信度和当前的声学环境；/n基于所述识别文件、所述识别文本的置信度和所述当前的声学环境，生成与所述音频数据对应的应答文本；/n将所述应答文本发送给所述客户端。/n

【技术特征摘要】
1.一种对话方法，其特征在于，应用于第一服务器，所述方法包括：
获取音频数据；所述音频数据是从客户端获取的；
将所述音频数据发送给第二服务器；所述音频数据用于供所述第二服务器确定对应的识别文本和所述识别文本的置信度以及检测当前的声学环境；
接收所述第二服务器发送的所述识别文本、所述识别文件的置信度和当前的声学环境；
基于所述识别文件、所述识别文本的置信度和所述当前的声学环境，生成与所述音频数据对应的应答文本；
将所述应答文本发送给所述客户端。

2.根据权利要求1所述的方法，其特征在于，所述基于所述识别文件、所述识别文本的置信度和所述当前的声学环境，生成与所述音频数据对应的应答文本，包括：
判断所述识别文件的置信度是否小于置信度阈值；
当确定所述识别文件的置信度小于置信度阈值时，基于所述当前的声学环境，生成与所述音频数据对应的应答文本，并丢弃所述识别文本。

3.根据权利要求2所述的方法，其特征在于，所述基于所述当前的声学环境，生成与所述音频数据对应的应答文本，包括：
基于所述当前的声学环境，确定在用户录入所述音频数据的环境中产生的第一信噪比；
根据信噪比和噪声类型的对应关系，确定与所述第一信噪比对应的第一噪声类型；
基于所述第一噪声类型，生成与所述音频数据对应的应答文本。

4.根据权利要求3所述的方法，其特征在于，所述基于所述第一噪声类型，生成与所述音频数据对应的应答文本，包括：
基于所述第一噪声类型，生成第一文本；所述第一文本表征对当前用户录入音频数据的环境中的噪声源执行预设操作；
对所述第一文本和预设第二文本进行拼接，得到与所述音频数据对应的应答文本；所述第二文本表征对音频数据进行重新录入。

5.根据权利要求1所述的方法，其特征在于，所述基于所述识别文件、所述识别文本的置信度和所述当前的声学环境，生成与所述音频数据对应的应答文本，包括：
判断所述识别文件的置信度是否大于或等于置信度阈值；
当确定所述识别文件的置信度大于或等于置信度阈值时，丢弃所述当前的声学环境，将...

【专利技术属性】
技术研发人员：楚晨，朱会峰，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人