处理语音数据的方法、处理语音数据的装置及存储介质制造方法及图纸

技术编号：24996091 阅读：42 留言：0更新日期：2020-07-24 17:58

本公开是关于处理语音数据的方法，方法包括：获取语料库，其中语料库包括多个回复语段，其中每个回复语段设置有第一删除值；获取当前的对话请求，其中当前的对话请求基于上一轮的回复语段生成；通过情绪识别模型确定当前的对话请求的情绪置信值；若当前的对话请求的情绪置信值大于上一轮的回复语段的第一删除值，则将上一轮的回复语段的第一删除值更新为当前的对话请求的情绪置信值，得到第二删除值；基于当前的对话请求以及所述第二删除值，选取语料库中的一个回复语段作为当前的对话请求的回复语段。可以实时反馈人机对话质量，对人机交互中的回复语段实时更新，加快数据质量的反馈周期，有利于人机对话系统的快速良好迭代。

全部详细技术资料下载

【技术实现步骤摘要】
处理语音数据的方法、处理语音数据的装置及存储介质
本公开涉及计算机
，尤其涉及处理语音数据的方法、处理语音数据的装置及存储介质。
技术介绍
随着技术的发展，人机对话的产品得到广泛应用，以个人助理形式、开放式聊天形式以及用户支持形式存在。作为人机对话产品的维护者，需要准确得知机器回复质量，以便及时地调整和优化。目前人机对话系统的回复质量是由专门的运营人员进行线上监控或者离线标注后，前者由人工逐条去检查日志判断当前的回复质量，进行回复质量的高低的评价，评估结果的准确性低，耗费大量的人力资源。后者需要人工抽样离线数据并进行标注，根据标注结果进行人工反馈，标注效率低，工作周期长。
技术实现思路
为克服相关技术中存在的问题，本公开提供处理语音数据的方法、处理语音数据的装置及存储介质。根据本公开实施例的一方面，处理语音数据的方法包括：获取语料库，其中语料库包括多个回复语段，其中每个回复语段设置有第一删除值；获取当前的对话请求，其中当前的对话请求基于上一轮的回复语段生成；通过情绪识别模型确定当前的...

【技术保护点】
1.一种处理语音数据的方法，其特征在于，所述方法包括：/n获取语料库，其中所述语料库包括多个回复语段，其中每个所述回复语段设置有第一删除值；/n获取当前的对话请求，其中所述当前的对话请求基于上一轮的回复语段生成；/n通过情绪识别模型确定所述当前的对话请求的情绪置信值；/n若所述当前的对话请求的情绪置信值大于所述上一轮的回复语段的第一删除值，则将所述上一轮的回复语段的第一删除值更新为所述当前的对话请求的情绪置信值，得到第二删除值；/n基于所述当前的对话请求以及所述第二删除值，选取所述语料库中的一个所述回复语段作为所述当前的对话请求的回复语段。/n

【技术特征摘要】
1.一种处理语音数据的方法，其特征在于，所述方法包括：
获取语料库，其中所述语料库包括多个回复语段，其中每个所述回复语段设置有第一删除值；
获取当前的对话请求，其中所述当前的对话请求基于上一轮的回复语段生成；
通过情绪识别模型确定所述当前的对话请求的情绪置信值；
若所述当前的对话请求的情绪置信值大于所述上一轮的回复语段的第一删除值，则将所述上一轮的回复语段的第一删除值更新为所述当前的对话请求的情绪置信值，得到第二删除值；
基于所述当前的对话请求以及所述第二删除值，选取所述语料库中的一个所述回复语段作为所述当前的对话请求的回复语段。

2.根据权利要求1所述的方法，其特征在于，所述基于所述当前的对话请求以及回复语段的所述第二删除值，选取所述语料库中的一个所述回复语段作为所述当前的对话请求的回复语段，包括：
通过对话模型，基于所述当前的对话请求和与所述当前的待识别对话请求的匹配值，选取多个回复语段为多个候选回复语段；
根据所述候选回复语段的所述匹配值以及所述第二删除值，确定所述当前的对话请求的回复语段。

3.根据权利要求2所述的方法，其特征在于，所述根据所述候选回复语段的所述匹配值以及所述第二删除值，确定所述当前的对话请求的回复语段，包括：
将所述第二删除值由小到大进行排序；
按照所述第二删除值的从小到大的顺序，确定最小的所述第二删除值；
将所述最小的所述第二删除值对应的所述候选回复语段作为所述当前对话请求的回复语段。

4.根据权利要求2所述的方法，其特征在于，所述根据所述候选回复语段的所述匹配值以及所述第二删除值，确定所述当前的对话请求的回复语段，还包括：
将所述候选回复语段按照所述第二删除值由小到大进行排序；
按照所述第二删除值由小到大的顺序选取设置数量的多个所述候选回复语段，作为待选语段；
根据所述待选语段的所述匹配值，确定所述当前的对话请求的回复语段。

5.根据权利要求2所述的方法，其特征在于，所述根据所述候选回复语段的所述匹配值以及所述第二删除值，确定所述当前的对话请求的回复语段，包括：
分别确定所述匹配值的第一权重值以及所述第二删除值的第二权重值；
根据所述候选回复语段的所述匹配值、所述第一权重值、第二删除值以及第二权重值得到所述候选回复语段的选取值，其中所述第一权重值大于零，所述第二权重值小于零；
选取所述选取值最高的所述候选回复语段作为所述当前对话请求的回复语段。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：
若所述回复语段的第二删除值大于删除阈值，则从所述语料库中删除所述回复语段。

7.根据权利要求1所述的方法，其特征在于，所述语料库中，所述回复语段的第一删除值的初始值为0。

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：
若所述当前的对话请求的情绪置信值小于或等于所述上一轮的回复语段的第一删除值，将所述上一轮的回复语段的所述第一删除值更新为所述当前的对话请求的所述情绪置信值，得到所述第二删除值。

9.一种处理语音数据的装置，其特征在于，所述装置包括：
获取模块，用于获取语料库，其中所述语料库包括多个回复语段，其中每个所述回复语段设置有第一删除值；
获取模块，还用于获取当前的对话请求，其中所述当前的对话请求基于上一轮的回复语段生成；
确定模块，用于通过情绪识别...

【专利技术属性】
技术研发人员：肖克聪，宁洪珂，赵群，
申请(专利权)人：北京小米松果电子有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人