语音技能的控制方法、装置、设备及存储介质制造方法及图纸

技术编号：22596193 阅读：33 留言：0更新日期：2019-11-20 11:48

本申请公开了语音技能的控制方法、装置、设备及存储介质，涉及人工智能领域。具体实现方案为：语音技能的控制方法应用于电子设备，电子设备包括：多个语音技能，多个语音技能包括：第三方语音技能和至少一个内置语音技能，电子设备当前处于第三方语音技能，方法包括：接收用户的当前需求指令；响应于当前需求指令计算当前需求指令分别与各语音技能对应的技能控制特征数据；各语音技能包括：当前第三方语音技能和至少一个内置语音技能；根据技能控制特征数据确定与当前需求指令相匹配的语音技能；采用相匹配的语音技能对当前需求指令进行响应。

Control methods, devices, equipment and storage media of voice skills

The application discloses a control method, device, device and storage medium of voice skill, and relates to the field of artificial intelligence. The specific implementation scheme is as follows: the control method of voice skills is applied to the electronic equipment, the electronic equipment includes: multiple voice skills, multiple voice skills include: the third-party voice skills and at least one built-in voice skills, the electronic equipment is currently in the third-party voice skills, the method includes: receiving the current demand instruction of the user; calculating the current demand instruction in response to the current demand instruction Command the skill control characteristic data corresponding to each voice skill respectively; each voice skill includes: the current third-party voice skill and at least one built-in voice skill; determine the voice skill matching the current demand instruction according to the skill control characteristic data; adopt the matching voice skill to respond to the current demand instruction.

全部详细技术资料下载

【技术实现步骤摘要】
语音技能的控制方法、装置、设备及存储介质
本申请涉及到数据处理
，尤其涉及人工智能技术。
技术介绍
随着人工智能技术的成熟，出现了越来越多的智能语音交互设备，如智能音箱，智能电视，智能冰箱等家电设备。为了不断丰富智能语音交互设备的语音技能，在智能语音交互设备中可同时存在内置语音技能(英文为：built-in)和第三方语音技能。现有技术中，若用户进入到智能语音交互设备的某一第三方语音技能中后，则智能语音交互设备默认用户的所有需求均限定在当前的第三方语音技能中，均由当前第三方语音技能进行用户需求的响应。但当前第三方语音技能所能提供的用户需求有限，导致不能对每个用户需求均作出满意响应。若想要满足用户新的需求，需要用户发出切出当前第三方语音技能的请求，再进入到另一匹配的语音技能中才能满足该新的用户需求，增加了用户使用智能语音交互设备的时间成本，无法实现语音技能间的平滑切换，降低了用户使用智能语音交互设备的体验。
技术实现思路
本申请实施例提供一种语音技能的控制方法、装置、设备及存储介质，解决了现有技术中不能对每个用户需求均作出满意响应，增加用户使用智能语音交互设备的时间成本，无法实现语音技能间的平滑切换，降低了用户使用智能语音交互设备的体验的技术问题。本申请实施例第一方面提供一种语音技能的控制方法，所述方法应用于电子设备，所述电子设备包括：多个语音技能，所述多个语音技能包括：第三方语音技能和至少一个内置语音技能，所述电子设备当前处于所述第三方语音技能，所述方法包括：<...

【技术保护点】
1.一种语音技能的控制方法，其特征在于，所述方法应用于电子设备，所述电子设备包括：多个语音技能，所述多个语音技能包括：第三方语音技能和至少一个内置语音技能，所述电子设备当前处于所述第三方语音技能，所述方法包括：/n接收用户的当前需求指令；/n响应于所述当前需求指令计算所述当前需求指令分别与各语音技能对应的技能控制特征数据；/n根据所述技能控制特征数据确定与所述当前需求指令相匹配的语音技能；/n采用所述相匹配的语音技能对所述当前需求指令进行响应。/n

【技术特征摘要】
1.一种语音技能的控制方法，其特征在于，所述方法应用于电子设备，所述电子设备包括：多个语音技能，所述多个语音技能包括：第三方语音技能和至少一个内置语音技能，所述电子设备当前处于所述第三方语音技能，所述方法包括：
接收用户的当前需求指令；
响应于所述当前需求指令计算所述当前需求指令分别与各语音技能对应的技能控制特征数据；
根据所述技能控制特征数据确定与所述当前需求指令相匹配的语音技能；
采用所述相匹配的语音技能对所述当前需求指令进行响应。

2.根据权利要求1所述的方法，其特征在于，所述技能控制特征数据包括意图匹配度；
所述根据所述技能控制特征数据确定与所述当前需求指令相匹配的语音技能，包括：
若所述意图匹配度满足预设条件，则根据所述意图匹配度确定与所述当前需求指令相匹配的语音技能。

3.根据权利要求2所述的方法，其特征在于，若所述意图匹配度满足预设条件，则根据所述意图匹配度确定与所述当前需求指令相匹配的语音技能，包括：
若当前第三方语音技能对应的意图匹配度大于第一预设匹配度阈值且各所述内置语音技能对应的意图匹配度均小于第二预设匹配度阈值，则确定与所述当前需求指令相匹配的语音技能为所述当前第三方语音技能；
其中，第一预设匹配度阈值与所述第二预设匹配度阈值的差值大于预设数值。

4.根据权利要求2所述的方法，其特征在于，所述技能控制特征数据还包括：技能满足度；
所述根据所述技能控制特征数据确定与所述当前需求指令相匹配的语音技能，包括：
若所述意图匹配度不满足预设条件，则根据所述意图匹配度和所述技能满足度确定与所述当前需求指令相匹配的语音技能。

5.根据权利要求4所述的方法，其特征在于，所述根据所述意图匹配度和所述技能满足度确定与所述当前需求指令相匹配的语音技能，包括：
将各所述语音技能对应的意图匹配度和技能满足度输入到已训练至收敛的总分值预测模型中，以由所述总分值预测模型输出各所述语音技能对应的技能控制总分值；
将最大技能控制总分值对应的语音技能确定为与所述当前需求指令相匹配的语音技能。

6.根据权利要求2所述的方法，其特征在于，所述计算所述当前需求指令与所述当前第三方语音技能的意图匹配度，包括：
获取所述当前需求指令在所述当前第三方语音技能中对应的至少一种用户行为文本；
分别计算所述当前需求指令与各用户行为文本的相似度分值；
将最大相似度分值确定为所述意图匹配度。

7.根据权利要求6所述的方法，其特征在于，所述用户行为文本包括：用户历史行为文本和用户当前行为文本；
所述用户历史行为文本至少包括：前端页面展示的关键字文本，响应话术的关键字文本，当前需求指令与响应话术的重叠字文本和高频需求指令文本；
所述用户当前行为文本包括：前一轮响应话术文本和当前轮期待响应话术文本。

8.根据权利要求6所述的方法，其特征在于，所述分别计算所述当前需求指令与各用户行为文本的相似度分值，包括：
提取所述当前需求指令与各用户行为文本的文本匹配特征；
将所述文本匹配特征输入到已训练至收敛的文本匹配模型中，以由所述文本匹配模型输出所述当前需求指令与各用户行为文本的第一相似度分值；
若用户行为文本为所述用户当前行为文本，则将所述第一相似度分值确定为对应的相似度分值；
若用户行为文本为所述用户历史行为文本，则根据第一相似度分值计算第二相似度分值，将所述第二相似度分值确定为对应的相似度分值。

9.根据权利要求8所述的方法，其特征在于，所述根据第一相似度分值计算第二相似度分值，包括：
根据各所述用户历史行为文本的置信度确定对应的第一相似度分值的权重；
将所述权重和对应的第一相似度分值的乘积确定为对应的用户历史行为文本的第二相似度分值。

10.根...

【专利技术属性】
技术研发人员：熊志伟，周晓，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人