语音技能的控制方法、装置、设备及存储介质制造方法及图纸

技术编号:22596193 阅读:33 留言:0更新日期:2019-11-20 11:48
本申请公开了语音技能的控制方法、装置、设备及存储介质,涉及人工智能领域。具体实现方案为:语音技能的控制方法应用于电子设备,电子设备包括:多个语音技能,多个语音技能包括:第三方语音技能和至少一个内置语音技能,电子设备当前处于第三方语音技能,方法包括:接收用户的当前需求指令;响应于当前需求指令计算当前需求指令分别与各语音技能对应的技能控制特征数据;各语音技能包括:当前第三方语音技能和至少一个内置语音技能;根据技能控制特征数据确定与当前需求指令相匹配的语音技能;采用相匹配的语音技能对当前需求指令进行响应。

Control methods, devices, equipment and storage media of voice skills

The application discloses a control method, device, device and storage medium of voice skill, and relates to the field of artificial intelligence. The specific implementation scheme is as follows: the control method of voice skills is applied to the electronic equipment, the electronic equipment includes: multiple voice skills, multiple voice skills include: the third-party voice skills and at least one built-in voice skills, the electronic equipment is currently in the third-party voice skills, the method includes: receiving the current demand instruction of the user; calculating the current demand instruction in response to the current demand instruction Command the skill control characteristic data corresponding to each voice skill respectively; each voice skill includes: the current third-party voice skill and at least one built-in voice skill; determine the voice skill matching the current demand instruction according to the skill control characteristic data; adopt the matching voice skill to respond to the current demand instruction.

【技术实现步骤摘要】
语音技能的控制方法、装置、设备及存储介质
本申请涉及到数据处理
,尤其涉及人工智能技术。
技术介绍
随着人工智能技术的成熟,出现了越来越多的智能语音交互设备,如智能音箱,智能电视,智能冰箱等家电设备。为了不断丰富智能语音交互设备的语音技能,在智能语音交互设备中可同时存在内置语音技能(英文为:built-in)和第三方语音技能。现有技术中,若用户进入到智能语音交互设备的某一第三方语音技能中后,则智能语音交互设备默认用户的所有需求均限定在当前的第三方语音技能中,均由当前第三方语音技能进行用户需求的响应。但当前第三方语音技能所能提供的用户需求有限,导致不能对每个用户需求均作出满意响应。若想要满足用户新的需求,需要用户发出切出当前第三方语音技能的请求,再进入到另一匹配的语音技能中才能满足该新的用户需求,增加了用户使用智能语音交互设备的时间成本,无法实现语音技能间的平滑切换,降低了用户使用智能语音交互设备的体验。
技术实现思路
本申请实施例提供一种语音技能的控制方法、装置、设备及存储介质,解决了现有技术中不能对每个用户需求均作出满意响应,增加用户使用智能语音交互设备的时间成本,无法实现语音技能间的平滑切换,降低了用户使用智能语音交互设备的体验的技术问题。本申请实施例第一方面提供一种语音技能的控制方法,所述方法应用于电子设备,所述电子设备包括:多个语音技能,所述多个语音技能包括:第三方语音技能和至少一个内置语音技能,所述电子设备当前处于所述第三方语音技能,所述方法包括:<br>接收用户的当前需求指令;响应于所述当前需求指令计算所述当前需求指令分别与各语音技能对应的技能控制特征数据;所述各语音技能包括:所述当前第三方语音技能和至少一个内置语音技能;根据所述技能控制特征数据确定与所述当前需求指令相匹配的语音技能;采用所述相匹配的语音技能对所述当前需求指令进行响应。本申请实施例中,能够在每次接收到用户的当前需求指令后,都能直接由相匹配的语音技能进行响应,对每个用户需求均作出满意的响应。若相匹配的语音技能为某一内置语音技能,也能够在用户无感知的情况下实现语音技能间的平滑切换。降低了用户使用智能语音交互设备的时间成本,提高了用户使用智能语音交互设备的体验。进一步地,如上所述的方法,所述技能控制特征数据包括意图匹配度;所述根据所述技能控制特征数据确定与所述当前需求指令相匹配的语音技能,包括:若所述意图匹配度满足预设条件,则根据所述意图匹配度确定与所述当前需求指令相匹配的语音技能。本申请实施例中,在判断出意图匹配度满足预设条件的情况下,单独采用当前需求指令分别与各语音技能的意图匹配度确定相匹配的语音技能,能够减少耗时。使相匹配的语音技能对当前需求指令快速进行响应。进一步地,如上所述的方法,若所述意图匹配度满足预设条件,则根据所述意图匹配度确定与所述当前需求指令相匹配的语音技能,包括:若所述当前第三方语音技能对应的意图匹配度大于第一预设匹配度阈值且各所述内置语音技能对应的意图匹配度均小于第二预设匹配度阈值,则确定与所述当前需求指令相匹配的语音技能为所述当前第三方语音技能;其中,第一预设匹配度阈值与所述第二预设匹配度阈值的差值大于预设数值。本申请实施例中,若当前第三方语音技能对应的意图匹配度明显大于其他内置语音技能的意图匹配度,则可高置信地确定与当前第三方语音技能相匹配的语音技能为当前第三方语音技能,能够保证匹配结果的准确性的前提下,减少了耗时。进一步地,如上所述的方法,技能控制特征数据还包括:技能满足度;所述根据所述技能控制特征数据确定与所述当前需求指令相匹配的语音技能,包括:若所述意图匹配度不满足预设条件,则根据所述意图匹配度和所述技能满足度确定与所述当前需求指令相匹配的语音技能。本申请实施例中,在判断出意图匹配度不满足预设条件的情况下,采用意图匹配度和所述技能满足度确定与所述当前需求指令相匹配的语音技能,能够保证匹配结果的准确性。进一步地,如上所述的方法,根据所述意图匹配度和所述技能满足度确定与所述当前需求指令相匹配的语音技能,包括:将各所述语音技能对应的意图匹配度和技能满足度输入到已训练至收敛的总分值预测模型中,以由所述总分值预测模型输出各所述语音技能对应的技能控制总分值;将最大技能控制总分值对应的语音技能确定为与所述当前需求指令相匹配的语音技能。本申请实施例中,采用已训练至收敛的总分值预测模型计算技能控制总分值,并将最大技能控制总分值对应的语音技能确定为与所述当前需求指令相匹配的语音技能,由于已训练至收敛的总分值预测模型能够对技能控制总分值进行准确预测,所以提高了匹配结果的准确性。进一步地,如上所述的方法,所述计算所述当前需求指令与所述当前第三方语音技能的意图匹配度,包括:获取所述当前需求指令在所述当前第三方语音技能中对应的至少一种用户行为文本;分别计算所述当前需求指令与各用户行为文本的相似度分值;将最大相似度分值确定为所述意图匹配度。本申请实施例中,能够在第三方语音技能的质量参差不齐的情况下,通过挖掘当前第三方语音技能内的用户行为数据与当前需求指令的相似度来确定意图匹配度,是更加适合第三方语音技能的方式,所以使确定出的与当前第三方语音技能的意图匹配度更加准确。进一步地,如上所述的方法,所述用户行为文本包括:用户历史行为文本和用户当前行为文本;所述用户历史行为文本至少包括:前端页面展示的关键字文本,响应话术的关键字文本,当前需求指令与响应话术的重叠字文本和高频需求指令文本;所述用户当前行为文本包括:前一轮响应话术文本和当前轮期待响应话术文本。本申请实施例中,通过确定用户历史行为数据、用户当前行为数据分别与当前需求指令的相似度,并将最大相似度分值确定为所述意图匹配度,由于用户行为数据更加全面,所以使得确定出的意图匹配度更加准确。进一步地,如上所述的方法,分别计算所述当前需求指令与各用户行为文本的相似度分值,包括:提取所述当前需求指令与各用户行为文本的文本匹配特征;将所述文本匹配特征输入到已训练至收敛的文本匹配模型中,以由所述文本匹配模型输出所述当前需求指令与各用户行为文本的第一相似度分值;若用户行为文本为所述用户当前行为文本,则将所述第一相似度分值确定为对应的相似度分值;若用户行为文本为所述用户历史行为文本,则根据第一相似度分值计算第二相似度分值,将所述第二相似度分值确定为对应的相似度分值。其中,所述文本匹配特征至少包括:文字重叠率,拼音编辑距离,重叠字的权重。本申请实施例中,由于计算所述当前需求指令与各用户行为文本的相似度分值时,充分提取了文本匹配特征,并采用已训练至收敛的文本匹配模型计算相似度分值,所以使计算出的相似度分值更加准确。进一步地,如上所述的方法,根据第一相似度分值计算第二相似度分值,包括:根据各所述用户历史行为文本的置信度确定对应的第一相似度分值的权重;将所述权重和对应的第一相似度分值的乘积确定为对应的用户历史行为文本的第二相似度分值。本申请实施例中,由于本文档来自技高网...

【技术保护点】
1.一种语音技能的控制方法,其特征在于,所述方法应用于电子设备,所述电子设备包括:多个语音技能,所述多个语音技能包括:第三方语音技能和至少一个内置语音技能,所述电子设备当前处于所述第三方语音技能,所述方法包括:/n接收用户的当前需求指令;/n响应于所述当前需求指令计算所述当前需求指令分别与各语音技能对应的技能控制特征数据;/n根据所述技能控制特征数据确定与所述当前需求指令相匹配的语音技能;/n采用所述相匹配的语音技能对所述当前需求指令进行响应。/n

【技术特征摘要】
1.一种语音技能的控制方法,其特征在于,所述方法应用于电子设备,所述电子设备包括:多个语音技能,所述多个语音技能包括:第三方语音技能和至少一个内置语音技能,所述电子设备当前处于所述第三方语音技能,所述方法包括:
接收用户的当前需求指令;
响应于所述当前需求指令计算所述当前需求指令分别与各语音技能对应的技能控制特征数据;
根据所述技能控制特征数据确定与所述当前需求指令相匹配的语音技能;
采用所述相匹配的语音技能对所述当前需求指令进行响应。


2.根据权利要求1所述的方法,其特征在于,所述技能控制特征数据包括意图匹配度;
所述根据所述技能控制特征数据确定与所述当前需求指令相匹配的语音技能,包括:
若所述意图匹配度满足预设条件,则根据所述意图匹配度确定与所述当前需求指令相匹配的语音技能。


3.根据权利要求2所述的方法,其特征在于,若所述意图匹配度满足预设条件,则根据所述意图匹配度确定与所述当前需求指令相匹配的语音技能,包括:
若当前第三方语音技能对应的意图匹配度大于第一预设匹配度阈值且各所述内置语音技能对应的意图匹配度均小于第二预设匹配度阈值,则确定与所述当前需求指令相匹配的语音技能为所述当前第三方语音技能;
其中,第一预设匹配度阈值与所述第二预设匹配度阈值的差值大于预设数值。


4.根据权利要求2所述的方法,其特征在于,所述技能控制特征数据还包括:技能满足度;
所述根据所述技能控制特征数据确定与所述当前需求指令相匹配的语音技能,包括:
若所述意图匹配度不满足预设条件,则根据所述意图匹配度和所述技能满足度确定与所述当前需求指令相匹配的语音技能。


5.根据权利要求4所述的方法,其特征在于,所述根据所述意图匹配度和所述技能满足度确定与所述当前需求指令相匹配的语音技能,包括:
将各所述语音技能对应的意图匹配度和技能满足度输入到已训练至收敛的总分值预测模型中,以由所述总分值预测模型输出各所述语音技能对应的技能控制总分值;
将最大技能控制总分值对应的语音技能确定为与所述当前需求指令相匹配的语音技能。


6.根据权利要求2所述的方法,其特征在于,所述计算所述当前需求指令与所述当前第三方语音技能的意图匹配度,包括:
获取所述当前需求指令在所述当前第三方语音技能中对应的至少一种用户行为文本;
分别计算所述当前需求指令与各用户行为文本的相似度分值;
将最大相似度分值确定为所述意图匹配度。


7.根据权利要求6所述的方法,其特征在于,所述用户行为文本包括:用户历史行为文本和用户当前行为文本;
所述用户历史行为文本至少包括:前端页面展示的关键字文本,响应话术的关键字文本,当前需求指令与响应话术的重叠字文本和高频需求指令文本;
所述用户当前行为文本包括:前一轮响应话术文本和当前轮期待响应话术文本。


8.根据权利要求6所述的方法,其特征在于,所述分别计算所述当前需求指令与各用户行为文本的相似度分值,包括:
提取所述当前需求指令与各用户行为文本的文本匹配特征;
将所述文本匹配特征输入到已训练至收敛的文本匹配模型中,以由所述文本匹配模型输出所述当前需求指令与各用户行为文本的第一相似度分值;
若用户行为文本为所述用户当前行为文本,则将所述第一相似度分值确定为对应的相似度分值;
若用户行为文本为所述用户历史行为文本,则根据第一相似度分值计算第二相似度分值,将所述第二相似度分值确定为对应的相似度分值。


9.根据权利要求8所述的方法,其特征在于,所述根据第一相似度分值计算第二相似度分值,包括:
根据各所述用户历史行为文本的置信度确定对应的第一相似度分值的权重;
将所述权重和对应的第一相似度分值的乘积确定为对应的用户历史行为文本的第二相似度分值。


10.根...

【专利技术属性】
技术研发人员:熊志伟周晓
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1