语音交互方法、服务器和存储介质技术

技术编号:34967129 阅读:13 留言:0更新日期:2022-09-17 12:48
本发明专利技术公开了一种语音交互方法、服务器和存储介质。该方法包括:接收车辆转发的第一领域的用户语音请求,识别语音请求中的关键词;在语音交互的历史应用程序接口集合中,根据关键词查询获得第二领域的应用程序接口;根据查询到的应用程序接口的参数名称和参数取值,对语音请求进行关键词的替换和槽位识别并生成新的语音请求;对新的语音请求进行应用程序接口预测;根据查询到的应用程序接口的参数名称和参数取值以及槽位识别的结果,选择预测的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互。本发明专利技术能够实现较长时间、跨领域的实体继承,满足用户在导航期间,与车辆多次语音交互后,仍能随时查询目的地天气等需求。目的地天气等需求。目的地天气等需求。

【技术实现步骤摘要】
语音交互方法、服务器和存储介质


[0001]本专利技术涉及语音交互
,特别涉及一种语音交互方法、服务器和存储介质。

技术介绍

[0002]在智能汽车上,导航是非常常见的车载场景。在导航到目的地的同时,用户会非常关注目的地的天气。然而,在目前的语音交互场景下,导航与天气的功能是割裂开的。如用户在开启导航之后,导航会回复“正在导航去目的地”。当用户想查询目的地天气的时候,会自然地问“目的地的天气怎么样”此时不能得到预期的结果,用户只能将目的地的物理位置说出,询问该物理位置的天气怎么样,给用户带来不好的体验。

技术实现思路

[0003]本专利技术实施方式提供一种语音交互方法、服务器和存储介质。
[0004]本专利技术实施方式提供一种语音交互方法。所述语音交互方法包括:接收车辆转发的第一领域的用户语音请求,识别所述语音请求中的关键词;在语音交互的历史应用程序接口集合中,根据所述关键词查询获得第二领域的应用程序接口;根据查询到的应用程序接口的参数名称和参数取值,对所述语音请求进行所述关键词的替换和槽位识别并生成新的语音请求;对新的语音请求进行应用程序接口预测;根据所述查询到的应用程序接口的参数名称和参数取值以及所述槽位识别的结果,选择预测的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互。
[0005]本专利技术的语音交互方法能够实现较长时间、跨领域的实体继承,满足了用户在导航期间,与车辆端进行多次语音交互后,仍然可以随时查询目的地天气等需求,提升了用户体验。/>[0006]所述接收车辆转发的第一领域的用户语音请求,识别所述语音请求中的关键词,包括:接收车辆转发的天气领域的用户语音请求,识别所述语音请求中的关键词;所述在语音交互的历史应用程序接口集合中,根据所述关键词查询获得第二领域的应用程序接口,包括:在语音交互的历史应用程序接口集合中,根据所述关键词查询获得导航领域的应用程序接口。
[0007]如此,可以实现跨领域的实体继承,满足了用户在导航期间,与车辆端进行多次语音交互后,仍然可以随时查询目的地天气的需求,提升了用户体验。
[0008]所述识别所述语音请求中的关键词,包括:对所述语音请求进行语音识别并预处理得到待处理文本;对所述待处理文本进行关键词识别得到所述关键词。
[0009]如此,可以得到较为清晰准确地待处理文本,并可以根据待处理文本进行关键词识别得到清晰且准确的关键词。
[0010]所述在语音交互的历史应用程序接口集合中,根据所述关键词查询获得第二领域的应用程序接口,包括:根据预设关键词和应用领域的对应关系确定所述关键词的领域;根据所述关键词对应的领域在所述历史应用程序接口集合中进行匹配获得所述第二领域的
应用程序接口。
[0011]如此,可以通过预设关键词和应用领域的对应关系确定关键词的领域,并根据关键词对应的领域在历史应用程序接口集合中进行匹配获得第二领域的应用程序接口,克服了以往语义继承只能继承前一轮、或者两轮,或者需要进行规则配置的问题,从而完成跨领域的实体继承。
[0012]所述根据查询到的应用程序接口的参数名称和参数取值,对所述语音请求进行所述关键词的替换和槽位识别并生成新的语音请求,包括:确定所述查询到的应用程序接口中所述关键词对应的参数名称;根据所述关键词对应的参数名称的参数取值对所述语音请求进行所述关键词的替换和槽位识别并生成新的语音请求。
[0013]如此,本专利技术可以通过确定查询到的应用程序接口中关键词对应的参数名称,然后根据关键词对应的参数名称的参数取值对语音请求进行关键词的替换和槽位识别并生成新的语音请求,进而完成语音交互。
[0014]所述对新的语音请求进行应用程序接口预测,包括:将所述新的语音请求作为文本序列进行编码得到词特征向量;利用预设模型对所述词特征向量输入进行处理以对所述新的语音请求进行应用程序接口预测。
[0015]如此,本专利技术的语音交互方法基于端到端的预设模型对新的语音请求进行应用程序接口预测,进而实现较长时间、跨领域的实体继承。
[0016]所述根据所述查询到的应用程序接口的参数名称和参数取值以及所述槽位识别的结果,选择预测的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互,包括:根据所述查询到的应用程序接口的参数名称和参数取值、所述槽位识别的结果、所述预测到的应用程序接口和预测到的应用程序接口类型确定槽位填充的目标参数;根据所述槽位识别的结果和所述目标参数,选择所述预测到的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互。
[0017]如此,本专利技术可以根据对第一领域的用户语音请求的槽位识别的结果和根据查询到的应用程序接口的参数名称和参数取值、槽位识别的结果、预测到的应用程序接口和预测到的应用程序接口类型确定槽位填充的目标参数,选择预测到的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互,进而实现较长时间、跨领域的实体继承。
[0018]所述根据所述查询到的应用程序接口的参数名称和参数取值、所述槽位识别的结果、所述预测到的应用程序接口和预测到的应用程序接口类型确定槽位填充的目标参数,包括:将所述查询到的应用程序接口的参数名称和参数取值、所述槽位识别的结果的槽位取值拼接作为文本序列进行编码得到第一特征向量;将所述槽位识别的结果的槽位类型映射为第一身份标识,并将所述第一身份标识转换为第二特征向量;将所述预测到的应用程序接口类型映射为第二身份标识,并将所述第二身份标识转换为第三特征向量;将所述预测到的应用程序接口的参数映射为第三身份标识,并将所述第三身份标识转换为第四特征向量;利用槽位填充模型对所述第一特征向量、所述第二特征向量、所述第三特征向量和所述第四特征向量进行处理以确定所述目标参数。
[0019]如此,本专利技术聚焦于端到端架构的槽位填充模型,提出了一种融入了额外特征的槽位填充方案,相比较目前的只运用槽位取值和应用程序接口参数进行判断的方法,本发
明融入了用户槽位识别结果的槽位类型、应用程序接口类型和应用程序接口的参数等额外特征,可以显著提升槽位填充任务的准确度,进而提升应用程序接口参数填充任务的精度。
[0020]所述语音交互方法包括:输出执行结果下发至车辆完成语音交互之后,将执行参数填充后的目标应用程序接口添加到所述历史应用程序接口集合。
[0021]如此,本专利技术交互方法中的应用程序接口可迭代,能够动态更新当前语音请求对应的历史应用程序接口集合,更为便捷、高效。
[0022]本专利技术还提供一种服务器。所述服务器包括处理器和存储器,所述存储器上存储有计算机程序,当所述计算机程序被所述处理器执行时,实现上述实施方式任一项所述的交互方法。
[0023]如此,本专利技术的服务器应用上述语音交互方法能够实现较长时间、跨领域的实体继承,满足了用户在导航期间,与车辆端进行多次语音交互后,仍然可以随时查询目的地天气等需求,提升了用户体验。
[0本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:接收车辆转发的第一领域的用户语音请求,识别所述语音请求中的关键词;在语音交互的历史应用程序接口集合中,根据所述关键词查询获得第二领域的应用程序接口;根据查询到的应用程序接口的参数名称和参数取值,对所述语音请求进行所述关键词的替换和槽位识别并生成新的语音请求;对新的语音请求进行应用程序接口预测;根据所述查询到的应用程序接口的参数名称和参数取值以及所述槽位识别的结果,选择预测的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互。2.根据权利要求1所述的语音交互方法,其特征在于,所述接收车辆转发的第一领域的用户语音请求,识别所述语音请求中的关键词,包括:接收车辆转发的天气领域的用户语音请求,识别所述语音请求中的关键词;所述在语音交互的历史应用程序接口集合中,根据所述关键词查询获得第二领域的应用程序接口,包括:在语音交互的历史应用程序接口集合中,根据所述关键词查询获得导航领域的应用程序接口。3.根据权利要求1所述的语音交互方法,其特征在于,所述识别所述语音请求中的关键词,包括:对所述语音请求进行语音识别并预处理得到待处理文本;对所述待处理文本进行关键词识别得到所述关键词。4.根据权利要求1所述的语音交互方法,其特征在于,所述在语音交互的历史应用程序接口集合中,根据所述关键词查询获得第二领域的应用程序接口,包括:根据预设关键词和应用领域的对应关系确定所述关键词的领域;根据所述关键词对应的领域在所述历史应用程序接口集合中进行匹配获得所述第二领域的应用程序接口。5.根据权利要求1所述的语音交互方法,其特征在于,所述根据查询到的应用程序接口的参数名称和参数取值,对所述语音请求进行所述关键词的替换和槽位识别并生成新的语音请求,包括:确定所述查询到的应用程序接口中所述关键词对应的参数名称;根据所述关键词对应的参数名称的参数取值对所述语音请求进行所述关键词的替换和槽位识别并生成新的语音请求。6.根据权利要求1所述的语音交互方法,其特征在于,所述对新的语音请求进行应用程序接口预测,包括:将所述新的语音请求作为文本序列进行编码得到词特征向量;利用预设模型对所述词特征向量...

【专利技术属性】
技术研发人员:丁鹏傑王亭玉李尹钰阳赵群
申请(专利权)人:广州小鹏汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1