语音交互方法、服务器及计算机可读存储介质技术

技术编号:36270416 阅读:25 留言:0更新日期:2023-01-07 10:11
本申请公开了一种语音交互方法,包括:接收车辆转发的用户语音请求;对用户语音请求进行断句处理得到断点位置和断点位置对应的置信度;根据断点位置和置信度对用户语音请求进行处理,得到断句结果;根据断句结果进行自然语言理解以完成语音交互。本申请中,可对语音请求进行断句处理,得到断点位置及其对应的置信度,据此得到断句结果,并将断句结果进行自然语言理解,最终完成语音交互。本申请的语音交互方法可识别并理解用户发出的包括多个指令的语音请求中的各项功能需求,用户可通过一条语音请求一次性表达多个意图需求,而无需发出多条语音请求即可完成语音交互,提高了语音交互的便捷性和车载系统小程序的使用效率,改善用户体验。善用户体验。善用户体验。

【技术实现步骤摘要】
语音交互方法、服务器及计算机可读存储介质


[0001]本申请涉及车载语音
,特别涉及一种语音交互方法、服务器及计算机可读存储介质。

技术介绍

[0002]目前,车载语音技术可以支持用户通过语音在车辆座舱内进行交互,例如控制车辆零部件或与车载系统用户界面中的组件进行交互。在用户发出包括多个指令的语音请求的场景中,仅支持其中一个意图的理解,例如,对于语音请求“打开空调关闭车窗”,只能理解其中打开空调的意图。如此,影响语音交互的流畅性和便捷性,用户使用体验不佳。

技术实现思路

[0003]本申请提供了一种语音交互方法、服务器及计算机可读存储介质。
[0004]本申请的语音交互方法,包括:接收车辆转发的用户语音请求;对所述用户语音请求进行断句处理得到断点位置和所述断点位置对应的置信度;根据所述断点位置和所述置信度对所述用户语音请求进行处理,得到断句结果;根据所述断句结果进行自然语言理解以完成语音交互。
[0005]如此,本申请中,在用户发出的包括多个指令的语音请求的场景下,可对语音请求进行断句处理,得到断点位置及其对应的置信度,据此得到断句结果,并进一步将断句结果进行自然语言理解,交由车辆执行与用户请求中各个指令的意图相对应的控制指令,最终完成语音交互。本申请的语音交互方法可识别用户发出的包括多个指令的语音请求中的各项功能需求,理解其中所有的意图,用户可通过一条语音请求一次性表达多个意图需求,而无需发出多条语音请求,即可完成语音交互,使得用户的表达更方便,可提高语音交互的便捷性和车载系统小程序的使用效率,改善用户体验。
[0006]所述对所述用户语音请求进行断句处理得到断点位置和所述断点位置对应的置信度,包括:对所述用户语音请求进行文本向量化处理得到第一语句向量;对所述第一语句向量进行断句处理得到初始断点位置和所述初始断点位置对应的第一置信度;根据所述初始断点位置和所述第一置信度确定所述用户语音请求的待处理分句;对所述待处理分句进行二次断句处理得到所述断点位置和对应的置信度。
[0007]如此,可根据用户语音请求的量化处理结果确定初始断点位置及其对应的置信度,进而确定待处理分句,以便对待处理分句进行二次断句处理。
[0008]所述根据所述初始断点位置和所述第一置信度确定所述用户语音请求的待处理分句,包括:若所述初始断点位置中存在多个所述初始断点位置对应的所述第一置信度大于
第一预设值,则根据所述第一置信度大于所述第一预设值的多个所述初始断点位置,对所述用户语音请求进行断句得到多个第一分句;确定多个所述第一分句中字符数量最多的第一分句为所述待处理分句。
[0009]如此,当首次断句得到多个对应置信度大于预设值的初始断点时,可将根据多个初始断点得到的多个分句中,字符数量最多的确定为待处理分句,以进行后续二次断句处理,提升断句后多分句的召回率。
[0010]所述根据所述初始断点位置和所述第一置信度确定所述用户语音请求的待处理分句,包括:若所述初始断点位置中只存在一个所述初始断点位置对应的所述第一置信度大于第一预设值,则根据所述第一置信度大于所述第一预设值的所述初始断点位置,对所述用户语音请求进行断句得到两个第一分句;确定两个所述第一分句为所述待处理分句。
[0011]如此,当首次断句得到一个对应置信度大于预设值的初始断点时,可将根据该初始断点得到的两个分句确定为待处理分句,以进行后续二次断句处理,提升断句后多分句的召回率。
[0012]所述根据所述初始断点位置和所述第一置信度确定所述用户语音请求的待处理分句,包括:若所述初始断点位置中所述初始断点位置对应的所述第一置信度均不大于第一预设值,则根据所述第一置信度最大的所述初始断点位置对所述用户语音请求进行断句得到两个第一分句;确定两个所述第一分句为所述待处理分句。
[0013]如此,当首次断句过程中不存在对应置信度大于预设值的初始断点时,可将置信度最高的确定为初始断点,并将根据初始断点得到的两个分句确定为待处理分句,以进行后续二次断句处理,提升断句后多分句的召回率。
[0014]所述对所述待处理分句进行二次断句处理得到所述断点位置和对应的置信度,包括:对所述待处理分句进行文本向量化处理得到第二语句向量;对所述第二语句向量进行断句处理得到所述断点位置和所述断点位置对应的所述置信度。
[0015]如此,可根据需进行二次断句处理的文本的量化处理结果确定断点位置及其对应的置信度,以便根据得到的断点位置及其对应的置信度得到断句结果。
[0016]所述根据所述断点位置和所述置信度对所述用户语音请求进行处理,得到断句结果,包括:若根据所述断点位置和所述置信度确定所述用户语音请求不断句,则对所述用户语音请求进行句子成分分析,以根据分析结果建立解析树;遍历所述解析树的关联节点做笛卡尔积;从所述解析树的根节点遍历整个所述解析树,以得到所述断句结果。
[0017]如此,对于经断句处理后确定为不断句的用户语音请求,可建立对用户语音请求进行句子成分分析的解析树,并根据遍历结系数的结果做笛卡尔积,以便得到断句结果。
[0018]所述根据所述断点位置和所述置信度对所述用户语音请求进行处理,得到断句结果,包括:若根据所述断点位置和所述置信度对所述用户语音请求进行断句得到第二分句,则对所述第二分句进行句子成分分析,以根据分析结果建立解析树;遍历所述解析树的关联节点做笛卡尔积;从所述解析树的根节点遍历整个所述解析树,以得到所述断句结果。
[0019]如此,对于用户语音请求经二次断句处理后得到的分句,可建立对用户语音请求进行句子成分分析的解析树,并根据遍历结系数的结果做笛卡尔积,以便得到断句结果。
[0020]所述根据所述断点位置和所述置信度对所述用户语音请求进行处理,得到断句结果,包括:若根据所述断点位置和所述置信度确定所述用户语音请求不断句,将所述用户语音请求与预设类别语音请求进行正则匹配得到匹配结果;根据所述匹配结果、所述断点位置和所述置信度确定目标断点位置;根据所述目标断点位置对所述用户语音请求进行断句得到所述断句结果。
[0021]如此,可将经二次断句处理后确定为不断句的用户语音请求与预设类别语音请求进行正则匹配得到匹配结果,结合断点位置及其置信度确定目标断点位置,并可根据目标断点位置对语音请求进行断句,得到断句结果。
[0022]所述根据所述断点位置和所述置信度对所述用户语音请求进行处理,得到断句结果,包括:若根据所述断点位置和所述置信度对所述用户语音请求进行断句得到第二分句,则将所述第二分句与预设类别语音请求进行正则匹配得到匹配结果;根据所述匹配结果、所述断点位置和所述置信度确定目标断点位置;根据所述目标断点位置对所述用户语音请求进行断句得到所述断句结果。
[0023]如此,可将用户语音请求经二次断句处理后得到的分句与预设类别语音请求进行正则匹配得到匹配结果,结合断点位置及其置信度确定目标断点位置,并可根据目标断点位置对语音请求进行断句,得到断句结果。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:接收车辆转发的用户语音请求;对所述用户语音请求进行断句处理得到断点位置和所述断点位置对应的置信度;根据所述断点位置和所述置信度对所述用户语音请求进行处理,得到断句结果;根据所述断句结果进行自然语言理解以完成语音交互。2.根据权利要求1所述的语音交互方法,其特征在于,所述对所述用户语音请求进行断句处理得到断点位置和所述断点位置对应的置信度,包括:对所述用户语音请求进行文本向量化处理得到第一语句向量;对所述第一语句向量进行断句处理得到初始断点位置和所述初始断点位置对应的第一置信度;根据所述初始断点位置和所述第一置信度确定所述用户语音请求的待处理分句;对所述待处理分句进行二次断句处理得到所述断点位置和对应的置信度。3.根据权利要求2所述的语音交互方法,其特征在于,所述根据所述初始断点位置和所述第一置信度确定所述用户语音请求的待处理分句,包括:若所述初始断点位置中存在多个所述初始断点位置对应的所述第一置信度大于第一预设值,则根据所述第一置信度大于所述第一预设值的多个所述初始断点位置,对所述用户语音请求进行断句得到多个第一分句;确定多个所述第一分句中字符数量最多的第一分句为所述待处理分句。4.根据权利要求2所述的语音交互方法,其特征在于,所述根据所述初始断点位置和所述第一置信度确定所述用户语音请求的待处理分句,包括:若所述初始断点位置中只存在一个所述初始断点位置对应的所述第一置信度大于第一预设值,则根据所述第一置信度大于所述第一预设值的所述初始断点位置,对所述用户语音请求进行断句得到两个第一分句;确定两个所述第一分句为所述待处理分句。5.根据权利要求2所述的语音交互方法,其特征在于,所述根据所述初始断点位置和所述第一置信度确定所述用户语音请求的待处理分句,包括:若所述初始断点位置中所述初始断点位置对应的所述第一置信度均不大于第一预设值,则根据所述第一置信度最大的所述初始断点位置对所述用户语音请求进行断句得到两个第一分句;确定两个所述第一分句为所述待处理分句。6.根据权利要求2所述的语音交互方法,其特征在于,所述对所述待处理分句进行二次断句处理得到所述断点位置和对应的置信度,包括:对所述待处理分句进行文本向量化处理得到第二语句向量;对所述第二语句向量进行断句处理得到所述断点位置和所述断点位置对应的所述置信度。7.根据权利要求1所述的语音交互方法,其特征在于,所述根据所述断点位置和所述置信度对所述用户语音请求进行处理,得到断句结果,包括:若根据...

【专利技术属性】
技术研发人员:张熙康赵耀王天一
申请(专利权)人:广州小鹏汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1