语音交互方法、车辆、服务器、系统和存储介质技术方案

技术编号:25914212 阅读:18 留言:0更新日期:2020-10-13 10:32
本发明专利技术涉及语音技术领域,特别是涉及一种语音交互方法、车辆、服务器和存储介质,方法包括:车辆接收用户的语音请求,并将语音请求和当前车载系统图形用户界面的上下文信息发送至服务器;服务器根据上下文信息完成语音请求的自然语言理解处理;服务器利用自然语言理解处理结果,生成车辆可执行的指令并发送给车辆;车辆接收并执行该指令,同时将执行结果通过语音反馈给用户。语音交互过程中服务器可以充分利用上下文信息完成自然语言理解处理,由于增加了更多维度的信息,用户在车辆中看到图形用户界面上的任何内容都可以通过语音进行操作,进而提高了人机交互系统的交互质量。

【技术实现步骤摘要】
语音交互方法、车辆、服务器、系统和存储介质
本专利技术涉及语音
,特别是涉及一种语音交互方法、车辆、服务器、系统和存储介质。
技术介绍
随着汽车智能化和语音技术的发展,语音在汽车上的运用越来越广泛。在用户驾驶车辆的过程中,能够无接触地实现用户对车辆或者车辆上车载系统的控制,可以在保障行车安全的情况下增强用户的使用体验。汽车智能化带来了更强的车机芯片和图形芯片,新一代车机芯片的算力以及图形芯片的性能,使得在车载系统上实现像手机一样更丰富的界面和更有趣味的动画成为了一种可能。现在车辆上使用语音的方式经常是设置一个独立的语音助理,在接收完用户的语音请求后,通过服务器给予反馈。这种使用方式和车载系统的界面是完全独立的,由于只利用语音信号,缺少更多维度的信息,使人机交互系统的交互质量难以令人满意。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种语音交互方法、车辆、服务器、系统和存储介质。为了解决上述问题,本专利技术实施例公开了一种语音交互方法,应用于包括车辆和可与车辆进行通信的服务器组成的语音交互系统,其特征在于,包括:车辆接收用户的语音请求,并将语音请求和当前车载系统图形用户界面的上下文信息发送至服务器;服务器根据上下文信息完成语音请求的自然语言理解处理;服务器利用自然语言理解处理结果,生成车辆可执行的指令并发送给车辆;车辆接收并执行该指令,同时将执行结果通过语音反馈给用户。进一步地,上下文信息包括当前车载系统图形用户界面中可操作的控件的名称和类型、可操作的控件支持的动作、动作的取值范围和可操作的控件当前的状态。进一步地,服务器根据上下文信息完成语音请求的自然语言理解处理,包括:根据上下文信息创建场景语义空间;对语音请求进行语义理解并输出语义理解结果;在场景语义空间,利用语义理解结果对可操作的控件进行检索、召回、排序和匹配;输出可操作的控件响应该语音请求的操作作为自然语言理解处理结果。进一步地,根据上下文信息创建场景语义空间,包括:接收车辆发送的上下文信息;载入并解析上下文信息中包括的场景元素;根据场景元素生成场景语义文档。进一步地,对语音请求进行语义理解并输出语义理解结果,包括:对语音请求中的文本进行文本预处理和文本归一化处理,然后提取句子主干;根据句子主干理解用户语音请求的意图并输出语义理解结果。进一步地,根据句子主干理解用户语音请求的意图并输出语义理解结果,包括:根据句子主干确定理解用户语音请求的意图的初步结果,再利用句子主干中的否定词对初步结果进行修正,输出修正后的语义理解结果。进一步地,在场景语义空间,利用语义理解结果对可操作的控件进行检索、召回、排序和匹配,包括:提取语音请求中的文本在场景语义文档中检索;利用预设召回策略对检索结果进行召回,再进行匹配度打分;按预设排序策略对打分后的检索结果进行排序;根据排序结果输出匹配结果;其中匹配结果包括对可操作的控件的操作意图、可操作的控件的名称、以及对可操作的控件的执行动作。进一步地,语音请求中的文本包括语音请求中的全部文本或者部分文本,则提取语音请求中的文本在场景语义文档中检索,包括以下任意一种:提取语音请求中的实体词在场景语义文档中检索;提取语音请求中的包括实体词和动作词在内的文本在场景语义文档中检索;或,提取语音请求中的全部文本在场景语义文档中检索。进一步地,利用预设召回策略对检索结果进行召回,包括:针对检索结果,利用包括基于预设的可忽略词列表进行文本忽略、核心词必须命中、设置阈值进行召回、对文本中的动作词或者否定意图进行校验在内的一种或者多种预设召回策略进行召回。本专利技术实施例还公开了一种车辆,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述的语音交互方法的步骤。本专利技术实施例还公开了一种服务器,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述的语音交互方法的步骤。本专利技术实施例还公开了一种语音交互系统,该系统包括车辆和可与车辆进行通信的服务器,其中,车辆上设置有请求接收模块、信息发送模块、指令接收模块和执行反馈模块,服务器上设置有自然语言理解模块和指令发送模块;请求接收模块,用于接收用户的语音请求;信息发送模块,用于将语音请求和当前车载系统图形用户界面的上下文信息发送至服务器;自然语言理解模块,用于根据上下文信息完成语音请求的自然语言理解处理;指令发送模块,用于在服务器利用自然语言理解处理结果,生成车辆可执行的指令后将指令发送给车辆;指令接收模块,用于接收并执行该指令,同时通过执行反馈模块将执行结果通过语音反馈给用户。本专利技术实施例还公开了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述的语音交互方法。本专利技术实施例包括以下优点:通过将当前车载系统图形用户界面的上下文信息发送至服务器,使得语音交互过程中服务器可以充分利用上下文信息完成自然语言理解处理,由于增加了更多维度的信息,用户在车辆中看到图形用户界面(GraphicalUserInterface,缩写:GUI)上的任何内容都可以通过语音进行操作,进而提高了人机交互系统的交互质量。附图说明图1是本专利技术的一种语音交互方法实施例的步骤流程图;图2是本专利技术的车载系统导航播报图形用户界面的示意图;图3是本专利技术的一种语音交互方法中自然语言理解的步骤流程图;图4是本专利技术的一种语音交互方法实施例中上下文信息的代码示意图;图5是本专利技术的一种语音交互系统实施例的结构框图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。参照图1,示出了本专利技术的一种语音交互方法实施例的步骤流程图,具体可以包括如下步骤:S1,车辆接收用户的语音请求,并将语音请求和当前车载系统图形用户界面的上下文信息发送至服务器。S2,服务器根据上下文信息完成语音请求的自然语言理解处理。S3,服务器利用自然语言理解处理结果,生成车辆可执行的指令并发送给车辆。S4,车辆接收并执行该指令,同时将执行结果通过语音反馈给用户。上述语音交互方法,应用于包括车辆和可与车辆进行通信的服务器组成的语音交互系统。具体地,车辆上设置有通信模块,可以基于包括3G、4G或者5G在内的运营商网络或者其他通信连接方式,和服务器进行通信完成数据交互。在车辆中,车辆的显示区域可以包括仪表屏、车载中控屏幕以及车辆挡风玻璃上可本文档来自技高网...

【技术保护点】
1.一种语音交互方法,应用于包括车辆和可与车辆进行通信的服务器组成的语音交互系统,其特征在于,包括:/n车辆接收用户的语音请求,并将语音请求和当前车载系统图形用户界面的上下文信息发送至服务器;/n服务器根据上下文信息完成语音请求的自然语言理解处理;/n服务器利用自然语言理解处理结果,生成车辆可执行的指令并发送给车辆;/n车辆接收并执行该指令,同时将执行结果通过语音反馈给用户。/n

【技术特征摘要】
1.一种语音交互方法,应用于包括车辆和可与车辆进行通信的服务器组成的语音交互系统,其特征在于,包括:
车辆接收用户的语音请求,并将语音请求和当前车载系统图形用户界面的上下文信息发送至服务器;
服务器根据上下文信息完成语音请求的自然语言理解处理;
服务器利用自然语言理解处理结果,生成车辆可执行的指令并发送给车辆;
车辆接收并执行该指令,同时将执行结果通过语音反馈给用户。


2.如权利要求1所述语音交互方法,其特征在于,上下文信息包括当前车载系统图形用户界面中可操作的控件的名称和类型、可操作的控件支持的动作、动作的取值范围和可操作的控件当前的状态。


3.如权利要求2所述语音交互方法,其特征在于,服务器根据上下文信息完成语音请求的自然语言理解处理,包括:...

【专利技术属性】
技术研发人员:孙仿逊胡梓垣翁志伟
申请(专利权)人:广州小鹏车联网科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1