用于处理语音输入的方法、设备和具有指令的计算机可读存储介质、具有语音处理的机动车和用户终端设备技术

技术编号:25317137 阅读:18 留言:0更新日期:2020-08-18 22:33
用于处理语音输入的方法、设备和具有指令的计算机可读存储介质。在第一步骤中,接收(10)用户的语音输入。紧接着,该语音输入针对两个或更多个可供使用的语音处理服务中的至少一个语音处理服务被预处理(11)。最后,将经预处理的语音输入传递(12)给这些可供使用的语音处理服务中的一个或多个语音处理服务。

【技术实现步骤摘要】
【国外来华专利技术】用于处理语音输入的方法、设备和具有指令的计算机可读存储介质、具有语音处理的机动车和用户终端设备
本专利技术涉及一种用于处理语音输入的方法、设备和具有指令的计算机可读存储介质。本专利技术还涉及一种具有语音处理的机动车和用户终端设备,在该机动车和该用户终端设备中使用按照本专利技术的方法或按照本专利技术的设备。
技术介绍
利用语音处理系统,用户可以通过语音接口以在很大程度上自然的语音来进行部分自动化或完全自动化的对话。这样的语音处理系统例如从电话服务领域公知。在这样的应用中,整个语音处理都通过在附图提供商侧的计算机系统来进行。语音处理系统的另一应用领域是“Smart-Home(智能家居)”设备、也就是说用于智能家居的设备。在上位概念SmartHome下归纳如下技术方法和系统,利用所述技术方法和系统应该实现更高的居住和生活质量、经提高的安全性以及更高效的能量利用。其基础是联网且可远程控制的设备以及可自动化的流程。这种设备部分地允许与智能私人助理的基于语音的交互。因为品质高值的语音处理需要高计算能力,所以在这种设备的情况下该语音处理主要通过在智能私人助理的提供商侧的计算机系统来进行。仅为了激活语音处理而由用户侧的设备进行受限的语音识别。此外,也越来越多地使用设备集成的语音处理系统,例如在机动车中的可借助于语音输入来控制的导航系统的情况下或者在机动车中的通过其可以监控机动车的功能的免提装置的情况下越来越多地使用设备集成的语音处理系统。这种系统大多本地工作。在该背景下,DE102014017384A1描述了一种用于运行机动车操作设备以便对于用户的语音输入借助于语音识别系统来确定至少一个识别结果并且将所述识别结果以结果列表的形式输出的方法。如果用户然后做出第二次语音输入,则检测该用户是否因为他并未在该结果列表中找出了所期望的识别结果而对其第一次语音输入在内容上进行重复或修正。DE102014201676A1描述了一种用于控制语音系统的语音对话的方法。首先,接收语音系统的用户的第一个表达。接着,基于该第一个表达,确定可能结果的第一列表。于是,对第一列表的元素进行分析,以便确定这些元素的歧义。最后,基于部分正字法和歧义,生成对用户的语音请求,以便该用户可以分辨该歧义。对于在机动车中使用来说,提高语音处理的可靠性恰恰是值得期望的。应该尽可能并不由此而使驾驶员从驾驶中分散注意力,即,因为语音输入未被理解而使得驾驶员必须将他注意力的一部分用于与语音处理的交互。用于提高语音处理的可靠性的第一方案基于对上下文信息的考虑。例如,DE102015213722A1描述了一种用于运行车辆中的语音识别系统的方法。在检测用户的语音输入时,附加地检测关于语音输入的上下文的数据。于是,首先生成语音输入的所识别出的文本并且执行对所识别出的文本的语义分析。根据该语义分析和关于语音输入的上下文的数据,确定所识别出的文本的识别质量并且从多个语音模型中选择一个语音模型。该语音模型被用于进一步的文本识别和进一步的语义分析。该方案被反复重复,直至达到足够的识别质量。接着,依据最后一次语义分析来执行功能。用于提高语音处理的可靠性的另一方案除了本地语音处理之外还使用通过外部计算机系统进行的语音处理。例如,EP2909833B1描述了一种用于机动车中的语音识别的方法。从用户接收语音输入并且将这些语音输入中的至少一个语音输入传递给车辆内部的车载语音识别系统。于是,语音识别系统生成第一识别结果。处理器单元也将语音输入整个或部分地传递给车辆外部的非车载语音识别系统,该车辆外部的非车载语音识别系统将第二识别结果传输给该处理器单元。在语音识别时,可以考虑上下文信息。接着,根据第一和第二识别结果,由分析单元来确定语音文本。US2015/0058018A1描述了一种用于识别语音输入的方法,该语音输入包括自然语音和来自域特定的词汇的至少一个词。在第一次语音处理过程中,标识语音输入的第一部分和第二部分,该第一部分包含自然语音,该第二部分包含至少一个域特定的词。此外,在该轮次中对包含在第一部分中的自然语音进行处理。在第二次语音处理过程中,处理具有该至少一个域特定的词的第二部分。用户终端设备、诸如智能电话、平板电脑、笔记本电脑或者PC的制造商自一段时间以来就使用自己的语音处理系统。为此的示例是AppleSiri[1]、MicrosoftCortana[2]或者GoogleAllo[3]。这些系统个性化地了解用户行为并且通过持续使用来优化其应答。例如AmazonEcho[4、5]的扩展方案可以通过语音来控制智能家居解决方案。部分地,具有语音处理系统的智能电话已经可以被纳入到机动车中。例如,DE102014209992A1描述了一种车辆接口模块,该车辆接口模块可以与用户的移动设备并且与车辆进行通信。为此,该车辆接口模块包括用于与移动设备通信的无线收发器和用于与车辆数据总线的通信的车辆收发器。该车辆接口模块的处理器借助于车辆收发器从车辆数据总线接收信号,该信号是通过到车辆计算机系统中的用户输入所发动的。该处理器确定是否在移动设备上请求用于激活语音识别会话的信号。如果情况如此,则借助于无线收发器来向移动设备请求开始语音识别会话。DE102012218938A1描述了一种用于标识和触发针对移动设备的基于语音的接口的服务的方法。该方法包含接收语音识别结果,该语音识别结果是在移动设备中的语音输入的内容。确定所期望的服务,其方式是,在使用服务标识语法的情况下对该语音识别结果进行处理。确定用户服务请求,其方式是,在使用服务特定的语法的情况下对该语音识别结果的一部分进行处理。该用户服务请求被释放并且服务应答被接收。根据该服务应答来生成音频消息。通过扬声器来将该音频消息展示给用户。对于未来而言,应期望地而是对集成在机动车中的语音服务进行扩展,其中加强使用后端中的语音处理。为了该目的,车辆制造商估计将建立自己的后端系统或提供自己的后端系统。当前的语音处理系统可以由用户以不同的方式来激活,其中这些语音处理系统也可以并行地提供多种用于激活的可能性。第一方案在于:用户必须操纵按键,以便能够实现语音输入。在操纵该按键之后,首先进行系统的声音反馈,例如以信号音的形式或者通过语音输出来进行系统的声音反馈。紧接着,用户可以表达如下语音指令,该语音指令被该系统检测和处理。在第二方案中,通过如下方式来激活该语音处理系统:用户说出信号词,该信号词被该系统检测和分析。该信号词并非强制性地是单个词,也可以是词序列。在成功识别出该信号词之后,通常首先进行该系统的声音反馈。如已经在第一方案的情况下那样,为此可以使用信号音或者语音输出。像之前那样,紧接着用户可以表达如下语音指令,该语音指令被该系统检测和处理。因为该语音处理系统通过说出该信号词来从休眠状态被唤醒,所以也开创了术语“Wake-Up-Phrase(唤醒短语)”或者“唤醒短语”,作为该信号词的替选的名称。按照第三方案,用户在唯一一句话中在语音输入或语音指令之后紧接着说出该信号词。在这种情况下本文档来自技高网...

【技术保护点】
1.一种用于处理语音输入(SE)的方法,所述方法具有如下步骤:/n- 接收(10)用户的语音输入(SE);/n- 针对两个或更多个可供使用的语音处理服务(50_1, ..., 50_n)中的至少一个语音处理服务来对所述语音输入(SE)进行预处理(11),其中在对所述语音输入(SE)进行所述预处理(11)时生成一个或多个经预处理的语音输入(SE_1, ..., SE_n),其方式是,分别将信号词(SW_1, ..., SW_n)添加至所述语音输入(SE);和/n- 将经预处理的语音输入(SE_1, ..., SE_n)传递(12)给所述可供使用的语音处理服务(50_1, ..., 50_n)中的一个或多个语音处理服务。/n

【技术特征摘要】
【国外来华专利技术】20180104 DE 102018200088.31.一种用于处理语音输入(SE)的方法,所述方法具有如下步骤:
-接收(10)用户的语音输入(SE);
-针对两个或更多个可供使用的语音处理服务(50_1,...,50_n)中的至少一个语音处理服务来对所述语音输入(SE)进行预处理(11),其中在对所述语音输入(SE)进行所述预处理(11)时生成一个或多个经预处理的语音输入(SE_1,...,SE_n),其方式是,分别将信号词(SW_1,...,SW_n)添加至所述语音输入(SE);和
-将经预处理的语音输入(SE_1,...,SE_n)传递(12)给所述可供使用的语音处理服务(50_1,...,50_n)中的一个或多个语音处理服务。


2.根据权利要求1所述的方法,其中在针对所述两个或更多个可供使用的语音处理服务(50_1,...,50_n)中的多个语音处理服务或每个语音处理服务来对所述语音输入(SE)进行预处理(11)时,生成经预处理的语音输入(SE_1,...,SE_n),其方式是,分别将所属的信号词(SW_1,...,SW_n)添加至所述语音输入(SE),而且其中将所属的经预处理的语音输入(SE_1,...,SE_n)传递(12)给所选择的语音处理服务(50_1,...,50_n)中的每个语音处理服务。


3.根据权利要求2所述的方法,所述方法还包括如下步骤:
-接收(13)所述语音处理服务(50_1,...,50_n)的应答(AN_1,...,AN_n);
-分析(14)所接收到的应答(AN_1,...,AN_n);和
-输出(15)在所述分析之后保留的应答中的至少一个应答(AN_1,...,AN_n)。


4.根据权利要求3所述的方法,其中如果在分析(14)所接收到的应答(AN_1,...,AN_n)时有两个或更多个应答(AN_1,...,AN_n)被归为合理,则向用户进行询问。


5.根据权利要求3或4所述的方法,其中在所述分析(14)时抑制如下应答(AN_1,...,AN_n),所述应答表明经预处理的语音输入(SE_1,...,SE_n)不能被所述可供使用的语音处理服务(50_1,...,50_n)之一成功处理。


6.根据权利要求1所述的方法,其中对所述语音输入(SE)的预处理(11)包括:
-关于所述语音输入(SE)的内容方面对所述语音输入进行分析;
-将所述语音输入(SE)分配给所述可供使用的语音处理服务(50_1,...,50_n)之一;和
-通过将属于所分配的语音处理服务(50_1,...,50_n)的信号词(SW_1,...,SW_n)添加至所述语音输入(SE)来生成经预处理的语音输入(SE_1,...,SE_n)。
<...

【专利技术属性】
技术研发人员:R沃伊克
申请(专利权)人:大众汽车有限公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1