用于车辆语音控制的方法、装置、设备和介质制造方法及图纸

技术编号:19781211 阅读:24 留言:0更新日期:2018-12-15 12:09
本公开的实施例涉及一种车辆语音控制的方法、装置、设备和计算机可读存储介质。该方法包括获取由车辆识别用户输入的语音而产生的文本;基于该用户的身份信息划分该文本为多个文本部分;通过确定与每个文本部分相关联的一个或多个车辆可执行的指令,生成一个指令集合;以及使该车辆执行该指令集合中的至少一部分指令。本公开的技术方案可以提高车载场景中语音识别的效率和准确性,从而提高用户的语音交互体验。

【技术实现步骤摘要】
用于车辆语音控制的方法、装置、设备和介质
本公开总体上涉及信息处理领域,更具体地,涉及用于车辆语音控制的方法、装置、设备和计算机可读存储介质。
技术介绍
当前,在车载互联场景中,随着语音识别与回声消除技术日益成熟,用户使用语音进行操作的频率也日益增加。语音交互也从单轮语音交互发展为多轮语音交互,使得语音交互过程也更为流畅。然而,用户在单次语音交互中能够操作的指令的数目仍然被限制在单个指令内,导致无法有效地利用语音识别。而且,用户经常执行的多个操作也无法简单方便地完成。此外,用户也难以通过语音调用车载系统中的各个应用。这些缺陷降低了用户的语音交互体验。
技术实现思路
根据本公开的示例实施例,提供了一种车辆语音控制的方案。在本公开的第一方面中,提供了一种用于车辆语音控制的方法。该方法包括获取由车辆识别用户输入的语音而产生的文本。该方法还包括基于该用户的身份信息划分该文本为多个文本部分。进一步地,该方法还包括通过确定与每个文本部分相关联的一个或多个车辆可执行的指令,生成一个指令集合。更进一步地,该方法还包括使该车辆执行该指令集合中的至少一部分指令。在本公开的第二方面中,提供了一种用于车辆语音控制的装置。该装置包括获取模块,被配置为获取由车辆识别用户输入的语音而产生的文本。该装置还包括划分模块,被配置为基于用户的身份信息划分文本为多个文本部分。进一步地,该装置还包括生成模块,被配置为通过确定与每个文本部分相关联的一个或多个车辆可执行的指令,生成一个指令集合。更进一步地,该装置还包括执行模块,被配置为使车辆执行指令集合中的至少一部分指令。在本公开的第三方面中,提供了一种电子设备。该电子设备包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。在本公开的第四方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。附图说明结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图;图2示出了根据本公开的一些实施例的用于车辆语音控制的过程或方法的示意流程图;图3示出了根据本公开的一些实施例的用于车辆语音控制的装置的示意框图;以及图4示出了能够实施本公开的多个实施例的计算设备的示意框图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。如以上提及的,在当前车载互联场景中,用户无法有效地利用语音识别,无法直接调用多个操作,也无法调用车载系统中的各个应用,使得降低了用户的语音交互体验。本公开的实施例提出了一种用于车辆语音控制的方案。在该方案中,获取由车辆识别用户输入的语音而产生的文本;基于该用户的身份信息划分该文本为多个文本部分;通过确定与每个文本部分相关联的一个或多个车辆可执行的指令,生成一个指令集合;以及使该车辆执行该指令集合中的至少一部分指令。以此方式,可以基于用户的身份信息来识别用户意图执行的多个指令,从而提高了指令识别的效率和准确性,极大地改善了用户的语音交互体验。以下将参照附图来具体描述本公开的实施例。图1示出了本公开的多个实施例能够在其中实现的示例环境100的示意图。如图所示,示例环境100包括车辆110、用户120和计算设备130。车辆110可以是诸如机动车辆、非机动车辆等能够移动的任何实体。虽然在文本中以车辆100为例进行了描述,但是应当理解,车辆有时也可以被替换为不发生运动的任何实体,例如诸如电视、空调、冰箱、微波炉等的家用电器。车辆110包括车载计算设备112、语音采集设备114和存储设备116。车载计算设备112可以是集中式或分布式的任何适当的计算设备,包括但不限于个人计算机、服务器、客户端、手持或膝上型设备、多处理器、微处理器、机顶盒、可编程消费电子产品、网络PC、小型计算机、大型计算机系统和分布式云以及其组合等。语音采集设备114可以是能够收集来自用户120的语音的任何采集设备。语音采集设备114的示例包括但不限于车载麦克风、具有麦克风的车载摄像头等。此外,存储设备116可以是用于存储与车辆110有关的数据的任何存储设备。在某些实施例中,语音采集设备114可以采集来自用户120的语音,并且将所采集的语音提供给车载计算设备112。车载计算设备112可以将所获取的语音转换为文本,并且识别文本中所涉及的一个或多个车辆可执行的指令。车辆可执行的指令可以对车载系统中的各个应用进行操作。例如,车辆可执行的指令可以指示“打开导航”、“打开音乐”等,使得可以打开车载系统中的导航应用、音乐应用等。在某些实施例中,存储设备116可以存储唤醒语句。唤醒语句通常不是车辆可执行的指令、但是与车辆可执行的指令相关联。车载计算设备112可以从存储设备116获取唤醒语句,并且将唤醒语句与文本进行比较。当唤醒语句与文本相匹配时,车载计算设备112可以获取与唤醒语句相对应的指令集合(也可以被称为工作流)。例如,车载计算设备112可以从计算设备130获取该指令集合。备选地,车载计算设备112可以从存储设备116获取该指令集合。然后,车载计算设备112可以执行该指令集合。对于车辆110,计算设备130可以是远程的,也可以是本地的。计算设备130可以是集中式或分布式的任何适当的计算设备,包括但不限于个人计算机、服务器、客户端、手持或膝上型设备、多处理器、微处理器、机顶盒、可编程消费电子产品、网络PC、小型计算机、大型计算机系统和分布式云以及其组合等。计算设备130可以与车辆110、特别是其中的车载计算设备112通信,例如通过有线和/或无线连接进行通信。相反,当唤醒语句与文本不匹配时,车载计算设备112可以将文本发送到计算设备130。在某些实施例中,计算设备130可以对该文本进行多层处理。例如,计算设备130可以对文本执行两层或三层处理。具体地,在第一层处理中,计算设备130可以基于用户120的身份信息划分该文本为多个文本部分。用户120的身份信息可以指示与用户120相关联的唤醒语句、特定于用户120的连接词等。此外,在第一层处理中,计算设备130还可以使用通用连接词划分该文本为多个文本部分。通用连接词是通常被用于划分文本的词语,例如“并且”、“本文档来自技高网
...

【技术保护点】
1.一种车辆语音控制的方法,包括:获取由车辆识别用户输入的语音而产生的文本;基于所述用户的身份信息划分所述文本为多个文本部分;通过确定与每个文本部分相关联的一个或多个车辆可执行的指令,生成一个指令集合;以及使所述车辆执行所述指令集合中的至少一部分指令。

【技术特征摘要】
1.一种车辆语音控制的方法,包括:获取由车辆识别用户输入的语音而产生的文本;基于所述用户的身份信息划分所述文本为多个文本部分;通过确定与每个文本部分相关联的一个或多个车辆可执行的指令,生成一个指令集合;以及使所述车辆执行所述指令集合中的至少一部分指令。2.根据权利要求1所述的方法,其中获取所述文本包括:响应于所述车辆无法确定所述一个或多个车辆可执行的指令,获取所述文本。3.根据权利要求1所述的方法,其中划分所述文本包括:在所述文本中识别与所述用户相关联的唤醒语句,所述唤醒语句不是所述一个或多个车辆可执行的指令、但是与所述一个或多个车辆可执行的指令相关联;以及响应于识别到所述唤醒语句,将每个唤醒语句从所述文本中划分出来作为第一文本部分。4.根据权利要求1所述的方法,其中划分所述文本包括:在所述文本中识别特定于所述用户的连接词;以及基于所述连接词来划分所述文本。5.根据权利要求1所述的方法,其中划分所述文本包括:对划分所得到的所述多个文本部分中的至少一个文本部分应用语法分析,以获得一个或多个第二文本部分。6.根据权利要求5所述的方法,其中划分所述文本包括:获取所述用户输入所述语音时所位于的地理位置;以及基于所述地理位置,对所述一个或多个第二文本部分中不与所述一个或多个车辆可执行的指令相关联的第二文本部分应用方言分析。7.根据权利要求1所述的方法,其中生成所述指令集合包括:通过去除所述一个或多个车辆可执行的指令中重复的指令,生成所述指令集合。8.根据权利要求1所述的方法,其中使所述车辆执行所述指令集合中的至少一部分指令包括:获取所述车辆的标识;确定与所述标识对应的可用指令集合;以及使所述车辆执行所述指令集合中属于所述可用指令集合的至少一部分指令。9.根据权利要求1所述的方法,还包括:生成指示所述至少一部分指令的唤醒语句。10.一种车辆语音控制的装置,包括:获取模块,被配置为获取由车辆识别用户输入的语音而产生的文本;划分模块,被配置为基于所述用户的身份信息划分所述文本为多个文本部分;生成模块,被配置为通过确定与每个文本部分相关联的一个或多个车辆可执行的指令,生成一个指令集合;以及执行模块,被配置为使所述车辆执行所述指令集合中的至少一部分指令。11.根据权利要求1...

【专利技术属性】
技术研发人员:张佳雄
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1