一种自定义车载语音技能系统及方法技术方案

技术编号:28298121 阅读:27 留言:0更新日期:2021-04-30 16:24
本发明专利技术涉及车载语音控制领域,具体公开一种自定义车载语音技能系统及方法,通过设置自定义语音技能训练引擎、自定义语音技能执行引擎、自定义语音技能脚本管理公共模块以及自定义语音技能显示公共模块,实现自定义车载语音技能,满足人们车载语音个性化的追求,提升用户参与感和产品体验。通过语音训练流程录制用户的操作动作,将动作转化为统一的脚本格式,使得语音的自定义不受限制于TTS播报文本或者车辆控制指令文本,让语音控制指令有了更多的选择性。

【技术实现步骤摘要】
一种自定义车载语音技能系统及方法
本专利技术涉及车载语音控制领域,尤其涉及一种自定义车载语音技能系统及方法。
技术介绍
随着语音技术的广泛应用,目前在车辆控制领域,语音助手在汽车里的应用越来越普遍,人们依赖语音完成一些简单的车辆控制,带来操作的便捷性,但现有车载语音控制系统存在几个问题:现有车载语音控制系统大多采用三方语音成品解决方案,功能配置标准化,同质化严重,基本不存在用户专户的个性化语音控制技能,也就很难体现产品的差异化;现有车载语音控制系统功能主要基于API接口对应用进行语音控制,但不是所有应用都会开放API接口给车载语音控制系统,导致无法实现所有系统应用的全语音控制,另外由于不同用户间存在使用同一功能的语言习惯差异,现有语音技能也无法覆盖所有用户不同的说法指令,特别是模糊意图识别;现有车载语音控制的技能提供APP或者服务商出厂时已经固定,用户无法切换为自己喜好的APP或者服务商;现有车载语音控制虽然也有一些个性化TTS设置等功能,但对于语音技能,用户仅有使用的权限,没有增加个性化的语音功能的入口,互动性一般。
技术实现思路
本专利技术提供自定义车载语音技能系统及方法,解决的技术问题是现有车载语音控制没有个性化自定义语音控制功能。为解决以上技术问题,本专利技术提供一种自定义车载语音技能系统,包括:自定义语音技能训练引擎、自定义语音技能执行引擎、自定义语音技能脚本管理公共模块以及自定义语音技能显示公共模块;所述自定义语音技能训练引擎用于自定义语音技能,并将所述自定义语音技能转换为脚本格式;所述自定义语音技能执行引擎用于接收并解析用户语音指令,判断当前车载语音交互场景,对自定义语音技能和原有语音技能进行仲裁决策,获取对应自定义语音技能脚本,解析并执行相应脚本;所述自定义语音技能脚本管理公共模块用于训练生成语音技能脚本的统一存储;所述自定义语音技能显示公共模块用于训练和使用自定义语音技能过程中的界面交互及对话语料管理。进一步地,所述自定义语音技能训练引擎包括自定义语音技能触发模块、语音动作引擎训练模块、车载场景选择模块、自定义语音技能脚本生成模块;所述自定义语音技能触发模块负责响应、仲裁和解析用户启动自定义语音技能的请求;所述语音动作引擎训练模块负责录制用户手动操作演示过程;所述车载场景选择模块负责为用户提供预置的可选自定义语音技能使用场景;所述自定义语音技能脚本生成模块负责将用户录制的所述操作演示过程转换为统一的脚本格式。进一步地,所述自定义语音技能执行引擎包括语音请求输入模块、原语音技能解析模块、车载场景识别模块、车载语音技能仲裁模块、自定义语音技能匹配模块、语音动作引擎执行模块;所述语音请求输入模块负责响应和分发用户的语音指令;所述原语音技能解析模块负责解析原有语音技能;所述车载场景识别模块负责识别当前的车载语音交互场景;所述车载语音技能仲裁模块负责对自定义语音技能和原有语音技能进行仲裁决策;所述自定义语音技能匹配模块负责获取对应自定义语音技能脚本;所述语音动作引擎执行模块负责解析并执行所述自定义语音技能脚本。更进一步地,所述自定义语音技能脚本管理公共模块还用于使用自定义语音技能时提供相应的脚本检索服务。更进一步地,所述车载语音交互场景,包括对话上下文、用户位置、车机系统状态、车身部件状态。本专利技术还提供一种自定义车载语音技能方法,包括步骤:S1、所述自定义语音技能触发模块接收到用户自定义语音技能的请求,解析是否属于已有语音技能,如果是,则提示用户是否需要更新,用户选择是以后进入自定义语音技能训练流程,如果不是,则直接进入所述自定义语音技能训练流程,所述自定义语音技能触发模块会调用所述自定义语音技能显示公共模块获取自定义语音技能训练引导界面和语料;S2、所述语音动作引擎训练模块启动录制技能流程,引导用户完成进行手动操作演示;S3、用户手动操作演示希望执行的操作步骤,所述语音动作引擎训练模块会记录并转换所有的所述操作步骤为所述语音动作引擎执行模块可以识别的脚本。进一步地,还包括步骤:S4、所述自定义语音技能脚本生成模块负责调用所述自定义语音技能显示公共模块获取自定义语音技能定义确认界面及提示语;S5、用户确认所述自定义语音技能训练完毕,所述自定义语音技能脚本生成模块会调用所述车载场景选择模块为当前自定义语音技能选择适用场景;S6、用户确认场景选择完毕后,所述自定义语音技能脚本生成模块将生成的脚本文件路径或者数据存储到所述自定义语音技能脚本管理公共模块,技能训练完成,并引导用户及时体验。进一步地,还包括步骤:S7、所述语音请求输入模块接收到用户输入的语音指令,并同时分发给所述自定义语音技能匹配模块及原语音技能解析模块,判断属于自定义语音技能还是原有语音技能,获取二者的返回结果;S8、所述车载场景识别模块根据用户位置及系统状态识别当前的场景,并将上一步收到的结果一起发送给所述车载语音技能仲裁模块;S9、所述车载语音技能仲裁模块根据上一步传递的信息决策优先选择自定义语音技能,若是自定义语音技能,且符合该自定义语音技能的适用场景,则不论是否属于原有语音技能,直接进入下一步,若不是自定义语音技能,或者虽然是自定义语音技能,但使用场景不匹配,则选择使用原有语义解析模块解析的技能,原有语义解析模块若识别到所述技能属于垂类技能,则执行该垂类技能,若属于非垂类技能,则引导用户训练新技能;S10、所述自定义语音技能匹配模块从所述自定义语音技能脚本管理公共模块读取所述自定义语音技能的相应脚本文件内容并发送给所述语音动作引擎执行模块;S11、所述语音动作引擎执行模块解析收到的所述自定义语音技能的相应脚本文件内容,根据所述脚本内容的顺序生成动作引擎可以识别的语音技能执行流;S12、所述语音动作引擎执行模块驱动车载语音助理执行所述语音技能执行流,在执行过程中,所述语音动作引擎执行模块会调用所述自定义语音技能显示公共模块获取自定义语音技能执行状态界面和提示语料,直到技能执行完毕。更进一步地,所述步骤S4还包括:用户还可以选择通过手动或者语音输入追加相似语音指令,若选择追加相似语音指令,则等用户完成相似指令录入后,再更新自定义语音技能脚本文件内容。更进一步地,所述步骤S5还包括:所述车载场景选择模块默认选择全场景通用,用户还可以选择子场景,其中子场景可以根据访客身份进行细分,或者可以根据当前系统用户模式进行细分,或者可以根据系统出厂技能进行细分。本专利技术实施例提供的一种自定义车载语音技能系统及方法,通过允许用户自定义语音技能,可以实现原有车载语音功能无法覆盖的场景,并且还能实现用户个性化的语音控制功能。出厂时语音功能固定且数量有限,但通过允许用户自定义语音技能,车载语音控制的技能实现任意系统应用任意操作的语音控制,每个用户都能定义自己的语音控制功能,如语音深度控制地图导航,产品差异化明显本文档来自技高网...

【技术保护点】
1.一种自定义车载语音技能系统,其特征在于,包括:自定义语音技能训练引擎、自定义语音技能执行引擎、自定义语音技能脚本管理公共模块以及自定义语音技能显示公共模块;/n所述自定义语音技能训练引擎用于自定义语音技能,并将所述自定义语音技能转换为脚本格式;/n所述自定义语音技能执行引擎用于接收并解析用户语音指令,判断当前车载语音交互场景,对自定义语音技能和原有语音技能进行仲裁决策,获取对应自定义语音技能脚本,解析并执行相应脚本;/n所述自定义语音技能脚本管理公共模块用于训练生成语音技能脚本的统一存储;/n所述自定义语音技能显示公共模块用于训练和使用自定义语音技能过程中的界面交互及对话语料管理。/n

【技术特征摘要】
1.一种自定义车载语音技能系统,其特征在于,包括:自定义语音技能训练引擎、自定义语音技能执行引擎、自定义语音技能脚本管理公共模块以及自定义语音技能显示公共模块;
所述自定义语音技能训练引擎用于自定义语音技能,并将所述自定义语音技能转换为脚本格式;
所述自定义语音技能执行引擎用于接收并解析用户语音指令,判断当前车载语音交互场景,对自定义语音技能和原有语音技能进行仲裁决策,获取对应自定义语音技能脚本,解析并执行相应脚本;
所述自定义语音技能脚本管理公共模块用于训练生成语音技能脚本的统一存储;
所述自定义语音技能显示公共模块用于训练和使用自定义语音技能过程中的界面交互及对话语料管理。


2.如权利要求1所述的自定义车载语音技能系统,其特征在于:
所述自定义语音技能训练引擎包括自定义语音技能触发模块、语音动作引擎训练模块、车载场景选择模块、自定义语音技能脚本生成模块;
所述自定义语音技能触发模块负责响应、仲裁和解析用户启动自定义语音技能的请求;
所述语音动作引擎训练模块负责录制用户手动操作演示过程;
所述车载场景选择模块负责为用户提供预置的可选自定义语音技能使用场景;
所述自定义语音技能脚本生成模块负责将用户录制的所述操作演示过程转换为统一的脚本格式。


3.如权利要求2所述的自定义车载语音技能系统,其特征在于:
所述自定义语音技能执行引擎包括语音请求输入模块、原语音技能解析模块、车载场景识别模块、车载语音技能仲裁模块、自定义语音技能匹配模块、语音动作引擎执行模块;
所述语音请求输入模块负责响应和分发用户的语音指令;
所述原语音技能解析模块负责解析原有语音技能;
所述车载场景识别模块负责识别当前的车载语音交互场景;
所述车载语音技能仲裁模块负责对自定义语音技能和原有语音技能进行仲裁决策;
所述自定义语音技能匹配模块负责获取对应自定义语音技能脚本;
所述语音动作引擎执行模块负责解析并执行所述自定义语音技能脚本。


4.如权利要求1所述的自定义车载语音技能系统,其特征在于:所述自定义语音技能脚本管理公共模块还用于使用自定义语音技能时提供相应的脚本检索服务。


5.如权利要求1所述的自定义车载语音技能系统,其特征在于:所述车载语音交互场景,包括对话上下文、用户位置、车机系统状态、车身部件状态。


6.一种自定义车载语音技能方法,其特征在于,包括步骤:
S1、所述自定义语音技能触发模块接收到用户自定义语音技能的请求,解析是否属于已有语音技能,如果是,则提示用户是否需要更新,用户选择是以后进入自定义语音技能训练流程,如果不是,则直接进入所述自定义语音技能训练流程,所述自定义语音技能触发模块会调用所述自定义语音技能显示公共模块获取自定义语音技能训练引导界面和语料;
S2、所述语音动作引擎训练模块启动录制技能...

【专利技术属性】
技术研发人员:谢志华王满红
申请(专利权)人:惠州市德赛西威汽车电子股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1