语音交互的自适应优化方法及装置制造方法及图纸

技术编号:39246835 阅读:14 留言:0更新日期:2023-10-30 11:59
本发明专利技术涉及智能座舱技术领域,提供了一种语音交互的自适应优化方法,包括如下步骤:(1)激活语音控制功能,接收驾驶员录入的语音数据;(2)将语音数据转换成文本数据,提取文本数据中动词及名词,将动词及名字组成控制指令;(3)检测当前形成的控制指令是否有效,若检测结果为是,则将有效控制指令发送至对应的控制器,以控制对应对象执行指令对应的动作。通过针对每个驾驶员构建用于口音纠正的语音库,基于该语音库来辅助文本数据的转换,以降低口音导致的控制指令识别偏差,可以极大地提高控制指令识别的精准度。指令识别的精准度。指令识别的精准度。

【技术实现步骤摘要】
语音交互的自适应优化方法及装置


[0001]本专利技术涉及智能座舱
,提供了一种语音交互的自适应优化方法及装置。

技术介绍

[0002]目前,车载语音技术的应用越来越普遍,车载语音技术可以支持用户通过语音在车舱内与车辆进行交互,控制车辆零部件或与车载系统用户界面中的组件进行交互,用户在驾驶场景下使用语音进行设备控制相较于手动操作无需转移视线,能够提升驾驶的安全性。
[0003]当用户发出的语音命令因为语调、省略、分句、方言等因素,影响语音交互的流畅性和准确性,导致用户体验不佳。一般情况下,需要车载系统后台升级或等系统更新才能批量解决部分语音交互不流畅和不准确的问题。
[0004]由于车载系统后台升级或等系统更新主要是面相所有的用户群体,解决或改善用户全体中的主要问题,由于个体用户间的语言差异较大,对单个个体用户而言,车载系统后台升级或等系统更新可能无法解决或改善个体用户的语音交互不流畅和不准确的问题。

技术实现思路

[0005]鉴于此,本申请提供一种语音交互的自适应优化方法,旨在改善上述问题。
[0006]具体而言,包括以下的技术方案:
[0007]一方面,本申请实施例提供了一种语音交互的自适应优化方法,所述方法包括如下步骤:
[0008](1)激活语音控制功能,接收驾驶员录入的语音数据;
[0009](2)将语音数据转换成文本数据,提取文本数据中动词及名词,将动词及名字组成控制指令;
[0010](3)检测当前形成的控制指令是否有效,若检测结果为是,则将有效控制指令发送至对应的控制器,以控制对应对象执行指令对应的动作。
[0011]在一些实施例中,该方法还包括:
[0012]更新驾驶员的语音库,每个驾驶员对应一个语音库,语音库中存储有语音

文本偏差转换前后的文本数据;
[0013]基于该语音

文本偏差转换前后的文本数据对文本数据进行修正。
[0014]在一些实施例中,语音库的形成方法具体如下:
[0015]接收录入的语音数据,将录入的语音数据转换成文本数据,输出文本数据;
[0016]接收修正后的文本数据,将修正后的文本数据与修正前的文本数据进行比对,获取文本数据中偏差位置;
[0017]将修正前后偏差位置处的文本数据组成数据对存储至语音库中。
[0018]在一些实施例中,在步骤(1)之前还包括:
[0019]驾驶员在启动车辆前,进行驾驶员的身份识别,进而匹配出驾驶员对应的语音库。
[0020]在一些实施例中,在文本数据存在多个动词时,对文本数据进行拆分,拆分方法具体如下:
[0021]检测两个动词之间的最长停顿时长,在最长停顿时长位置处进行分割,将一条文本数据/段分成两条文本段,提取每条文本段中动词及名词,动词与各名词的组成形成多条控制指令。
[0022]在一些实施例中,基于语音库的文本数据转换方法具体如下:
[0023]在将语音数据转换成文本数据后,检测相应语音库中数据对中修正前文本是否存在于当前文本数据中,若存在,则用语音库中数据对中修正后文本替代,形成新的文本数据;
[0024]对文本数据按优先级进行排序,修正后的文本数据优先级高于未修正的文本数据,先对优先级高的文本数据进行控制指令的提取。
[0025]一方面,本申请实施例提供了一种语音交互的自适应优化装置,所述装置包括:
[0026]依次连接的语音录入模块、文本转换模块、控制指令形成模块及有效性检测模块,
[0027]激活语音控制功能后,语音录入模块用于接收驾驶员录入的语音数据;
[0028]文本转换模块,用于将语音数据转换成文本数据;
[0029]控制指令形成模块,用于提取文本数据中动词及名词,将动词及名词组成控制指令;
[0030]有效性检测模块,用于检测当前形成的控制指令是否有效,若检测结果为是,则将有效控制指令发送至对应的控制器,以控制对应对象执行指令对应的动作。
[0031]在一些实施例中,所述装置还包括:存储单元及文本形成模块,文本形成模块分别与文本转换模块、存储单元连接,
[0032]存储单元内存储所有驾驶员的语音库,语音库中存储有中对应驾驶员的语音

文本偏差转换前后的文本数据;
[0033]文本转换模块将文本数据输入文本形成模块,文本形成模块检测相应语音库中数据对中修正前文本是否存在于当前文本数据中,若存在,则用语音库中数据对中修正后文本替代,形成新的文本数据。
[0034]在一些实施例中,所述装置还包括:
[0035]文本排序模块,对对文本数据按优先级进行排序,修正后的文本数据优先级高于修正前的文本数据,将优先级高为文本数据优先输入至文本拆分模块或者是指令形成模块。
[0036]在一些实施例中,该装置还包括:本拆分模块,与文本转换模块、文本形成模块连接,用于多动词的文本数据进行拆分,拆分成多条文本段。
[0037]本专利技术通过针对每个驾驶员构建用于口音纠正的语音库,基于该语音库来辅助文本数据的转换,以降低口音导致的控制指令识别偏差,可以极大地提高控制指令识别的精准度。
附图说明
[0038]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于
本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0039]图1为本专利技术实施例提供的语音交互的自适应优化方法流程图;
[0040]图2为本专利技术实施例提供的语音交互的自适应优化装置的结构示意图;
[0041]通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0042]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0043]除非另有定义,本申请实施例所用的所有技术术语均具有与本领域普通技术人员通常理解的相同的含义。
[0044]图1为本专利技术实施例提供的语音交互的自适应优化方法流程图,该方法具体包括如下步骤:
[0045](1)激活语音控制功能,接收驾驶员录入的语音数据;
[0046]在本专利技术实施例中,语音控制功能的激活和退出可以是指定的语音口令来进行激活,当然,也可以是通过指定的触发动作来进行激活。
[0047](2)将语音数据转换成文本数据,提取文本数据中动词及名词,将动词及名字组成控制指令;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互的自适应优化方法,其特征在于,所述方法包括如下步骤:(1)激活语音控制功能,接收驾驶员录入的语音数据;(2)将语音数据转换成文本数据,提取文本数据中动词及名词,将动词及名字组成控制指令;(3)检测当前形成的控制指令是否有效,若检测结果为是,则将有效控制指令发送至对应的控制器,以控制对应对象执行指令对应的动作。2.如权利要求1所述语音交互的自适应优化方法,其特征在于,该方法还包括:更新驾驶员的语音库,每个驾驶员对应一个语音库,语音库中存储有语音

文本偏差转换前后的文本数据;基于该语音

文本偏差转换前后的文本数据对文本数据进行修正。3.如权利要求2所述所述语音交互的自适应优化方法,其特征在于,语音库的形成方法具体如下:接收录入的语音数据,将录入的语音数据转换成文本数据,输出文本数据;接收修正后的文本数据,将修正后的文本数据与修正前的文本数据进行比对,获取文本数据中偏差位置;将修正前后偏差位置处的文本数据组成数据对存储至语音库中。4.如权利要求2所述语音交互的自适应优化方法,其特征在于,在步骤(1)之前还包括:驾驶员在启动车辆前,进行驾驶员的身份识别,进而匹配出驾驶员对应的语音库。5.如权利要求1所述语音交互的自适应优化方法,其特征在于,在文本数据存在多个动词时,对文本数据进行拆分,拆分方法具体如下:检测两个动词之间的最长停顿时长,在最长停顿时长位置处进行分割,将一条文本数据/段分成两条文本段,提取每条文本段中动词及名词,动词与各名词的组成形成多条控制指令。6.如权利要求1所述语音交互的自适应优化方法,其特征在于,基于语音库的文本数据转换方法具体如下:在将语音数据转换成文本数据后,检测相应语音库中数据对中修正前文本是否存...

【专利技术属性】
技术研发人员:吴正飞叶德英阴山慧孙亚红吴倩倩
申请(专利权)人:奇瑞汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1