车内语音对话系统技术方案

技术编号:8883691 阅读:161 留言:0更新日期:2013-07-04 02:26
一种车内语音对话系统,包括:语音输入单元,用于接收语音;语音转换单元,用于基于所述语音输入单元接收的语音形成录音文件,并从中提取语音音素进行识别,并基于识别出的语音音素形成语音特征信息;存储单元,存储各车载应用场景所对应的场景指令文本及其下的应用操作所对应的操作指令文本;指令识别单元,从存储单元中分别搜索与语音转换单元转换的语音特征信息匹配的场景指令文本及操作指令文本,并分别形成对应的场景启动指令及应用操作指令;应用处理单元,在获得对应的场景启动指令后启动,并在获得对应的应用操作指令后,执行应用操作。所述车内语音对话系统简化了用户操作,提高了行车安全性。

【技术实现步骤摘要】

本专利技术涉及信息处理
,尤其涉及一种车内语音对话系统
技术介绍
随着经济的发展及社会的进步,汽车已逐渐成为大众化的消费品。汽车的消费群体在不断扩张,消费者对汽车的要求也越来越高。近年来,除经济性、动力性外,在行车过程中的驾驶体验也成为了消费者关注的焦点。车载设备的技术发展也随之越来越深而被入。目前,汽车上大都搭载有具有例如音乐播放、广播收听、电子书阅读等功能的车载设备。这些车载设备在行车过程中为用户提供了多种娱乐及应用功能的体验。而随着液晶触摸技术的发展,车载设备的控制面板也从传统的按键面板转换为液晶触摸显示屏,这些都进一步提高了用户使用的便利性,并且提供了更为直观的用户操作界面。此外,随着移动通信技术的发展,车载设备的技术也越来越像功能集成化发展。目前,有些车载设备已能通过最新的3G网络实现语音通话、网络浏览等功能,使得车载设备真正成为了一种能提供全方位功能体验的移动应用系统。然而,即使由于液晶触摸技术的引入,用户在行车过程中的操作方式仍未发生改变,任何的功能应用仍需用户通过手动输入操作指令来实现。对于一些复杂的功能应用,这无疑增加了操作的复杂度。此外,行车过程中的安全性历来是需要考虑的重要因素,频繁的手动操作也必然会分散驾驶者的注意力,由此为行车过程增加了很多安全隐患。
技术实现思路
本专利技术解决的问题是提供一种车内语音对话系统,简化车载功能应用的操作复杂度,并且增强行车的安全性。为了解决上述问题,本专利技术提供了一种车内语音对话系统,包括:语音输入单元,用于接收语音;语音转换单元,用于基于所述语音输入单元接收的语音形成录音文件,并从所述录音文件中提取语音音素进行识别,并基于识别出的语音音素形成语音特征信息;存储单元,用于存储各种车载应用场景所对应的场景指令文本,以及各种场景下的应用操作所对应的操作指令文本;指令识别单元,从存储单元中搜索与语音转换单元转换的语音特征信息匹配的场景指令文本,在搜索到匹配的场景指令文本时,形成对应的场景启动指令;以及从存储单元中搜索与语音转换单元转换的语音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本时,形成对应的应用操作指令;应用处理单元,在获得对应的场景启动指令后启动,并在获得对应的应用操作指令后,执行应用操作。与现有技术相比,上述方案具有以下优点:所述车内语音对话系统在实现车载功能应用时,仅需用户通过语音方式输入指令,无需任何手动操作,从而大大降低了用户在实现车载功能应用时的操作复杂度。此外,由于无需手动操作,对于驾驶者而言,其在驾驶过程中就无需分散注意力进行车载功能应用操作,即,驾驶者可以在双手不离开方向盘、视线不离开路面的情况下控制车载设备,从而提高驾驶者驾驶集中度,提高驾车安全性以及驾车体验。附图说明图1是本专利技术车内语音对话系统的一种实施方式的结构示意图;图2是本专利技术车内语音对话系统的一种实施例的结构不意图;图3是图2所示车内语音对话系统中语音识别单元的一种实现方式结构示意图;图4是本专利技术车内语音对话系统的另一种实施例的结构示意图。具体实施例方式正如
技术介绍
部分所述,现有车载设备中,任何的功能应用仍需用户通过手动输入操作指令来实现。从而,对于一些复杂的功能应用,这无疑增加了操作的复杂度。并且,为行车过程增加了很多安全隐患。有鉴于此,本专利技术提供的车内语音对话系统通过对用户发出的语音指令进行转换,获得所述语音指令中包含的指令信息,根据所述指令信息启动并执行应用,以实现通过语音指令进行车载功能应用操作。下面结合附图进一步阐述本专利技术的车内语音对话系统。参照图1所示,本专利技术车内语音对话系统的一种实施方式包括:语音输入单元10,用于接收语音;语音转换单元20,用于基于所述语音输入单元10接收的语音形成录音文件,并从所述录音文件中提取语音音素进行识别,并基于识别出的语音音素形成语音特征信息;存储单元30,用于存储各种车载应用场景所对应的场景指令文本,以及各种场景下的应用操作所对应的操作指令文本;指令识别单元40,从存储单元30中搜索与语音转换单元20转换的语音特征信息匹配的场景指令文本,在搜索到匹配的场景指令文本时,形成对应的场景启动指令;以及从存储单元30中搜索与语音转换单元20转换的语音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本时,形成对应的应用操作指令;应用处理单元50,在获得对应的场景启动指令后启动,并在获得对应的应用操作指令后,执行应用操作。上述实施方式中,通过语音转换单元20将用户通过语音输入单元10输入的语音转换为语音特征信息,再通过指令识别单元40对所述语音特征信息进行识别。当用户输入的语音中包含指令信息时,所述指令识别单元40就能从所述语音特征信息中获得与存储单元30存储的场景指令文本或操作指令文本匹配的信息,进而就能够形成相应的指令。从而,所述应用处理单元50就能够依据所述指令启动或执行应用操作。因此,通过上述车内语音对话系统就能够实现用户通过语音进行车载应用操作的功能,从而大大降低了用户在实现车载功能应用时的操作复杂度。并且,提高了驾车安全性以及驾车体验。参照图2所示,根据本专利技术车内语音对话系统的一种实施例,所述语音输入单元10可以为麦克风。所述语音转换单元20可以包括:语音识别库201,用于存储语音音素;录音单元203,用于接收所述语音输入单元10接收的语音,并形成录音文件;语音识别单元202,从所述录音文件中提取语音音素与所述语音识别库中的语音音素进行比对,在从所述语音识别库中获得匹配的语音音素时,基于所述匹配的语音音素对应的词条形成语音特征信息。所述指令识别单元40可以包括:场景识别单元401,从存储单元30中搜索与语音转换单元20转换的语音特征信息匹配的场景指令文本,在搜索到匹配的场景指令文本时,形成对应的场景启动指令;应用操作识别单元402,从存储单元30中搜索与语音转换单元20转换的语音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本时,形成对应的应用操作指令。结合图2和图3所示,所述语音识别单元203的一种实现方式可以包括:音素提取单元203a、音素比对单元203b及语音特征信息形成单元203c ;所述音素提取单元203a,用于从所述录音文件中提取语音音素;所述音素比对单元203b将所提取的语音音素与所述语音识别库201中的语音音素进行比对,获得相应的比对结果;所述语音特征信息形成单元203c,在比对结果的置信度大于预设置信度时,确定提取出的语音音素与所述语音识别库201中的相应语音音素匹配,并基于所述相应语音音素对应的词条形成语音特征信息。所述车载应用场景可以包括:电话场景、本地音乐播放场景、广播场景、情景对话场景、预订服务场景。以电话应用场景为例,驾驶者可以通过麦克风输入语音指令“打电话给张三”。所述录音单元202会将所述语音指令录音,并形成录音文件后发送至所述音素提取单元203a。所述音素提取单元203a在获得所述录音文件后,会提取所述录音文件中的语音音素。例如,所述音素提取单元203a会将所述录音文件中的语音波形提取出来。通常,为了增加语音识别的准确性,还会对所述录音文件先进行去噪处理,以滤除人声音频率外的其他频段的声音波形。所述语音识别库201可以预先存入一些常用的词条对应的语音波形。例本文档来自技高网
...

【技术保护点】
一种车内语音对话系统,其特征在于,包括:语音输入单元,用于接收语音;语音转换单元,用于基于所述语音输入单元接收的语音形成录音文件,并从所述录音文件中提取语音音素进行识别,并基于识别出的语音音素形成语音特征信息;存储单元,用于存储各种车载应用场景所对应的场景指令文本,以及各种场景下的应用操作所对应的操作指令文本;指令识别单元,从存储单元中搜索与语音转换单元转换的语音特征信息匹配的场景指令文本,在搜索到匹配的场景指令文本时,形成对应的场景启动指令;以及从存储单元中搜索与语音转换单元转换的语音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本时,形成对应的应用操作指令;应用处理单元,在获得对应的场景启动指令后启动,并在获得对应的应用操作指令后,执行应用操作。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘根华廖建国张晓海
申请(专利权)人:上海博泰悦臻电子设备制造有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1