语音识别装置、语音识别系统制造方法及图纸

技术编号:21459598 阅读:39 留言:0更新日期:2019-06-26 06:45
语音识别装置具备:语音检测部,检测从用户输入的语音;信息提供部,使用基于第一语音识别部对所述语音的识别结果的第一语音识别信息、或基于与所述第一语音识别部不同的第二语音识别部对所述语音的识别结果的第二语音识别信息中的某一方的语音识别信息,进行向所述用户的信息提供;以及选择部,基于从所述语音被输入起的经过时间,选择所述第一语音识别信息或所述第二语音识别信息中的某一方作为所述信息提供部所使用的语音识别信息,并且使由所述信息提供部进行的所述信息提供的方法变化。

【技术实现步骤摘要】
【国外来华专利技术】语音识别装置、语音识别系统
本专利技术涉及语音识别装置以及语音识别系统。
技术介绍
近年,在智能手机、汽车导航中,实现了使用语音识别引擎的语音输入功能。在专利文献1中公开了一种语音识别系统,其经由网络将车载装置与服务器连接,并使用分别搭载于车载装置与服务器的语音识别处理部,在车载装置与服务器中分散地进行语音识别处理。现有技术文献专利文献专利文献1:日本特开2013-88477号公报
技术实现思路
专利技术要解决的课题专利文献1所公开的语音识别系统例如在像菜单画面那样从预先确定的选择项中用语音选择该项目的输入模式中,选择车载装置的语音识别处理部,在用语音输入任意的文本的输入模式中,选择服务器的语音识别处理部。由此分配了由哪个语音识别处理部来执行语音识别处理。然而,在这种语音识别处理的分配方法中,有时即使是输入了用车载装置的语音识别处理部就足够能识别的语音的情况,也会选择服务器的语音识别处理部,在响应上花费时间。因而,不一定能够实现对用户而言舒适的语音输入功能。用于解决课题的手段本专利技术的语音识别装置具备:语音检测部,检测从用户输入的语音;信息提供部,使用第一语音识别信息或第二语音识别信息中的某一方的语音识别信息来进行向所述用户的提供信息,该第一语音识别信息基于第一语音识别部对所述语音的识别结果,该第二语音识别信息基于与所述第一语音识别部不同的第二语音识别部对所述语音的识别结果;以及选择部,基于从所述语音被输入起的经过时间,选择所述第一语音识别信息或所述第二语音识别信息中的某一方作为所述信息提供部所使用语音识别信息,并且使由所述信息提供部进行的所述信息提供的方法变化。本专利技术的语音识别系统具备终端装置与服务器,其中,所述终端装置具备:语音检测部,检测从用户输入的语音;第一语音识别部,执行用于识别所述语音的语音识别处理,并输出基于所述语音的识别结果的第一语音识别信息;第一通信控制部,将基于所述语音的语音信息发送至所述服务器,并接收从所述服务器发送的第二语音识别信息;信息提供部,使用所述第一语音识别信息或所述第二语音识别信息中的某一方,进行向所述用户的提供信息;以及选择部,基于从所述语音被输入起的经过时间,选择所述第一语音识别信息或所述第二语音识别信息中的某一方,并且使由所述信息提供部进行的所述信息提供的方法变化,所述服务器具备:第二通信控制部,接收从所述终端装置发送的所述语音信息,并将所述第二语音识别信息发送至所述终端装置;以及第二语音识别部,基于所述语音信息执行用于识别所述语音的语音识别处理,并输出基于所述语音的识别结果的所述第二语音识别信息。专利技术效果根据本专利技术,能够实现对用户而言舒适的语音输入功能。附图说明图1是表示本专利技术的一实施方式的语音识别系统的构成的图。图2是表示在采用动作、确认动作、舍弃动作的各个中所显示的画面的例子的图。图3是在选择部中执行的处理的流程图。图4是表示结果为第一个新到达的判断例程的流程图。图5是表示结果为第二个新到达的判断例程的流程图。图6是表示结果为未到达时的判断例程的流程图。图7是表示结果为一个到达完毕的判断例程的流程图。图8是表示用于计算用户满意度的函数的例子的图。图9是表示用于计算用户满意度的函数的另一个例子的图。具体实施方式以下,基于附图对本专利技术的实施方式进行说明。另外,在以下说明的实施方式中,以汽车导航系统为代表的车载终端为例,对本专利技术的语音识别装置进行说明。但是,本专利技术也能够应用于具有语音输入功能的其他装置、例如移动电话、智能手机、机器人等。图1是表示本专利技术的一实施方式的语音识别系统1的构成的图。图1所示的语音识别系统1通过经由通信网络300连接终端装置100与服务器200来构成。终端装置100例如被搭载于车辆,具备语音区间检测部1010、语音编码部1020、通信控制部1030、语音识别部1040、词典数据库1050、意图推断部1060、选择部1070、用户满意度存储部1080、HMI控制部1100、语音输出装置1110、录音语音合成部1120以及规则语音合成部1130。另外,终端装置100例如具备未图示的CPU、存储器、记录介质等,通过在CPU中执行存储于存储器、记录介质的规定的程序,能够实现语音区间检测部1010、语音编码部1020、通信控制部1030、语音识别部1040、意图推断部1060、选择部1070、HMI控制部1100、语音输出装置1110、录音语音合成部1120以及规则语音合成部1130的各功能。另外,能够使用记录介质内的规定的存储区域来实现词典数据库1050以及用户满意度存储部1080的各功能。语音区间检测部1010检测通过麦克风10从用户输入的语音。语音区间检测部1010例如从自麦克风10输入的语音信号提取用户实际说出的部分,对该部分的信号波形进行采样并语音数据化,从而检测用户的语音。语音编码部1020将由语音区间检测部1010检测到的用户的语音转换为用于向服务器200发送的数据形式。语音编码部1020例如通过对从语音区间检测部1010输出的语音数据进行规定的压缩处理来减少数据量,并生成适合向服务器200的发送的语音信息。通信控制部1030将基于由语音区间检测部1010检测到的用户的语音的语音信息、即由语音编码部1020生成的语音信息发送至服务器200。另外,若通过在接收到语音信息的服务器200中像后述那样执行语音识别处理来从服务器200发送语音识别信息,则接收该语音识别信息并输出到选择部1070。通信控制部1030能够与使用移动电话网、因特网等公共通信线路构成的通信网络300连接,经由通信网络300与服务器200之间进行通信。语音识别部1040是终端装置100所具备的语音识别引擎,执行用于识别由语音区间检测部1010检测到的用户的语音的语音识别处理。在语音识别部1040执行的语音识别处理中,使用词典数据库1050。在词典数据库1050中,预先登记有多个词典数据。语音识别部1040通过使用该多个词典数据的某一个来确定与用户的语音对应的文本。具体而言,例如语音识别部1040根据使用终端装置100向用户提供的目录(content)的内容(例如,导航信息、音乐播放等)、搭载有终端装置100的车辆的状态等,从登记在词典数据库1050的多个词典数据中选择与用户说出的可能性高的语音的种类对应的词典数据。然后,使用选择的词典数据检索与从语音区间检测部1010输入的语音数据对应的文本,从而确定与用户的语音对应的文本。语音识别部1040的语音识别结果、即与由语音识别部1040确定的用户的语音对应的文本被输出至意图推断部1060以及选择部1070。意图推断部1060基于由语音识别部1040获得的语音识别结果来推断针对从麦克风10输入的语音的用户的意图。例如作为语音识别结果获得的文本是提示设施的检索的文本的话,则意图推断部1060推断为用户的意图是“设施检索”。同样地,能够推断例如“电话呼叫”、“音频播放”等用户的意图。表示意图推断部1060对用户的意图的推断结果的意图推断信息与语音识别部1040的语音识别结果(文本)一起作为终端装置100中的基于语音识别结果的语音识别信息被输入至选择部1070。以下,将该终端装置100中的基于语音识别结果的语音识别信息称为“终端语音识本文档来自技高网...

【技术保护点】
1.一种语音识别装置,具备:语音检测部,检测从用户输入的语音;信息提供部,使用第一语音识别信息或第二语音识别信息中的某一方的语音识别信息来进行向所述用户的信息提供,该第一语音识别信息基于第一语音识别部对所述语音的识别结果,该第二语音识别信息基于与所述第一语音识别部不同的第二语音识别部对所述语音的识别结果;以及选择部,基于从所述语音被输入起的经过时间,选择所述第一语音识别信息或所述第二语音识别信息中的某一方作为所述信息提供部所使用的语音识别信息,并且使由所述信息提供部进行的所述信息提供的方法变化。

【技术特征摘要】
【国外来华专利技术】2016.11.15 JP 2016-2227231.一种语音识别装置,具备:语音检测部,检测从用户输入的语音;信息提供部,使用第一语音识别信息或第二语音识别信息中的某一方的语音识别信息来进行向所述用户的信息提供,该第一语音识别信息基于第一语音识别部对所述语音的识别结果,该第二语音识别信息基于与所述第一语音识别部不同的第二语音识别部对所述语音的识别结果;以及选择部,基于从所述语音被输入起的经过时间,选择所述第一语音识别信息或所述第二语音识别信息中的某一方作为所述信息提供部所使用的语音识别信息,并且使由所述信息提供部进行的所述信息提供的方法变化。2.如权利要求1所述的语音识别装置,其中,所述选择部基于从所述语音被输入起的经过时间,计算第一用户满意度与第二用户满意度,该第一用户满意度表示所述用户对使用了所述第一语音识别信息的情况下的所述信息提供的满意程度的预测值,该第二用户满意度表示所述用户对使用了所述第二语音识别信息的情况下的所述信息提供的满意程度的预测值,比较所述第一用户满意度与所述第二用户满意度,基于该比较结果选择所述第一语音识别信息或所述第二语音识别信息中的某一方。3.如权利要求2所述的语音识别装置,其中,在先取得所述第一语音识别信息、尚未取得所述第二语音识别信息的情况下,所述选择部,测量与从所述语音被输入起到获得所述第一语音识别信息为止的经过时间相关的第一经过时间,并且预测与从所述语音被输入起到获得所述第二语音识别信息为止的经过时间相关的第二经过时间,基于测量出的所述第一经过时间,计算所述第一用户满意度,基于预测出的所述第二经过时间,计算所述第二用户满意度,比较计算出的所述第一用户满意度与所述第二用户满意度,基于该比较结果决定是否选择所述第一语音识别信息。4.如权利要求2所述的语音识别装置,其中在取得完毕所述第一语音识别信息、未取得所述第二语音识别信息的情况下,所述选择部,测量与从所述语音被输入起到当前为止的经过时间相关的第三经过时间,基于测量出的所述第三经过时间,计算所述第一用户满意度以及所述第二用户满意度,比较计算出的所述第一用户满意度与所述第二用户满意度,基于该比较结果决定是否选择所述第一语音识别信息。5.如权利要求2所述的语音识别装置,其中,在先取得所述第一语音识别信息、后取得所述第二语音识别信息的情况下,所述选择部,测量与从所述语音被输入起到获得所述第二语音识别信息为止的经过时间相关的第二经过时间,基于测量出的所述第二经过时间,计算所述第一用户满意度以及所述第二用户满意度,比较所述第一用户满意度与所述第二用户满意度,基于该比较结果,选择所述第一语音识别信息或所述第二语音识别信息中的某一方。6.如权利要求2所述的语音识别装置,其中,所述选择部进一步基于根据所述语音的属性预先确定的多个域中的与所述第一语音识别信息及所述第二语音识别信息分别对应的第一域及第二域、以及分别对应于所述第一语音识别信息及所述第二语音识别信息而求出的第一推...

【专利技术属性】
技术研发人员:本间健张睿松本卓也小窪浩明
申请(专利权)人:歌乐株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1