语音识别系统以及语音识别装置制造方法及图纸

技术编号:12292697 阅读:55 留言:0更新日期:2015-11-08 00:27
具有:识别结果候选比较部(205),其对接收部(204)接收到的多个服务器侧语音识别结果候选进行比较,检测有差异的文本;识别结果综合部(206),其根据客户端侧语音识别结果候选、服务器侧语音识别结果候选以及识别结果候选比较部(205)的检测结果,综合客户端侧语音识别结果候选和服务器侧语音识别结果候选,确定语音识别结果。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及在服务器侧和客户端侧进行语音识别的语音识别系统、以及用于提高该语音识别系统中的客户端侧的语音识别装置的语音识别精度的技术。
技术介绍
以往,有一种语音识别系统,该语音识别系统为了提高语音数据的语音识别性能,在服务器侧和客户端侧进行语音识别。例如,在专利文献I的语音识别装置中,提出了如下这样的方法:首先在客户端侧进行语音识别,当判定为表示客户端侧的语音识别结果的精度的识别分数(score)较差的情况下,在服务器侧进行语音识别,且采用服务器侧的语音识别结果。另外,还提出了如下这样的方法:同时并行地进行客户端侧的语音识别和服务器侧的语音识别,对客户端侧的语音识别结果的识别分数与服务器侧的语音识别结果的识别分数进行比较后,采用识别分数较好的语音识别结果。另外,在专利文献2的语音识别系统中,提出了如下这样的方法:服务器侧除了语音识别结果以外还发送词类信息(一般名词、助词等),客户端侧使用接收到的词类信息,例如进行将一般名词置换成固有名词等的识别结果修正。现有技术文献专利文献专利文献1:日本特开2009-237439号公报专利文献2:日本特开2010-85536号公报
技术实现思路
专利技术所要解决的课题然而,在上述的专利文献I所公开的技术中,存在如下这样的课题:首先在客户端侧进行语音识别之后在服务器侧进行语音识别,因此,取得客户端侧的语音识别结果为止的延迟时间与取得服务器侧的语音识别结果为止的延迟时间相加而得到的时间成为响应时间,导致从输入语音到取得结果为止的延迟时间增大。另外,存在如下这样的课题:对客户端侧与服务器侧的识别分数进行比较来采用更好的识别分数,因此,当服务器侧未发送识别分数的情况下、或者在服务器侧所发送的识别分数的计算方法不清楚的情况下(例如在本公司仅仅开发客户端侧的语音识别而使用其他公司的语音识别服务器的情况下),无法准确地比较客户端侧的识别分数,无法选择高精度的语音识别结果。另外,在专利文献2所公开的技术中,存在如下这样的课题:客户端侧使用服务器侧所发送的语音识别结果和词类信息,来进行语音识别结果的修正,因此,当服务器侧未发送词类信息的情况下,无法高精度地选择语音识别结果。本专利技术正是为了解决如上所述的课题而完成的,其目的在于,抑制从输入语音到取得语音识别结果为止的延迟时间,而且,即使在无法使用服务器侧所发送的识别分数和词类信息等语音识别结果以外的信息的情况下,也高精度地选择语音识别结果。用于解决课题的手段本专利技术的语音识别系统具有服务器装置和语音识别装置,该服务器装置具有:月艮务器侧接收部,其接收从语音识别装置输入的语音数据;服务器侧语音识别部,其进行服务器侧接收部接收到的语音数据的语音识别,生成服务器侧语音识别结果候选;以及服务器侧发送部,其向语音识别装置发送服务器侧语音识别部所生成的服务器侧语音识别结果候选,该语音识别装置具有:语音输入部,其将所输入的发声语音转换成语音数据;客户端侧语音识别部,其进行语音输入部所转换的语音数据的语音识别,生成客户端侧语音识别结果候选;客户端侧发送部,其向服务器装置发送语音输入部所转换的语音数据;客户端侧接收部,其接收服务器侧发送部所发送的服务器侧语音识别结果候选;识别结果候选比较部,其对客户端侧接收部接收到的多个服务器侧语音识别结果候选进行比较,检测有差异的文本;识别结果综合部,其根据客户端侧语音识别结果候选、服务器侧语音识别结果候选以及识别结果候选比较部的检测结果,综合客户端侧语音识别结果候选和服务器侧语音识别结果候选,确定语音识别结果;以及输出部,其输出识别结果综合部所确定的语音识别结果O专利技术效果根据本专利技术,能够抑制从输入语音到取得语音识别结果为止的延迟时间,高精度地选择语音识别结果。【附图说明】图1是示出实施方式I的语音识别系统的结构的框图。图2是示出实施方式I的语音识别系统的动作的流程图。图3是示出实施方式I的语音识别系统的语音识别结果的生成例的图。图4是示出实施方式2的语音识别系统的结构的框图。图5是示出实施方式2的语音识别系统的动作的流程图。图6是示出实施方式2的语音识别系统的语音识别结果的生成例的图。图7是示出实施方式2的语音识别系统的发声规则的模式存储例的图。图8是示出实施方式3的语音识别系统的结构的框图。图9是示出实施方式3的语音识别系统的第I及第3动作的流程图。图10是示出实施方式3的语音识别系统的输入语音/识别结果存储部的保存例的图。图11是示出实施方式3的语音识别系统的第2动作的流程图。图12是示出实施方式3的语音识别系统的修正用数据库的图。图13是示出实施方式4的语音识别系统的动作的流程图。图14是示出实施方式4的语音识别系统的语音识别结果的生成例的图。图15是示出实施方式4的语音识别系统的发声规则的模式存储例的图。图16是示出实施方式5的语音识别系统的语音识别结果的生成例的图。图17是示出实施方式6的语音识别系统的语音识别结果的生成例的图。图18是示出实施方式6的语音识别系统的发声规则的模式存储例的图。图19是示出实施方式7的语音识别系统的输入语音/识别结果存储部的保存例的图。图20是示出实施方式7的语音识别系统的语音识别装置的修正用数据库的一例的图。图21是示出实施方式8的语音识别系统的语音识别结果的生成例的图。图22是示出实施方式8的语音识别系统的发声规则的模式存储例的图。【具体实施方式】以下,为了更详细地说明本专利技术,按照附图,对用于实施本专利技术的方式进行说明。实施方式1.图1是示出本专利技术的实施方式I的语音识别系统的结构的框图。语音识别系统由语音识别服务器(服务器装置)100和语音识别装置200构成。语音识别服务器100具有接收部(服务器侧接收部)101、服务器侧语音识别部102和发送部(服务器侧发送部)103,并且具有对从语音识别装置200接收到的语音数据进行语音识别而向语音识别装置200发送语音识别结果的功能。接收部101从语音识别装置200接收语音数据。服务器侧语音识别部102对接收部101接收到的语音数据进行语音识别,生成服务器侧语音识别结果候选。发送部103向语音识别装置200发送服务器侧语音识别部102所生成的服务器侧语音识别结果候选。语音识别装置200具有语音输入部201、客户端侧语音识别部202、发送部(客户端侧发送部)203、接收部(客户端侧接收部)204、识别结果候选比较部205、识别结果综合部206和输出部207,并且具有对通过话筒等输入的语音数据进行语音识别而输出语音识别结果的功能。语音输入部201将通过话筒等输入的使用者的发声语音转换成作为数据信号的语音数据。客户端侧语音识别部202对语音输入部201所转换的语音数据进行语音识另IJ,生成客户端侧语音识别结果候选。发送部203向语音识别服务器100发送从语音输入部201输入的语音数据。接收部204接收从语音识别服务器100发送的服务器侧语音识别结果候选。识别结果候选比较部205经由接收部204对从语音识别服务器100发送的多个服务器侧语音识别结果候选所包含的文本信息进行比较,检测有差异的部分文本。识别结果综合部206根据客户端侧语音识别部202所生成的客户端侧语音识别结果候选、接收部204接收到的服务器侧语音识别结果候选和识本文档来自技高网...

【技术保护点】
一种语音识别系统,其特征在于,该语音识别系统具有服务器装置以及与所述服务器装置连接的客户端侧的语音识别装置,所述服务器装置具有:服务器侧接收部,其接收从所述语音识别装置输入的语音数据;服务器侧语音识别部,其进行所述服务器侧接收部接收到的语音数据的语音识别,生成服务器侧语音识别结果候选;以及服务器侧发送部,其向所述语音识别装置发送所述服务器侧语音识别部所生成的所述服务器侧语音识别结果候选,所述语音识别装置具有:语音输入部,其将所输入的发声语音转换成所述语音数据;客户端侧语音识别部,其进行所述语音输入部所转换的所述语音数据的语音识别,生成客户端侧语音识别结果候选;客户端侧发送部,其向所述服务器装置发送所述语音输入部所转换的所述语音数据;客户端侧接收部,其接收所述服务器侧发送部所发送的所述服务器侧语音识别结果候选;识别结果候选比较部,其对所述客户端侧接收部接收到的多个所述服务器侧语音识别结果候选进行比较,检测有差异的文本;识别结果综合部,其根据所述客户端侧语音识别结果候选、所述服务器侧语音识别结果候选以及所述识别结果候选比较部的检测结果,综合所述客户端侧语音识别结果候选和所述服务器侧语音识别结果候选,确定语音识别结果;以及输出部,其输出所述识别结果综合部所确定的语音识别结果。...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:小川勇花泽利行成田知宏
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1