语音数据中继装置及中继方法、终端装置、语音识别系统制造方法及图纸

技术编号：8131491 阅读：251 留言：0更新日期：2012-12-27 04:03

本发明专利技术提供语音数据中继装置及中继方法、终端装置、语音识别系统，提供品质稳定的语音识别服务。语音数据中继装置（110）当在车载终端（102）和语音识别服务器（104）之间进行中继时，为检查语音识别服务器（104）的语音识别性能变化，在噪音抑制模块（118）中对评价用语音数据进行噪音抑制处理，之后将其发送给语音识别服务器（104），并接收识别结果。然后，语音数据中继装置（110）根据语音识别服务器（104）的识别结果，将在噪音抑制处理中使用的噪音抑制用参数或在从语音识别服务器（104）得到的多个识别结果的综合处理中使用的结果综合用参数的值设为最佳值。据此，即便在语音识别服务器（104）的语音识别性能发生变化的情况下，也能设定恰当的参数。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种检测语音识别功能的变化，对识别的语音信号进行加工处理以适合语音识别功能的变化的技术。
技术介绍
以往以来，在车载信息设备或移动电话机等的终端装置中，人们为了通过用户的讲话语音进行其操作，一直在开发装入了语音识别功能的设备。近年来，由于数据通信技术的发展，因而将输入到终端装置中的讲话语音经由网络发送给语音识别服务器来作为语音数据，利用语音识别服务器丰富的计算资源，进行更高精度的语音识别的方式正在普及。语音识别因用户不清晰的讲话或背景噪音等的影响，而总是伴随误识别的风险。在未发觉到误识别的状况下继续设备的操作因为将较大地破坏用户的便利性，所以例如下述专利文献I那样，公示出一种根据讲话语音中含有的噪声量及其噪声发生原因的信息，只将判断为能够语音识别的讲话语音当作语音识别对象的技术。专利文献I日本特开2005-91611号公报(例如参见段落0012)
技术实现思路
如上所述，近年来语音识别服务器作为广泛应用的服务来运营的例子正在增加，提供面向用户使用的终端装置的服务的主体和运营语音识别服务器的主体不同的情形在增多。因此，不知不觉间，没有发现语音识别服务器的语音识别功能已变更的情形发生。另夕卜，因为即便在服务的提供主体和运营主体相同的情况下，语音识别服务器的内部状态(例如处理负荷的大小)也时时刻刻发生变化，所以仍有时难以完全持续掌握语音识别性能的变化。在那种情况下，继续提供对用户的语音识别功能的服务时，例如假设语音识别服务器的语音识别性能因某种原因下降，则无法探测其语音识别性能的下降，在结果上存在给用户提供低品质的语音识别服务的可能性。另外，在为了...

【技术保护点】
一种语音数据中继装置，连接终端装置和语音识别服务器，该终端装置录制用户讲话中的声音，发送讲话语音来作为语音数据，并且接收所发送的该语音数据的识别结果，输出给上述用户，该语音识别服务器接收来自上述终端装置的语音数据，识别该语音数据，发送其识别结果，该语音数据中继装置的特征为，具备：存储部，存储对上述语音数据进行加工处理时使用的第1参数的值和为了评价上述语音识别服务器的语音识别性能而使用的评价用语音数据；数据处理部，针对上述评价用语音数据，使用上述第1参数的值进行加工处理来生成第1语音数据，针对从上述终端装置接收到的语音数据，使用上述第1参数的值进行加工处理来生成第2语音数据；服务器通信部，将上述第1语音数据发送给上述语音识别服务器，从上述语音识别服务器接收第1识别结果，将上述第2语音数据发送给上述语音识别服务器，从上述语音识别服务器接收第2识别结果；终端通信部，将对上述第2语音数据的上述第2识别结果发送给上述终端装置；以及参数变更部，根据接收到的对上述第1语音数据的识别结果，更新存储在上述存储部中的上述第1参数的值。

【技术特征摘要】
2011.06.22 JP 138318/20111.一种语音数据中继装置，连接终端装置和语音识别服务器，该终端装置录制用户讲话中的声音，发送讲话语音来作为语音数据，并且接收所发送的该语音数据的识别结果，输出给上述用户，该语音识别服务器接收来自上述终端装置的语音数据，识别该语音数据，发送其识别结果，该语音数据中继装置的特征为，具备存储部，存储对上述语音数据进行加工处理时使用的第I参数的值和为了评价上述语音识别服务器的语音识别性能而使用的评价用语音数据；数据处理部，针对上述评价用语音数据，使用上述第I参数的值进行加工处理来生成第I语音数据，针对从上述终端装置接收到的语音数据，使用上述第I参数的值进行加工处理来生成第2语音数据；服务器通信部，将上述第I语音数据发送给上述语音识别服务器，从上述语音识别服务器接收第I识别结果，将上述第2语音数据发送给上述语音识别服务器，从上述语音识别服务器接收第2识别结果；终端通信部，将对上述第2语音数据的上述第2识别结果发送给上述终端装置；以及参数变更部，根据接收到的对上述第I语音数据的识别结果，更新存储在上述存储部中的上述第I参数的值。2.如权利要求I所述的语音数据中继装置，其特征为，上述存储部还存储履历信息，该履历信息是将过去发送给上述语音识别服务器的上述第I语音数据及上述识别结果建立关联后的信息，上述参数变更部参照上述履历信息，与上述服务器通信部接收到的对上述第I语音数据的识别结果进行比较，在上述接收到的识别结果和上述过去的识别结果不同的情况下，更新上述参数的值。3.如权利要求2所述的语音数据中继装置，其特征为，具备处理部，执行附加处理、或者卷积处理和上述附加处理的双方，来生成上述评价用语音数据，该附加处理针对在没有噪音的状态下所录制的讲话内容为预先已知的语音数据，附加录制了噪音的噪音数据，该卷积处理按上述终端装置和上述用户的口部之间的传导特性进行过滤。4.如权利要求3所述的语音数据中继装置，其特征为，上述处理部在上述附加处理中，取得由上述终端装置所录制的上述讲话中的声音之内、没有语音的区间的声音，来作为上述噪音数据，调整上述噪音数据的增益，并生成信噪比不同的上述评价用语音数据。5.如权利要求4所述的语音数据中继装置，其特征为，上述处理部在上述附加处理中，取得由上述终端装置所录制的上述讲话中的声音之内、语音区间的声音，根据该声音的功率，来调整上述评价用语音数据的语音数据的增益。6.如权利要求I所述的语音数据中继装置，其特征为，与多个上述语音识别服务器连接，上述存储部还存储进行下述处理时使用的第2参数的值，该处理将从上述多个语音识别服务器接收到的多个识别结果综合为I个识别结果，上述语音数据中继装置具备识别结果综合部，该识别结果综合部将从上述多个语音识别服务器接收到的多个识别结果，使用上述第2参数的值来生成I个识别结果，上述终端通信部将上述识别结果综合部所生...

【专利技术属性】
技术研发人员：大渊康成，本间健，
申请(专利权)人：歌乐株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人