声音识别服务器综合装置以及声音识别服务器综合方法制造方法及图纸

技术编号:10790418 阅读:80 留言:0更新日期:2014-12-17 19:18
提供以最佳形式对通用声音识别服务器的声音识别结果和专用声音识别服务器的声音识别结果进行综合从而最终错误较少的声音识别功能。使用包含在用户辞典数拥中的语句来构建专用的声音识别服务器(108),并且使用这些数拥来事前评价通用的声音识别服务器(106)的性能。以该评价结果为基础,对从专用以及通用的声音识别服务器得到的识别结果,将采用哪个、对它们进行怎样的加权才能得到最佳的识别结果作为结果综合用参数(118),以数据库的形式保持。在识别执行时,通过将专用以及通用的声音识别服务器进行识别的识别结果与结果综合用参数(118)进行比较,由此来获得最佳的识别结果。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】提供以最佳形式对通用声音识别服务器的声音识别结果和专用声音识别服务器的声音识别结果进行综合从而最终错误较少的声音识别功能。使用包含在用户辞典数拥中的语句来构建专用的声音识别服务器(108),并且使用这些数拥来事前评价通用的声音识别服务器(106)的性能。以该评价结果为基础,对从专用以及通用的声音识别服务器得到的识别结果,将采用哪个、对它们进行怎样的加权才能得到最佳的识别结果作为结果综合用参数(118),以数据库的形式保持。在识别执行时,通过将专用以及通用的声音识别服务器进行识别的识别结果与结果综合用参数(118)进行比较,由此来获得最佳的识别结果。【专利说明】
本专利技术涉及将用于用户使用声音来进行操作的终端装置、和识别声音数据并返回 其结果的多个声音识别服务器相连,对由多个声音识别服务器得到的识别结果进行综合从 而将最佳的声音识别结果提供给用户用的装置以及方法。
技术介绍
用于通过用户的声音来进行车载信息设备或便携电话等的操作的声音识别功能 被搭载在众多的设备中。进而,近年来,通过数据通信技术的发展,将声音数据发送到服务 器并利用服务器的丰富的计算资源来进行更高精度的声音识别的方式不断普及。此外,如 专利文献1所示那样,为了更有效地使用这样的声音识别服务器,还提出在个人用终端与 声音识别服务器之间设置中继服务器并在其中进行附加的处理的方式。 在先技术文献 专利文献 专利文献1 :JP特开2008-242067号公报 专利文献2 :JP特开2002-116796号公报 专利文献3 :JP特开2010-224301号公报
技术实现思路
专利技术要解决的课题 将声音识别服务器作为通用的服务来运营的例子增加,提供面向用户所操纵的终 端的服务的主体、和运营声音识别服务器的主体不同的情况也变多。此外,在运营主体相同 的情况下,也有分开进行声音识别服务器的开发和声音识别应用的开发,它们相互未被最 优化的情况。在这样的状况下,有时通用的声音识别服务器总体表现出高的性能,但对特定 的语句却未必表现出充分的性能。 另一方面,在着眼于使用特定的应用的特定的用户的情况下,存在该用户的熟人 的姓名或喜欢的音乐的乐曲名等虽然不普遍但重要度却高的语句。为了识别这样的语句, 期望设置专用的声音识别服务器,但在专用声音识别服务器的开发中不能投入足够的成本 的情况较多,在针对一般的语句的性能中要逊于通用声音识别服务器。如此,通用声音识别 服务器和专用声音识别服务器因语句不同在识别上有擅长和不擅长,声音识别性能不同。 因此,虽然寻求根据用户发出的语句来区分使用它们的方法,但只要所谓声音识别是"针对 不知道内容的发声来估计内容的"任务,则在原理上就不能实现事前获知发声内容来区分 使用服务器。 本专利技术目的在于,提供以最佳形式对通用声音识别服务器的声音识别结果和专用 声音识别服务器的声音识别结果进行综合从而最终错误较少的声音识别功能。 用于解决课题的手段 在本专利技术中,预先获得包含在用户所持有的终端装置中的特定单词的列表,以这 些单词的数据为基础来构建专用的声音识别服务器。此外,使用这些数据来事前评价通用 声音识别服务器的性能。以该评价结果为基础,以数据库的形式保持在从专用以及通用的 声音识别服务器得到的识别结果之中采用哪个、对它们进行怎样的加权才能得到最佳的识 别结果。在用户实际使用声音识别功能时,在由专用以及通用的声音识别服务器识别输入 声音后,将由此得到的结果与先前所述的数据库的内容进行比较,由此得到最佳的声音识 别结果。此外,通过作为事前评价的基准,除了使用声音识别的正确度以外还使用响应速 度,能尽可能早地得到尽可能正确的声音识别结果。 若举出本专利技术的声音识别服务器综合装置的一例,则有对用于用户使用声音来进 行操作的终端装置、与识别声音数据并返回其结果的声音识别服务器之间进行中继的装 置,其具备:基于用户所登记的语句或用户经常使用的语句的列表来学习并保存识别结果 综合用参数的综合方式学习部;从所述终端装置接收用户为了声音识别而刻意发出的声音 的数据的单元;将所述接收到的声音数据发送给通用声音识别服务器以及专用声音识别服 务器的单元;接收所述通用声音识别服务器以及专用声音识别服务器对所述声音数据进行 识别的识别结果的单元;将所述通用声音识别服务器以及专用声音识别服务器进行识别的 识别结果与所述保存的识别结果综合用参数进行比较来选择最佳的识别结果的识别结果 综合部;和将所述选择的识别结果发送给所述终端装置的单元。 在本专利技术的声音识别服务器综合装置中,可以还具备:从所述终端装置接收用户 所登记的语句或用户经常使用的语句的列表的单元;以所述接收到的语句为基础来生成合 成声音的声音合成部;将所述生成的合成声音发送给所述通用声音识别服务器以及专用声 音识别服务器的单元;和接收所述通用声音识别服务器以及专用声音识别服务器对所述合 成声音进行识别的识别结果的单元,所述综合方式学习部将成为所述合成声音的基础的语 句和所述识别结果一起进行解析,学习并保存识别结果综合用参数。 此外,在本专利技术的声音识别服务器综合装置中,可以还具备:从所述终端装置接收 用户所登记的语句或用户经常使用的语句的列表的单元;从所述通用声音识别服务器接收 识别用语句列表的单元;和将所述识别用语句列表与从所述终端装置接收到的语句列表进 行比较来估计类似度的语句比较/类似度估计部,所述综合方式学习部将所述估计结果作 为识别结果综合用参数来保存。 若举出本专利技术的声音识别服务器综合方法的一例,则有由如下步骤构成的方法, 上述步骤为:基于用户所登记的语句或用户经常使用的语句的列表来学习并保存识别结果 综合用参数的步骤;将用户为了声音识别而刻意发出的声音的数据发送到通用声音识别服 务器以及专用声音识别服务器的步骤;接收所述通用声音识别服务器以及专用声音识别服 务器对所述声音数据进行识别的识别结果的步骤;将通用声音识别服务器的识别结果以及 专用声音识别服务器的识别结果与所述识别结果综合用参数进行比较来选择最佳的声音 识别结果的步骤。 专利技术效果 根据本专利技术,关于一般的语句,重视通用声音识别服务器的识别结果,关于用户固 有的语句,重视专用声音识别服务器的结果等,以最佳的形式对各个输入进行识别结果的 综合,从而最终能向用户提供错误较少的声音识别功能。此外,能实现不仅错误较少,连在 响应速度的方面上便利性也高的系统。 【专利附图】【附图说明】 图1是本专利技术的实施例1的声音识别服务器综合装置的构成图。 图2是表示使用了本专利技术的实施例1的声音合成的结果综合用参数估计的处理的 图。 图3是表示使用了本专利技术的单一通用声音识别服务器的结果综合用参数的一例 的图。 图4是表示使用了本专利技术的多个通用声音识别服务器的结果综合用参数的一例 的图。 图5是表示本专利技术的实施例1的多个服务器的识别结果的综合方法的一例的图。 图6是表示使用了本专利技术的多个通用声音识别服务器的识别结果可靠度的结果 综合用参数的一例的图。 图7是表示使用了本专利技术的多个通用声音识别服务器的识别结果可靠度和误识本文档来自技高网
...

【技术保护点】
一种声音识别服务器综合装置,是对用于用户使用声音来进行操作的终端装置、与识别声音数据并返回其结果的声音识别服务器之间进行中继的装置,其中,所述声音识别服务器综合装置具备:基于用户所登记的语句或用户经常使用的语句的列表来学习并保存识别结果综合用参数的综合方式学习部;从所述终端装置接收用户为了声音识别而刻意发出的声音的数据的单元;将所述接收到的声音数据发送给通用声音识别服务器以及专用声音识别服务器的单元;接收所述通用声音识别服务器以及专用声音识别服务器对所述声音数据进行识别的识别结果的单元;将所述通用声音识别服务器以及专用声音识别服务器进行识别的识别结果与所述保存的识别结果综合用参数进行比较来选择最佳的识别结果的识别结果综合部;和将所述选择的识别结果发送给所述终端装置的单元。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:大渊康成本间健
申请(专利权)人:歌乐株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1