语音识别方法、设备及系统技术方案

技术编号:13672319 阅读:68 留言:0更新日期:2016-09-07 20:32
本发明专利技术提供了一种语音识别方法、设备和系统。该方法包括:获取用户的语音输入;选择语音数据库来识别用户输入的语音,并输出作为结果的识别输出;使用领域判定来从所述识别输出中选择一个或多个候选最优识别输出;以及以用户的个性标识信息作为判定条件来判定所述一个或多个候选最优识别输出中的最优识别输出。上述方案在不增加响应时间的条件下,提高了语音识别的准确率。

【技术实现步骤摘要】

本专利技术涉及语音识别领域,具体涉及一种语音识别方法、设备及系统
技术介绍
随着智能设备的应用普及,语音识别系统成为信息应用的新的手段,同时,通过语音识别系统,可以实现设备的智能控制。在语音识别系统的使用中,用户体验成为众多系统所聚焦的重点。对于语音识别系统的应用,响应时间和判定的准确率成为用户体验提升的核心内容。而目前的判定形式中,大多采用特定的数据模型进行语音数据的判定。这种判定形式采用通用的系统进行所有的语音环境的判定。而这种判定形式必然会加大语音识别的工作负载,延长响应判定时间,从而降低用户的体验。在本领域中,常见的自动语音识别系统(ASR)通过识别引擎系统来进行语音输入的识别。语音识别系统的引擎模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。语言模型主要分为规则模型和统计模型两种,其用概率统计的方法来揭示语言单位内在的统计规律。上述引擎单元通过知识领域判定,完成语音输入的识别输出。有多种方式可通过对通用系统增加特定的用户信息标示,从而进行特定范围的语音判定,从而提高响应时间,提高判定准确率。本领域中常见的形式是:设定针对不同方言,口音形式设定的数据库分类,从而可以在初始的判定阶段,将语音输入进行系统分类,实现较快速的响应时间。在上述数据库的额选定形式中可以增加特定的信息标识。该信息标识可以来自用户端。标识信息可以通过对用户的语音输入信息进行加
工而获取到。同样的标识信息可以通过其他方式进行获取,例如通过用户的位置信息,移动设备的信号源等。将上述信息作为用户的标识信息输入到ASR系统中,从而辅助用户的数据的选定判别,提高响应时间,降低误判率。但是上述形式虽然增加了用户的标识信息,但是上述信息仅仅是通过针对语言类型,位置信息的输入,来帮助系统进行语言数据库的选定。这种形式在降低响应时间的同时,在最终的识别结果输出中,并不能够通过上述标识信息的运用的得到相应用户的目的性输出,即,识别效率不高。因此需要一种识别方法,其能够在获得响应时间提升的情况下提高用户的识别效率。
技术实现思路
为了解决上述问题,本专利技术实施例提供了一种语音识别方法、设备及系统,以在不增加响应时间的条件下,提高了语音识别的准确率。根据本专利技术的一个方案,提供了一种语音识别方法,包括:获取用户的语音输入;选择语音数据库来识别用户输入的语音,并输出作为结果的识别输出;使用领域判定来从所述识别输出中选择一个或多个候选最优识别输出;以及以用户的个性标识信息作为判定条件来判定所述一个或多个候选最优识别输出中的最优识别输出。根据本专利技术的另一方案,提供了一种语音识别设备,包括:语音获取单元,用于获取用户的语音输入;语音识别单元,用于选择语音数据库来识别用户输入的语音,并输出作为结果的识别输出;第一判定单元,用于使用领域判定来从所述识别输出中选择一个或多个候选最优识别输出;以及第二判定单元,用于以用户的个性标识信息作为判定条件来判定所述一个或多个候选最优识别输出中的最优识别输出。根据本专利技术的第三方案,提供了一种语音识别系统,包括:上述的语音识别设备;以及与所述语音识别设备通信连接的客户端设备。上述方案通过使用用户的特定信息标识进行语音识别的二级结果判定,并将该判定结果作为最终结果进行输出,实现了语音识别判定输
出的多级输出,同时新增加的判定输出的判定范围采用领域判定的输出结果作为输入。因此,可以仅保留少量结果来用于最终的判定,因此,上述方案并不会增加系统的负荷,可以在不降低响应时间的前提下更加精准地判定语音识别的输出结果。附图说明通过下面结合附图对专利技术进行的详细描述,将使本专利技术的上述特征和优点更加明显,其中:图1是根据本专利技术的实施例的语音识别方法的示意性流程图;图2提供了根据本专利技术的实施例利用用户的籍贯信息进行语音识别的方法的流程图;图3示出了根据本专利技术实施例的另一语音识别方法的流程图;图4是示出根据本专利技术的实施例的用于实现语音识别方法的语音识别设备的示意性框图;以及图5示出了根据本专利技术实施例的语音识别系统的示意性框图。具体实施方式下面,参考附图详细说明本专利技术的优选实施方式。在附图中,虽然示于不同的附图中,但相同的附图标记用于表示相同的或相似的组件。为了清楚和简明,包含在这里的已知的功能和结构的详细描述将被省略,以避免使本专利技术的主题不清楚。图1示出了根据本专利技术的实施例的语音识别方法的示意性流程图。如图1所示,在步骤S01中,获取用户的语音输入。在一些示例中,可通过用户正在使用的客户端设备(例如,该客户端设备的语音接收单元,如麦克风等)获取用户的语音输入。然后与该客户端设备通信连接的语音识别设备可以从客户端设备获取语音输入。在此,用户所使用的客户端设备可以用户的移动电话、固定终端、PDA(个人数字助理)、笔记本电脑、上网本、平板电脑等,然而本专利技术不限于此,而是可使用本领域技术人员可想到的任何移动或非移动的设备来作为客户端设备。本申请中所述的语音识别设备在一些实现中可被称为服务器、云端服务器、远程终端等等,然而本专利技术同样不限于此,本专利技术中的语音识别设备可以是能够用于实现专利技术技术方案的任何设备,而不管其是移动的还是非移动的,也不管其在具体实现中的名称是什么。在一些示例中,用户的语音信息可以通过客户端设备的麦克风等单元进行读取。该用户的语音信息可被转化为电子信号并进行存储,例如,用户可通过电子设备的麦克风系统进行语音输入:“播放音乐剧”、“播放戏曲”、“我想听越剧”等。甚至在一些示例中,例如在语音识别设备位于用户本地的情况下,也可以不使用客户端设备,用户可在语音识别设备(例如,其麦克风)处直接输入语音。在步骤S02处,选择语音数据库来识别用户输入的语音,并输出作为结果的识别输出。在一些示例中,可选择要使用的语音数据库,并根据所选择的语音数据库,利用语音识别引擎的声学模型和语言模型等进行语音的识别,并输出识别结果。在步骤S03中,使用领域判定来从识别输出中选择一个或多个候选最优识别输出。可通过领域判定选择最优选的候选输出结果进行输出。在输出中可包含多个待选定的输出结果;例如多个待选定的结果可以是“我想听越剧”、“我想听粤剧”等多个结果。当然,在一些情况下,也可以仅输出一个输出结果。可选地,在步骤S04中,检测用户的个性标识信息。该步骤可在步骤S03与接下来将要详细阐述的步骤S05之间执行,但本专利技术不限于此,该步骤也可在执行步骤S05之前的任何时候执行。例如,在用户多次使用该语音识别设备的情况下,也可以存储用户在之前使用语音识别设备时检测到的个性标识信息,并在本次识别中使用所存储的个性标识信息。个性标识信息例如可以包括用户的地理位置信息、用户所使用移动设备的当前连接信号源、用户的籍贯以及可个性化标识用户的其他本领
域技术人员周知的信息。用户的地理位置信息可以通过多种方式进行获取。该信息的采集可以是用多种方式的结合,或单独采用一种方式进行获取,例如可以包括:通过用户的网络连接IP地址进行获取,例如当用户使用连接云端服务器的智能语音设备,可以通过用户网络信息的检测,获得用户的所在地址为“浙江省绍兴市”;或者可以通过用户的移动设备相关联的基站位置进行确定;也可以通过用户的移动设备的G本文档来自技高网
...

【技术保护点】
一种语音识别方法,包括:获取用户的语音输入;选择语音数据库来识别用户输入的语音,并输出作为结果的识别输出;使用领域判定来从所述识别输出中选择一个或多个候选最优识别输出;以及以用户的个性标识信息作为判定条件来判定所述一个或多个候选最优识别输出中的最优识别输出。

【技术特征摘要】
1.一种语音识别方法,包括:获取用户的语音输入;选择语音数据库来识别用户输入的语音,并输出作为结果的识别输出;使用领域判定来从所述识别输出中选择一个或多个候选最优识别输出;以及以用户的个性标识信息作为判定条件来判定所述一个或多个候选最优识别输出中的最优识别输出。2.根据权利要求1所述的语音识别方法,其中,所述选择语音数据库来识别用户输入的语音包括:根据所选择的语音数据库,利用语音识别引擎的声学模型和语言模型来识别用户输入的语音。3.根据权利要求1所述的语音识别方法,还包括:检测用户的所述个性标识信息。4.根据权利要求3所述的语音识别方法,其中,用户的所述个性标识信息包括用户的地理位置信息、用户所使用移动设备的当前连接信号源和用户的籍贯中的一项或多项。5.根据权利要求4所述的语音识别方法,其中,通过在进行用户输入的语音的识别时识别用户的方言和/或口音属性来获取所述用户的籍贯。6.根据权利要求1所述的语音识别方法,还包括:使用用户的所述个性标识信息来选择用于语音识别的语音数据库。7.一种语音识别设备,包括:语音获取单元,用于获取用户的语音输入;语音识别单元,用于选择语音数据库来识别用户输入的语音,并...

【专利技术属性】
技术研发人员:汤跃忠
申请(专利权)人:北京灵隆科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1