语音搜索优化方法、装置和系统制造方法及图纸

技术编号:19241084 阅读:29 留言:0更新日期:2018-10-24 04:21
本发明专利技术涉及一种语音搜索优化方法,包括步骤:获取输入信号,并将输入信号与预置模板进行匹配分析;若存在与输入信号匹配的预置模板,则重置WFST网络的搜索状态;根据重置搜索状态后的WFST网络,对与输入信号匹配的预置模板进行前置搜索,获得与预置模板相对应的优化WFST网络;根据优化WFST网络,完成各帧的语音信号的搜索,得到搜索结果。还公开一种语音搜索系统。通过在输入信号与预置模板相匹配时,重置WFST网络的搜索状态,进而根据预置模板在重置搜索状态后的WFST网络中进行前置搜索,得到并根据优化WFST网络对各帧的语音信号进行搜索,输出搜索结果。解决了传统的语音识别方式仍然存在识别准确率不高的问题,达到了大幅提升语音识别准确率的效果。

【技术实现步骤摘要】
语音搜索优化方法、装置和系统
本专利技术涉及语音识别
,特别是涉及一种语音搜索优化方法、装置和语音搜索系统。
技术介绍
随着信息技术的不断革新,各种智能设备也在快速更新换代。作为众多智能设备的热门技术之一的语音识别技术,即是一种数据信息应用的典型代表。语音识别技术能够将给定的语音识别成对应的文字信息,因此,被广泛应用在各种智能交互设备上,例如智能交互设备的语音唤醒功能和语音助手等功能。传统的语音识别方式,一般是将输入的语音信号按帧提取特征,并根据声学模型计算出相应分类的概率,搜索部分从WFST网络的开始节点,根据每帧的分类概率,逐帧搜索遍历直至完成全部语音输入帧的搜索,根据所得到的路径获取最终的识别结果。然而,专利技术人在实现本专利技术的过程中,发现传统的语音识别方式仍然存在识别准确率不高的问题。
技术实现思路
基于此,有必要针对传统的语音识别方式仍然存在识别准确率不高的问题,提供一种语音搜索优化方法,一种语音搜索优化装置以及一种语音搜索系统。为实现上述目的,本专利技术实施例采用以下技术方案:一方面,本专利技术实施例提供一种语音搜索优化方法,包括步骤:获取输入信号,并将所述输入信号与预置模板进行匹配分析;若存在与所述输入信号匹配的所述预置模板,则重置WFST网络的搜索状态;根据重置搜索状态后的所述WFST网络,对与所述输入信号匹配的所述预置模板进行前置搜索,获得与所述预置模板相对应的优化WFST网络;根据所述优化WFST网络,完成各帧的语音信号的搜索,得到搜索结果。在其中一个实施例中,所述输入信号包括所述语音信号;将所述输入信号与预置模板进行匹配分析的过程,包括:对所述语音信号进行特征提取,得到所述语音信号的声学特征信息;将所述声学特征信息与所述预置模板的声学特征信息进行匹配。在其中一个实施例中,将所述输入信号与预置模板进行匹配分析的过程,还包括:对所述语音信号进行语音识别,得到识别结果;将所述识别结果与所述预置模板进行匹配。在其中一个实施例中,若存在与所述输入信号匹配的预置模板,则重置WFST网络的搜索状态的步骤之前,还包括:获取所述语音信号;对所述语音信号进行特征提取,得到所述语音信号的声学特征信息;根据所述声学特征信息,通过预先训练的声学模型对所述语音信号进行分类计算,得到所述语音信号的分类及对应的分类概率;其中,所述分类概率用于所述WFST网络对所述语音信号的搜索。在其中一个实施例中,所述输入信号还包括所述声学特征信息;将所述输入信号与预置模板进行匹配分析的过程,还包括:根据所述声学特征信息进行语音识别,得到识别结果;将所述识别结果与所述预置模板进行匹配。在其中一个实施例中,将所述输入信号与预置模板进行匹配分析的过程,还包括:将所述声学特征信息与所述预置模板的声学特征信息进行匹配。在其中一个实施例中,所述输入信号还包括所述WFST网络对所述语音信号搜索得到的阶段结果;将所述输入信号与预置模板进行匹配分析的过程,还包括:将所述阶段结果与所述预置模板进行匹配。在其中一个实施例中,所述预置模板包括设定领域的词序列、词序列对应的声学特征信息或音素序列。另一方面,还提供一种语音搜索优化装置,包括:匹配分析模块,用于获取输入信号,并将所述输入信号与预置模板进行匹配分析;搜索重置模块,用于若存在与所述输入信号匹配的预置模板,则重置WFST网络的搜索状态;前置搜索模块,用于根据重置搜索状态后的所述WFST网络,对与所述输入信号匹配的预置模板进行前置搜索,获得与所述预置模板相对应的优化WFST网络;搜索结果获取模块,用于根据所述优化WFST网络,完成各帧的语音信号的搜索,得到搜索结果。又一方面,还提供一种语音搜索设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述的语音搜索优化方法的步骤。再一方面,还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的语音搜索优化方法的步骤。再一方面,还提供一种语音搜索系统,包括语音识别装置和模板匹配装置,所述语音识别装置与所述模板匹配装置连接;所述模板匹配装置用于获取输入信号,并将所述输入信号与预置模板进行匹配分析;若存在与所述输入信号匹配的预置模板,则重置所述语音识别装置中的WFST网络的搜索状态,并向所述语音识别装置发送与所述输入信号匹配的预置模板;所述语音识别装置用于根据重置搜索状态后的所述WFST网络,对与所述输入信号匹配的预置模板进行前置搜索,获得与所述预置模板相对应的优化WFST网络;根据所述优化WFST网络,完成各帧的语音信号的搜索,得到搜索结果。上述技术方案中的一个技术方案具有如下有益效果:通过在输入信号与预置模板匹配时,重置WFST网络的搜索状态,进而根据预置模板,基于重置搜索状态后的所述WFST网络进行前置搜索,得到优化WFST网络,从而根据所述优化WFST网络,完成各帧的语音信号的搜索,得到与预置模板相关的搜索结果输出。解决了传统的语音识别方式仍然存在识别准确率不高的问题,达到了大幅提升语音识别准确率的效果。附图说明图1为一个实施例中语音搜索优化方法的应用环境图;图2为一个实施例中语音搜索优化方法的流程示意图;图3为另一个实施例中语音搜索优化方法的流程示意图;图4为一个实施例中语音搜索优化装置的结构框图;图5为一个实施例中语音搜索系统的结构框图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。本申请提供的语音搜索优化方法,可以应用于如图1所示的应用环境中。其中,终端102通过数据网络或无线网络连接到外部通信网,或者离线工作。终端102获取到用户输入的语音信号后,可以将输入信号(例如是前述的语音信号)与预置模板进行匹配分析。若终端102经过匹配分析后,确定存在与输入信号匹配的预置模板,则重置内部用于语音识别搜索的WFST网络的搜索状态,进而根据置搜索状态后的WFST网络,对与输入信号匹配的预置模板进行前置搜索,获得与预置模板相对应的优化WFST网络。从而,根据优化WFST网络,完成各帧语音信号的搜索,得到搜索结果输出。其中,终端102可以但不限于是各种智能手机、个人计算机、笔记本电脑、平板电脑、智能家电设备和车载智能终端设备。本申请提供的语音搜索优化方法,还可以应用于服务器上,由服务器在对输入的语音信号进行解码搜索的过程中,根据上述的语音搜索优化方法完成各帧语音信号的搜索并输出搜索结果,具体过程可以参考前述的终端102应用过程,此处不再赘述。在一个实施例中,请参阅图2,提供了一种语音搜索优化方法,以该方法应用于图1中的终端102为例进行说明。可以理解,在一般的语音信号的识别过程中,可以将输入终端102的语音信号输入到预先构建的WFST网络中进行解码搜索。在用户说出一段语音时,WFST网络可以随着用户说出语音的过程,持续获得语音信号输入,从而持续得到相应的语音搜索的中间结果,也即阶段性的搜索结果;直至用户说出的语音全部输入到WFST网络中,得到最终完整的搜索结果。也即是说,在WFST网络中,随着语音信号的不断输入,到当前节点的搜索结果是从上一状态节点跳转而来,本文档来自技高网...

【技术保护点】
1.一种语音搜索优化方法,其特征在于,包括步骤:获取输入信号,并将所述输入信号与预置模板进行匹配分析;若存在与所述输入信号匹配的所述预置模板,则重置WFST网络的搜索状态;根据重置搜索状态后的所述WFST网络,对与所述输入信号匹配的所述预置模板进行前置搜索,获得与所述预置模板相对应的优化WFST网络;根据所述优化WFST网络,完成各帧的语音信号的搜索,得到搜索结果。

【技术特征摘要】
1.一种语音搜索优化方法,其特征在于,包括步骤:获取输入信号,并将所述输入信号与预置模板进行匹配分析;若存在与所述输入信号匹配的所述预置模板,则重置WFST网络的搜索状态;根据重置搜索状态后的所述WFST网络,对与所述输入信号匹配的所述预置模板进行前置搜索,获得与所述预置模板相对应的优化WFST网络;根据所述优化WFST网络,完成各帧的语音信号的搜索,得到搜索结果。2.根据权利要求1所述的语音搜索优化方法,其特征在于,所述输入信号包括所述语音信号;将所述输入信号与预置模板进行匹配分析的过程,包括:对所述语音信号进行特征提取,得到所述语音信号的声学特征信息;将所述声学特征信息与所述预置模板的声学特征信息进行匹配。3.根据权利要求2所述的语音搜索优化方法,其特征在于,将所述输入信号与预置模板进行匹配分析的过程,还包括:对所述语音信号进行语音识别,得到识别结果;将所述识别结果与所述预置模板进行匹配。4.根据权利要求1至3任一项所述的语音搜索优化方法,其特征在于,若存在与所述输入信号匹配的预置模板,则重置WFST网络的搜索状态的步骤之前,还包括:获取所述语音信号;对所述语音信号进行特征提取,得到所述语音信号的声学特征信息;根据所述声学特征信息,通过预先训练的声学模型对所述语音信号进行分类计算,得到所述语音信号的分类及对应的分类概率;其中,所述分类概率用于所述WFST网络对所述语音信号的搜索。5.根据权利要求4所述的语音搜索优化方法,其特征在于,所述输入信号还包括所述声学特征信息;将所述输入信号与预置模板进行匹配分析的过程,还包括:根据所述声学特征信息进行语音识别,得到识别结果;将所述识别结果与所述预置模板进行匹配。6.根据权利要求5所述的语音搜索优化方法,其特征在于,将所述输入信号与预置模板进行匹配分析的过程,还包括:将所述声学特征信息与所述预置模板的声学特征信息进行匹配。7.根据权利要求5所述的...

【专利技术属性】
技术研发人员:李忠杰
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1