一种语音识别方法、装置及设备制造方法及图纸

技术编号:19024891 阅读:18 留言:0更新日期:2018-09-26 19:26
本发明专利技术涉及计算机领域,公开了一种语音识别方法、装置及设备,以解决现有技术中对语音信息识别的准确率低及扩展性低的技术问题。该方法包括:获得待识别语音信息;确定出所述待识别语音信息所对应的至少一条语音识别候选项;基于存储于第一数据库的第一语音识别模型、以及存储于第二数据库的第二语音识别模型,从所述至少一条语音识别候选项中确定出所述待识别语音信息所对应的语音识别结果。达到了提高语音识别的准确率和扩展性的技术效果。

【技术实现步骤摘要】
一种语音识别方法、装置及设备
本专利技术涉及计算机领域,尤其涉及一种语音识别方法、装置及设备。
技术介绍
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子产品的种类也越来越多,人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的电子设备,享受随着科技发展带来的舒适生活。例如,智能手表、智能手机、平板电脑等电子设备已经成为人们生活中一个重要的组成部分,其可以包含各种功能。通常情况下,电子设备都具备语音识别功能,可以基于语音识别功能识别出用户所输入的语音信息,现有技术都是将语音识别模型(例如语言模型)存在单机的缓存中,受限于内存大小,只能存储有限的语音识别模型,从而使得语音识别准确率较低;同时现有技术的扩展性不高,后期如果想更改缓存中的语音识别模型,只能通过把程序停掉,重新启动加载新语音识别模型来实现,故而存在着语音识别的扩展性较低的技术问题。
技术实现思路
本专利技术提供一种语音识别方法、装置及设备,以解决现有技术中对语音信息识别的准确率较低及扩展性较低的技术问题。第一方面,本专利技术实施例提供一种语音识别方法,包括:获得待识别语音信息;确定出所述待识别语音信息所对应的至少一条语音识别候选项;基于存储于第一数据库的第一语音识别模型、以及存储于第二数据库的第二语音识别模型,从所述至少一条语音识别候选项中确定出所述待识别语音信息所对应的语音识别结果。结合第一方面,在第一种可选的实施例中,所述基于存储于第一数据库的第一语音识别模型、以及存储于第二数据库的第二语音识别模型,从所述至少一条语音识别候选项中确定出所述待识别语音信息所对应的语音识别结果,包括:将每条语音识别候选项划分为至少一个词;基于所述第一语音识别模型中所包含的第一语言模型、和所述第二语音识别模型中所包含的第二语言模型,确定出在每个词的前预设个词出现的情况下,对应词出现的条件概率;基于每条语音识别候选项中各个词出现的条件概率,确定出所述语音识别结果。结合第一方面的第一种可选的实施例,在第二种可选的实施例中,所述基于所述第一语音识别模型中所包含的第一语言模型、和所述第二语音识别模型中所包含的第二语言模型,确定出在每个词的前预设个词出现的情况下,对应词出现的条件概率,包括:确定出对应词与其前预设个词所组成的语言片段;通过所述第一语言模型确定出对应词的第一总统计次数、以及对应语言片段的第二总统计次数;在基于所述第一语言模型无法获得所述第一总统计次数和/或所述第二总统计次数时,从所述第二语言模型获取所述第一总统计次数和/或所述第二总统计次数;基于所述第一总统计次数和所述第二总统计次数确定出对应词的所述条件概率。结合第一方面,在第三种可选的实施例中,所述基于存储于第一数据库的第一语音识别模型、以及存储于第二数据库的第二语音识别模型,从所述至少一条语音识别候选项中确定出所述待识别语音信息所对应的语音识别结果,包括:将每条语音识别候选项划分为至少一个词;基于所述第一语音识别模型中的第一语言模型,确定出在每个词的前预设个词出现的情况下,对应词出现的条件概率;在通过所述第一语言模型无法识别出任一词的条件概率时,通过所述第二语音识别模型所包含的第二语言模型确定出对应词的所述条件概率;基于每条语音识别候选项中各个词出现的条件概率,确定出所述语音识别结果。结合第一方面的第一种可选的实施例,在第四种可选的实施例中,所述基于每条语音识别候选项中各个词出现的条件概率,确定出所述语音识别结果,包括:基于所述至少一条语音识别候选项中各个词的所述条件概率,确定出所述至少一条语音识别候选项中每条语音识别候选项的综合评分值;确定出所述综合评分值满足预设条件的语音识别候选项作为所述语音识别结果。结合第一方面或第一方面的第一至四种可选的实施例中的任意一种可选的实施例,在第五种可选的实施例中,所述第一数据库为位于本地的内存数据库;和/或,所述第二数据库为位于其他服务器的分布式数据库。结合第一方面或第一方面的第一至四种可选的实施例中的任意一种可选的实施例,在第六种可选的实施例中,所述方法还包括:判断所述第一语音识别模型中是否存在预设时间段内未被访问的数据;如果存在的话,将对应数据移动至所述第二语音识别模型。结合第一方面或第一方面的第一至四种可选的实施例中的任意一种可选的实施例,在第七种可选的实施例中,所述方法还包括:获得客户端所产生的输入内容;对所述输入内容进行解析获得至少一个语言片段;基于所述至少一个语言片段对所述第一数据库中的所述第一语言模型进行更新。结合第一方面的第七种可选的实施例,在第八种可选的实施例中,所述基于所述至少一个语言片段对所述第一数据库中的所述第一语言模型进行更新,包括:如果在所述第一语言模型中查询不到所述至少一个语言片段中的第一语言片段所对应的数据,将所述第一语言片段加入所述第一语音识别模型;和/或,如果在所述第一语言模型中可以查询到所述至少一个语言片段中的第二语言片段所对应的数据,确定出所述至少一个语言片段中所述第二语言片段的统计次数;通过所述统计次数对所述于第一语音识别模型中的所述第二语言片段的总统计次数进行更新。第二方面,本专利技术实施例提供一种语音识别装置,包括:获得模块,用于获得待识别语音信息;第一确定模块,用于确定出所述待识别语音信息所对应的至少一条语音识别候选项;第二确定模块,用于基于存储于第一数据库的第一语音识别模型、以及存储于第二数据库的第二语音识别模型,从所述至少一条语音识别候选项中确定出所述待识别语音信息所对应的语音识别结果。结合第二方面,在第一种可选的实施例中,所述第二确定模块,包括:第一划分单元,用于将每条语音识别候选项划分为至少一个词;第一确定单元,用于基于所述第一语音识别模型中所包含的第一语言模型、和所述第二语音识别模型中所包含的第二语言模型,确定出在每个词的前预设个词出现的情况下,对应词出现的条件概率;第二确定单元,用于基于每条语音识别候选项中各个词出现的条件概率,确定出所述语音识别结果。结合第二方面的第一种可选的实施例,在第二种可选的实施例中,所述第一确定单元,包括:第一确定子单元,用于确定出对应词与其前预设个词所组成的语言片段;第二确定子单元,用于通过所述第一语言模型确定出对应词的第一总统计次数、以及对应语言片段的第二总统计次数;获得子单元,用于在基于所述第一语言模型无法获得所述第一总统计次数和/或所述第二总统计次数时,从所述第二语言模型获取所述第一总统计次数和/或所述第二总统计次数;第三确定子单元,用于基于所述第一总统计次数和所述第二总统计次数确定出对应词的所述条件概率。结合第二方面,在第三种可选的实施例中,所述第二确定模块,包括:第二划分单元,用于将每条语音识别候选项划分为至少一个词;第三确定单元,用于基于所述第一语音识别模型中的第一语言模型,确定出在每个词的前预设个词出现的情况下,对应词出现的条件概率;第四确定单元,用于在通过所述第一语言模型无法识别出任一词的条件概率时,通过所述第二语音识别模型所包含的第二语言模型确定出对应词的所述条件概率;第五确定单元,用于基于每条语音识别候选项中各个词出现的条件概率,确定出所述语音识别结果。结合第二方面的第一种可选的实施例,在第四种可选的实施例中所述第二确定单元,包括:第四确定子单本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:获得待识别语音信息;确定出所述待识别语音信息所对应的至少一条语音识别候选项;基于存储于第一数据库的第一语音识别模型、以及存储于第二数据库的第二语音识别模型,从所述至少一条语音识别候选项中确定出所述待识别语音信息所对应的语音识别结果。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:获得待识别语音信息;确定出所述待识别语音信息所对应的至少一条语音识别候选项;基于存储于第一数据库的第一语音识别模型、以及存储于第二数据库的第二语音识别模型,从所述至少一条语音识别候选项中确定出所述待识别语音信息所对应的语音识别结果。2.如权利要求1所述的方法,其特征在于,所述基于存储于第一数据库的第一语音识别模型、以及存储于第二数据库的第二语音识别模型,从所述至少一条语音识别候选项中确定出所述待识别语音信息所对应的语音识别结果,包括:将每条语音识别候选项划分为至少一个词;基于所述第一语音识别模型中所包含的第一语言模型、和所述第二语音识别模型中所包含的第二语言模型,确定出在每个词的前预设个词出现的情况下,对应词出现的条件概率;基于每条语音识别候选项中各个词出现的条件概率,确定出所述语音识别结果。3.如权利要求2所述的方法,其特征在于,所述基于所述第一语音识别模型中所包含的第一语言模型、和所述第二语音识别模型中所包含的第二语言模型,确定出在每个词的前预设个词出现的情况下,对应词出现的条件概率,包括:确定出对应词与其前预设个词所组成的语言片段;通过所述第一语言模型确定出对应词的第一总统计次数、以及对应语言片段的第二总统计次数;在基于所述第一语言模型无法获得所述第一总统计次数和/或所述第二总统计次数时,从所述第二语言模型获取所述第一总统计次数和/或所述第二总统计次数;基于所述第一总统计次数和所述第二总统计次数确定出对应词的所述条件概率。4.如权利要求1所述的方法,其特征在于,所述基于存储于第一数据库的第一语音识别模型、以及存储于第二数据库的第二语音识别模型,从所述至少一条语音识别候选项中确定出所述待识别语音信息所对应的语音识别结果,包括:将每条语音识别候选项划分为至少一个词;基于所述第一语音识别模型中的第一语言模型,确定出在每个词的前预设个词出现的情况下,对应词出现的条件概率;在通过所述第一语言模型无法识别出任一词的条件概率时,通过所述第二语音识别模型所包含的第二语言模型确定出对应词的所述条件概率;基于每条语音识别候选项中各个词出现的条件概率,确定出所述语音识别结果。5.如权利要求2所述的方法,其特征在于,所述基于每条语音识别候选项中各个词出现的条件概率,确定出所述语音识别结果,包括...

【专利技术属性】
技术研发人员:郑宏
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1