语音识别系统和方法技术方案

技术编号:23293656 阅读:26 留言:0更新日期:2020-02-08 22:42
提供了用于语音识别的系统和方法。所述方法可以包括获得由用户发出的语音信息的至少两个候选识别结果和与至少两个候选识别结果分别对应的至少两个初步分数。所述方法可以进一步包括对于至少两个候选识别结果中的每一个,从候选识别结果中提取一个或多个关键词汇,并且确定与一个或多个提取的关键词汇有关的至少一个参数。所述方法可以进一步包括针对至少两个候选识别结果中的每一个,基于所述至少一个参数生成更新系数,并基于更新系数更新初步分数以生成更新分数。所述方法可以进一步包括从至少两个候选识别结果中基于至少两个更新分数确定目标识别结果。

Speech recognition system and method

【技术实现步骤摘要】
【国外来华专利技术】语音识别系统和方法相关申请的交叉引用本申请要求于2017年6月15日提交的申请号为201710451642.7的中国专利,以及于2017年6月20日提交的申请号为201710469290.8的中国专利的优先权,上述申请的内容通过引用分别被包含于此。
本申请总体上涉及语音信息处理,尤其涉及用于语音识别的方法和系统。
技术介绍
随着计算机技术的发展,人机交互越来越受欢迎。人机交互的基本要求是计算机应该理解用户提供的信息。随着声学模型和语音识别技术(如自动语音识别(ASR)技术)的发展,由于语音信息的便利性,语音信息通常是用户与计算机交互的首选。然而,目前的语音识别方法通常是单轮识别,语音信息仅转换为一种可能的识别结果。换句话说,不同场景下不同人提供的语音信息可能会被认为是相同的结果,只能匹配一个或几个人的真实意图。例如,“我想订一个高桌晚宴”的语音信息可以被认为是购买特定桌子的指令,而用户实际上想在餐馆预定正式晚餐。错误识别结果通常不会被纠正并直接显示给用户。在计算机可以准确理解他/她的意思之前,用户可能需要多次重述他的话。使用目前的语音识别方法的这种经历既不容易也不愉快。因此,希望提供用于更精确和更有效地识别语音信息的系统和方法。
技术实现思路
根据本申请的一个方面,提供了一种用于语音识别的方法。所述方法可以在具有至少一个存储设备的计算设备上实现,所述存储设备存储用于语音识别的指令集,所述计算设备还含有以通信方式连接到网络的数据交换端口,以及与所述至少一个存储设备和数据交换端口通信的至少一个处理器。所述方法可以包括获取由用户发出的语音信息的至少两个候选识别结果和与所述至少两个候选识别结果分别对应的至少两个初步分数。所述方法可以进一步包括,针对至少两个候选识别结果中的每一个,从候选识别结果中提取一个或多个关键词汇,并且确定与一个或多个提取的关键词汇关联的至少一个参数。所述方法可以进一步包括:针对至少两个候选识别结果中的每一个,基于至少一个参数生成更新系数,并基于更新系数更新初步分数以生成更新分数。所述方法可以进一步包括基于来自至少两个候选识别结果的至少两个更新分数来确定目标识别结果。在一些实施例中,确定与一个或多个提取的关键词汇关联的至少一个参数可以包括经由数据交换端口从数据库获取至少两个样本关键词汇。对于所提取的所述一个或多个关键词汇中的每一个,确定与所述一个或多个提取的关键词汇相关联的至少一个参数可以进一步包括确定所述一个或多个提取的关键词汇中的每一个与所述至少两个样本关键词汇中的每一个之间的匹配度,从所述至少两个样本关键词汇中确定所述一个或多个目标样本关键词汇,所述一个或多个目标样本关键词汇中的每一个与所述提取的关键词汇之间的匹配度可以高于匹配度阈值。确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数可以进一步包括基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数。在一些实施例中,所述至少一个参数可以包括检索参数,并且基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数可以包括基于所述一个或多个目标样本关键词汇和所述一个或多个提取的关键词汇之间的所述匹配度确定检索参数。在一些实施例中,所述至少一个参数可以包括热度参数,并且基于所述一个或多个目标样本关键词汇来确定与所述一个或多个提取的关键词汇相关联的至少一个参数可以包括获取所述一个或多个目标样本关键词汇的热度,并根据所述一个或多个目标样本关键词汇的热度确定热度参数。在一些实施例中,所述至少一个参数可以包括偏好参数,并且基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇关联的所述至少一个参数,可以包括获取所述用户对于所述一个或多个目标样本词汇的偏好度,并基于所述一个或多个目标样本关键词汇的偏好度确定偏好参数。在一些实施例中,所述至少一个参数可以包括距离参数,基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇关联的所述至少一个参数可以包括获取与所述一个或多个目标样本关键词汇关联的位置信息,并识别候选识别结果中一个或多个位置类型指示词。对于紧接在所述一个或多个所识别的位置类型指示词之后的所述一个或多个提取的关键词汇中的每一个,基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇关联的所述至少一个参数,可以进一步包括基于相应的位置类型指示词来确定所提取的关键词汇的位置类型,以及基于与所述一个或多个目标样本关键词汇关联的位置信息以关联的所述位置信息及所述一个或多个提取的关键词汇的每一个关键词汇的位置类型,与所述一个或多个提取的关键词汇关联的距离信息。基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇关联的所述至少一个参数,可以进一步包括基于距离信息确定距离参数。在一些实施例中,所述方法进一步包括获取第一数量的出行次数,所述第一数量的出行次数与在统计时间段中与至少一个出行方式中的每一个出行方式关联的所述距离信息相对应,以及确定与在统计时间段内所有所述至少一个出行方式关联的距离信息相对应的第二数量的出行次数。所述方法可以进一步包括,对于所述至少一个出行方式中的每一个,基于所述第一数量的出行次数和所述第二数量的出行次数确定出行方式的使用概率,并且获取与语音信息关联的出行方式。所述方法可以进一步包括基于使用与所述语音信息关联的出行方式的概率来确定距离参数。在一些实施例中,所述至少一个参数可以包括热度参数、偏好参数、检索参数或距离参数中的至少一个。基于所述至少一个参数生成更新系数可以包括基于所述热度参数、所述偏好参数和所述检索参数生成所述更新系数,或者基于所述距离参数和所述检索参数生成所述更新系数。在一些实施例中,所述目标识别结果可以包括出发位置或目的地,并且所述方法可以进一步包括基于目标识别结果生成服务请求。在一些实施例中,所述方法可以进一步包括将所述服务请求发送到与服务供应商关联的用户终端。根据本申请的另一方面,提供了一种用于语音识别的系统。所述系统可以包括至少一个存储设备,所述存储设备包括一组指令,所述系统可以进一步包括以通信方式连接到网络的数据交换端口以及与所述至少一个存储设备和所述数据交换端口通信的至少一个处理器。所述至少一个处理器可以被配置为执行所述指令集,并且被指导为使所述系统获取由用户发出的语音信息的至少两个候选识别结果以及与所述至少两个候选识别结果分别对应的至少两个初步分数。所述至少一个处理器可以进一步被指导为使所述系统针对所述至少两个候选识别结果中的每一个候选识别结果,从所述候选识别结果中提取一个或多个关键词汇,确定与所述一个或多个提取的关键词汇关联的至少一个参数,基于所述至少一个参数生成更新系数,并基于更新系数更新初步分数以生成更新分数。所述至少一个处理器可以进一步被指导为使所述系统从所述至少两个候选识别结果中基于所述至少两个更新分数确定目标识别结果。根据本申请的另一方面,提供了一种非暂时性计算机可读介质。所述非暂时本文档来自技高网...

【技术保护点】
1.一种在计算设备上实现的方法,所述计算设备具有至少一个存储设备、数据交换端口和至少一个处理器,所述存储设备存储用于语音识别的一组指令,所述数据交换端口以通信方式连接到网络,所述至少一个处理器与所述至少一个存储设备和所述数据交换端口通信,所述方法包括:/n获取由用户发出的语音信息的至少两个候选识别结果和与所述至少两个候选识别结果分别对应的至少两个初步分数;/n对于所述至少两个候选识别结果中的每一个,/n从所述候选识别结果中提取一个或多个关键词汇;/n确定与所述一个或多个提取的关键词汇相关联的至少一个参数;/n基于所述至少一个参数生成更新系数;以及/n基于所述更新系数更新初步分数以生成更新分数;以及/n从所述至少两个候选结果中基于所述至少两个更新分数确定目标识别结果。/n

【技术特征摘要】
【国外来华专利技术】20170615 CN 2017104516427;20170620 CN 2017104692901.一种在计算设备上实现的方法,所述计算设备具有至少一个存储设备、数据交换端口和至少一个处理器,所述存储设备存储用于语音识别的一组指令,所述数据交换端口以通信方式连接到网络,所述至少一个处理器与所述至少一个存储设备和所述数据交换端口通信,所述方法包括:
获取由用户发出的语音信息的至少两个候选识别结果和与所述至少两个候选识别结果分别对应的至少两个初步分数;
对于所述至少两个候选识别结果中的每一个,
从所述候选识别结果中提取一个或多个关键词汇;
确定与所述一个或多个提取的关键词汇相关联的至少一个参数;
基于所述至少一个参数生成更新系数;以及
基于所述更新系数更新初步分数以生成更新分数;以及
从所述至少两个候选结果中基于所述至少两个更新分数确定目标识别结果。


2.根据权利要求1所述的方法,其中确定与所述一个或多个提取的关键词汇相关联的至少一个参数包括:
由数据交换端口从数据库中获取至少两个样本关键词汇;
对于所提取的所述一个或多个关键词汇中的每一个,
确定所述一个或多个提取的关键词汇中的每一个与所述至少两个样本关键词汇中的每一个之间的匹配度;
从所述至少两个样本关键词汇中确定一个或多个目标样本关键词汇,其中所述一个或多个目标样本关键词汇中的每一个与所述提取的关键词汇之间的匹配度高于匹配度阈值;以及
基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数。


3.根据权利要求2所述的方法,其中所述至少一个参数包括检索参数,并且基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数包括:
基于所述一个或多个目标样本关键词汇与所述一个或多个提取的关键词汇之间的所述匹配度确定所述检索参数。


4.根据权利要求2所述的方法,其中所述至少一个参数包括热度参数,并且基于所述一个或多个目标样本关键词汇来确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数包括:
获取所述一个或多个目标样本关键词汇的热度;以及
基于所述一个或多个目标样本关键词汇的热度来确定热度参数。


5.根据权利要求2所述的方法,其中所述至少一个参数包括偏好参数,并且基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数包括:
获取用户关于所述一个或多个目标样本关键词汇的偏好度;以及
基于所述一个或多个目标样本关键词汇的所述偏好度确定所述偏好参数。


6.根据权利要求2所述的方法,其中所述至少一个参数包括距离参数,基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数包括:
获取与所述一个或多个目标样本关键词汇相关联的位置信息;
识别所述候选识别结果中的一个或多个位置类型指示词;
对于紧接在所述一个或多个识别的位置类型指示词之后的所述一个或多个提取的关键词汇中的每一个,基于所述对应的位置类型指示词来确定所述提取的关键词汇的位置类型;
基于与所述一个或多个目标样本关键词汇相关联的所述位置信息和所述一个或多个提取的关键词汇中的每一个的位置类型,确定与所述一个或多个提取的关键词汇相关联的距离信息;以及
基于所述距离信息确定所述距离参数。


7.根据权利要求6所述的方法,进一步包括:
在统计时间段中获取对应于至少一个出行方式中的每一个相关联的所述距离信息的第一数量的出行次数;
确定在所述统计时间段中所有所述至少一个出行方式相关联的所述距离信息相对应的的第二数量的出行次数;
对于所述至少一个出行方式中的每一个,基于所述第一数量的出行次数和所述第二数量的出行次数确定所述出行方式的使用概率;
获取与语音信息相关联的出行方式;以及
基于使用与所述语音信息相关联的所述出行方式的所述概率来确定所述距离参数。


8.根据权利要求1所述的方法,其中所述至少一个参数包括热度参数、偏好参数、检索参数或距离参数中的至少一个,并且基于所述至少一个参数生成更新系数包括:
基于所述热度参数、所述偏好参数和所述检索参数生成所述更新系数;或者
基于所述距离参数和所述检索参数生成所述更新系数。


9.根据权利要求1所述的方法,其中所述目标识别结果包括出发地或目的地,并且所述方法进一步包括:
基于所述目标识别结果生成服务请求。


10.根据权利要求9所述的方法,进一步包括:
将所述服务请求发送到与服务供应商相关联的用户终端。


11.一种语音识别系统,包括:
至少一个存储设备,所述存储设备包括一组指令;
以通信方式连接到网络的数据交换端口;以及
与所述至少一个存储设备和所述数据交换端口通信的至少一个处理器,所述至少一个处理器被配置为执行所述指令集,并且被指导为使所述系统:
获取由用户发出的语音信息的至少两个候选识别结果和与所述至少两个候选识别结果分别对应的至少两个初步分数;
对于所述至少两个候选识别结果中的每一个,
从所述候选识别结果中提取一个或多个关键词汇;
确定与所述一个或多个提取的关键词汇相关联的至少一个参数;
基于所述至少一个参数生成更新系数;以及
基于所述更新系数更新所述初步分数以生成更新分数;以及
从所述至少两个候选识别结果中基于所述至少两个更新分数确定目标识别结果。


12.根据权利要求11所述的系统,其中为了确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数,所述至少一个处理器进一步被指导为使所述系统:
由所述数据交换端口从数据库获取至少两个样本关键词汇;
对于所提取的所述一个或多个关键词汇中的每一个关键词汇,
确定所述一个或多个提取的关键词汇中的每一个与所述至少两个样本关键词汇中的每一个之间的匹配度;以及
从所述至少两个样本关键词汇中确定一个或多个目标样本关键词汇,所述一个或多个目标样本关键词汇中的每一个与所述提取的关键词汇之间的匹配度高于匹配度阈值;以及
基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数。


13.根据权利要求12所述的系统,其中所述至少一个参数包括检索参数,并且基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数,所述至少一个处理器进一步被指导为使所述系统:
基于所述一个或多个目标样本关键词汇和所述一个或多个提取的关键词汇之间的所述匹配度确定所述检索参数。


14.根据权利要求12所述的系统,其中所述至少一个参数包括热度参数,并且基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数,所述至少一个处理器进一步被指导为使所述系统:
获取所述一个或多个目标样本关键词汇的热度;以及
基于所述一个或多个目标样本关键词汇的所述热度来确定热度参数。


15.根据权利要求12所述的系统,其中所述至少一个参数包括偏好参数,并且基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数,所述至少一个处理器进一步被指导为使所述系统:
获取所述用户对于所述一个或多个目标样本关键词汇的偏好度;以及
基于所述一个或多个目标样本关键词汇的所述偏好度确定所述偏好参数。


16.根据权利要求12所述的系统,其中所述至少一个参数包括距离参数,并且基于所述一个或多个目标样本关键词汇确定与所述一个或多个提取的关键词汇相关联的所述至少一个参数,所述至少一个处理器进一步被指导为使所述系统:
获取与所述一个或多个目标样本关键词汇相关联的位置信息;
识别所述候选识别结果中一个或多个位置类型指示词;
对于紧接在所述一个或多个所识别的位置类型指示词之后的所述一个或多个提取的关键词汇中的每一个,基于所述对应的位置类型指示词来确定所述提取的关键词汇的位置类型;
基于与所述一个或多个目标样本关键词汇相关联的位置信息以及所述一个或多个提取的关键词汇中的每一个的位置类型,确定与所述一个或多个提取的关键词汇相关联的距离信息;以及
基于所述距离信息确定所述距离参数。


17.根据权利要求16所述的系统,其中所述至少一个处理器进一步被指导为使所述系统:
在统计时间段中获取对应于至少一个出行方式中的每一个相关联的所述距离信息的第一数量的出行次数;
确定在所述统计时间段中所有所述至少一个出行方式相关联的所述距离信息相对应的第二数量的出行次数;
对于所述至少一个出行方式中的每一个,基于所述第一数量的出行次数和所述第二数量的出行次数来确定所述出行方式的使用概率;
获取与所述语音信息相关联的出行方式;以及
基于使用与所述语音信息相关联的所述出行方式的概率来确定所述距离参数。


18.根据权利要求11所述的系统,其中所述至少一个参数包括热度参数、偏好参数、检索参数或距离参数中的至少一个,并且基于所述至少一个参数生成更新系数,所述至少一个处理器进一步被指导为使所述系统:
基于所述热度参数、所述偏好参数和所述检索参数生成所述更新系数;或者
基于所述距离参数和所述检索参数生成所述更新系数。


19.根据权利要求11所述的系统,其中所述目标识别结果包括出发地或目的地,并且所述至少一个处理器进一步被指导为使所述系统:
基于所述目标识别结果生成服务请求。


20.根据权利要求19所述的系统,其中所述至少一个处理器进一步被指导为使所述系统:
将所述服务请求发送到与服务供应商相关联的用户终端。


21.一种非暂时性计算机可读介质,所述非暂时性计算机可读介质包括用于语音识别的一组指令,当由至少一个处理器执行时,所述指令指导所述至少一个处理器实现一种方法,所述方法包括:
获取由用户发出的语音信息的至少两个候选识别结果和与所述至少两个候选识别结果分别对应的至少两个初步分数;
对于所述至少两个候选识别结果中的每一个,
从所述候选识别结果中提取一个或多个关键词汇;
确定与所述一个或多个提取的关键词汇相关联的至少一个参数;
基于所述至少一个参数生成更新系数;以及
基于所述更新系数更新所述初步分数以生成更新分数;以及
从所述至少两个候选识别结果中基于所述至少两个更新分数确定目标识别结果。


22.一种在计算设备上实现的方法,所述计算设备具有至少一个存储设备和至少一个处理器,至少一个存储设备存储一组用于语音识别的指令,所述至少一个处理器与所述至少一个存储设备通信,所述方法包括:
获取由当前用户提供的语音信息的至少两个候选识别结果和至少两个初步分数,所述至少两个初步分数中的每一个对应于所述候选识别结果中的一个候选识别结果;
基于预定关键词汇提取规则从所述至少两个候选识别结果中的每一个中提取预设类型的一个或多个关键词汇;
基于所述提取的一个或多个关键词汇修正与所述至少两个候选识别结果中的每一个相对应的所述初步分数,并且基于修正的结果确定所述语音信息的目标识别结果。


23.根据权利要求22所述的方法,其中基于所述提取的一个或多个关键词汇修正与所述至少两个候选识别结果中的每一个相对应的所述初步分数包括:
基于所提取所述一个或多个关键词汇与预设样本数据库中的至少两个样本关键词汇之间的相似度,确定具有提取的所述一个或多个关键词汇的所述至少两个候选识别结果中的每一个的更新系数;以及
基于所述更新系数更新与所述至少两个候选识别结果中的每一个相对应的所述初步分数,以生成对应于所述至少两个候选识别结果中的每一个的更新分数。


24.根据权利要求23所述的方法,其中所述预设样本数据库进一步包括所述至少两个样本关键词汇的热度信息或当前用户使用所述至少两个样本关键词汇的历史信息中的至少一个。


25.根据权利要求24所述的方法,其中
所述预设样本数据库进一步包括所述至少两个样本关键词汇的所述热度信息,以及
基于提取的所述一个或多个关键词汇与预设样本数据库中的至少两个样本关键词汇之间的相似度,确定具有所述一个或多个提取的关键词汇的所述至少两个候选识别结果中的每一个的更新系数包括:
确定所述一个或多个提取的关键词汇和所述至少两个样本关键词汇之间的相似度;
从所述至少两个样本关键词汇中选择一个或多个样本关键词汇,其中所述一个或多个提取的关键词汇与所述一个或多个选择的样本关键词汇之间的相似度大于相似度阈值;
根据热度信息和热度参数之间的第一转换关系,将选择的所述一个或多个样本关键词汇的所述热度信息转换为一个或多个热度参数;以及
基于所述一个或多个热度参数,确定具有所述一个或多个提取的关键词汇的所述至少两个候选识别结果中的每一个的更新系数。


26.根据权利要求25所述的方法,其中
所述至少两个样本关键词汇的热度信息包括对应于所述至少两个周期性统计时间段相的所述至少两个样本关键词汇的至少两个热度,以及
根据所述热度信息和所述热度参数之间的第一转换关系,将所选择的一个或多个样本关键词汇的所述热度信息转换为一个或多个热度参数包括:
确定当前时间所属的统计时间段;
从与所述至少两个周期性统计时间段对应的所述一个或多个选择的样本关键词汇的至少两个热度中选择与所述统计时间段对应的一个或多个热度;以及
根据所述热度和所述热度参数之间的第二转换关系,将所述一个或多个热度转换为所述至少两个候选识别结果中的每一个的一个或多个热度参数。


27.根据权利要求24所述的方法,其中
预设样本数据库进一步包括所述至少两个样本关键词汇的热度信息和所述当前用户使用所述至少两个样本关键词汇的所述历史信息;以及
基于所提取的所述一个或多个关键词汇与预设样本数据库中的所述至少两个样本关键词汇之间的相似度,确定具有所述一个或多个提取的关键词汇的所述至少两个候选识别结果中的每一个的更新系数包括:
确定一个或多个提取的关键词汇和所述至少两个样本关键词汇之间的相似度;
根据所述相似度与检索参数之间的第三转换关系将所述相似度转换为检索参数;
根据所述相似度与偏好参数之间的第四转换关系,将所述相似度转换为偏好参数;
基于所述相似度、所述至少两个样本关键词汇的所述热度信息以及所述热度信息与热度参数之间的第一转换关系来确定热度参数;以及
通过将所述检索参数加上或乘以所述偏好参数和所述热度参数之间的较高值,来确定具有所述一个或多个提取的关键词汇的所述至少两个候选识别结果中的所述每一个的所述更新系数,
对于相同的相似度,根据相似度和偏好参数之间的所述第四转换关系转换的偏好参数是大于基于热度信息和热度参数之间的所述第一转换关系确定的热度参数。


28.一种用于语音识别的设备,包括:
至少一个存储设备,所述至少一个存储设备包括一组指令;以及
与所述至少一个存储设备通信的至少一个处理器,其中所述至少一个处理器...

【专利技术属性】
技术研发人员:李秀林
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1