一种语音识别结果的处理方法、装置、设备及介质制造方法及图纸

技术编号:19024893 阅读:38 留言:0更新日期:2018-09-26 19:26
本发明专利技术实施例提供了一种语音识别结果的处理方法、装置、设备及介质。方法包括:获取使用多种语音识别方法对同一语音片段分别进行识别得到的作为语音识别结果的多个文本;从所述多个文本中,选取一个文本作为第一文本,并从剩余文本中选取第二文本;将所述第二文本与所述第一文本进行比对,得到所述第一文本中相比所述第二文本的不匹配子串;在所述第一文本中标记所述不匹配子串;展示标记了所述不匹配子串的第一文本。本发明专利技术实施例通过对比多种语音识别方法的识别结果,更加准确、全面地发现并提示用户语音识别结果中潜在识别错误的词句。

【技术实现步骤摘要】
一种语音识别结果的处理方法、装置、设备及介质
本专利技术涉及语音识别
,特别是涉及一种语音识别结果的处理方法、装置、设备及介质。
技术介绍
随着大量的语音识别产品进入市场和服务领域,人们越来越多的享受到语音识别技术带来的便利。与此同时,由于语音识别技术无法保证绝对的准确,给用户使用上带来障碍。因此,如何对语音识别结果进行处理,使得语音识别更加准确,改善用户体验,成为一个亟待解决的问题。现有技术中,一种解决的方法是根据所采用的语音识别模型,计算语音识别结果中各部分文字的置信度,将结果中置信度低于预设阈值的文字标注出来,以提示用户这些文字存在潜在错误。但是现有技术中没有一种声学和语言模型能够准确、全面地发现语音识别结果中的潜在识别错误。
技术实现思路
本专利技术实施例的目的在于提供一种语音识别结果的处理方法、装置、设备及介质,以实现结合多种语音识别方法的处理结果,提示用户语音识别结果中潜在识别错误的词句。具体技术方案如下:本专利技术实施例的第一方面,提供一种语音识别结果的处理方法,所述方法包括:获取使用多种语音识别方法对同一语音片段分别进行识别得到的作为语音识别结果的多个文本;从所述多个文本中,选取一个文本作为第一文本,并从剩余文本中选取第二文本;将所述第二文本与所述第一文本进行比对,得到所述第一文本中相比所述第二文本的不匹配子串;在所述第一文本中标记所述不匹配子串;展示标记了所述不匹配子串的第一文本。结合第一方面,在第一种可能的实现方式中,所述从所述多个文本中,选取一个文本作为第一文本,包括:从所述多个文本中,选取使用所述多种语音识别方法中的预设置信度最高的方法识别得到的文本作为第一文本。结合第一方面,在第二种可能的实现方式中,所述从所述多个文本中,选取一个文本作为第一文本,包括:从所述多个文本中,选取使用所述多种语音识别方法中的预设置信度最高的方法识别得到的文本作为第一文本。结合第一方面,在第三种可能的实现方式中,所述从所述多个文本中,选取一个文本作为第一文本,并从剩余文本中选取第二文本,包括:根据所述多个文本中各个文本的属性信息,计算各个文本的优先值,所述属性信息,包括:文本长度、文本对应的语音识别方法的预设置信度;从所述多个文本中,选取优先值最高的文本作为第一文本;从剩余文本中选取优先值最高的文本作为第二文本。结合第一方面,在第四种可能的实现方式中,所述将所述第二文本与所述第一文本进行比对,得到所述第一文本相比所述第二文本的不匹配子串,包括:将所述第二文本与所述第一文本进行比对,得到所述第一文本与所述第二文本之间的最长公共子序列;利用所述最长公共子序列对所述第一文本进行分割,得到一个或多个子串,将所述一个或多个子串作为所述第一文本相比所述第二文本的不匹配子串。结合第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述在所述第一文本中标记不匹配子串,包括:对于每一个不匹配子串,如果能够利用所述最长公共子序列从所述第二文本中分割出一个子串,且所述子串满足条件:所述子串在所述第二文本中的前后各一个字符与所述不匹配子串在所述第一文本中的前后各一个字符对应一致或均不存在,则将所述不匹配子串定义为第一类不匹配子串;如果不能够利用所述最长公共子序列从所述第二文本中分割出一个满足所述条件的子串,则将所述不匹配子串定义为第二类不匹配子串;利用两种不同的标记方式,在所述第一文本中分别标记出所述第一类不匹配子串和所述第二类不匹配子串。结合第一方面的第五种可能的实现方式,在第六种可能的实现方式中,在所述展示标记了所述不匹配子串的第一文本后,还包括:对于每一个所述第一类不匹配子串,将利用所述最长公共子序列从所述第二文本中分割出的满足所述条件的子串,作为所述第一类不匹配子串的候选子串;对于第一类不匹配子串,在接收到第一预设用户指令时,向用户展示所述第一类不匹配子串的候选子串,并在接收到第二预设用户指令时,用所述候选子串替换所述第一类不匹配子串。本专利技术实施例的第二方面,提供一种语音识别结果的处理装置,所述装置包括:采集模块,用于获取使用多种语音识别方法对同一语音片段分别进行识别得到的作为语音识别结果的多个文本;筛选模块:用于从所述多个文本中,选取一个文本作为第一文本,并从剩余文本中选取第二文本;匹配模块,用于将所述第二文本与所述第一文本进行比对,得到所述第一文本中相比所述第二文本的不匹配子串;标记模块,用于在所述第一文本中标记所述不匹配子串;展示模块,用于展示标记了所述不匹配子串的第一文本。结合第二方面,在第一种可能的实现方式中,所述筛选模块,包括:第一筛选单元,用于选取所述多个文本中最长的文本作为第一文本。结合第二方面,在第二种可能的实现方式中,所诉筛选模块,包括:第一筛选单元,用于从所述多个文本中,选取使用所述多种语音识别方法中的预设置信度最高的方法识别得到的文本作为第一文本。结合第二方面,在第三种可能的实现方式中,所述筛选模块,包括:优先值计算单元,用于根据所述多个文本中各个文本的属性信息,计算各个文本的优先值,所述属性信息,包括:文本长度、文本对应的语音识别方法的预设置信度;第一筛选单元,用于从所述多个文本中,选取优先值最高的文本作为第一文本;第二筛选单元,用于从剩余文本中选取优先值最高的文本作为第二文本。结合第二方面,在第四种可能的实现方式中,所述匹配模块,包括:最长公共子序列模块,用于将所述第二文本与所述第一文本进行比对,得到所述第一文本与所述第二文本之间的最长公共子序列;分割模块,利用所述最长公共子序列对所述第一文本进行分割,得到一个或多个子串,将所述一个或多个子串作为所述第一文本相比所述第二文本的不匹配子串。结合第二方面的第四种可能的实现方式,在第五种可能的实现方式中,所述标记模块,包括:分类单元,用于对于每一个不匹配子串,如果能够利用所述最长公共子序列从所述第二文本中分割出一个子串,且所述子串满足条件:所述子串在所述第二文本中的前后各一个字符与所述不匹配子串在所述第一文本中的前后各一个字符对应一致或均不存在,则将所述不匹配子串定义为第一类不匹配子串;如果不能够利用所述最长公共子序列从所述第二文本中分割出一个满足所述条件的子串,则将所述不匹配子串定义为第二类不匹配子串;分类标记单元,用于利用两种不同的标记方式,在所述第一文本中分别标记出所述第一类不匹配子串和所述第二类不匹配子串。结合第二方面的第五种可能的实现方式,在第六种可能的实现方式中,所述装置还包括:候选子串模块,用于对于每一个所述第一类不匹配子串,将利用所述最长公共子序列从所述第二文本中分割出的满足所述条件的子串,作为所述第一类不匹配子串的候选子串;提示模块,用于对于第一类不匹配子串,在接收到第一预设用户指令时,向用户展示所述第一类不匹配子串的候选子串;修正模块,用于在接收到第二预设用户指令时,用所述候选子串替换所述第一类不匹配子串。本专利技术实施例的第三方面,提供一种电子设备,包括处理器和存储器;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述任一所述的语音识别结果的处理方法。本专利技术实施例的第四方面,提供一种计算机可读存储介质,所述计算机刻度介质内存储有计算机程序,所述计算机程序被处理器执行时实现本实施例第一方面中任本文档来自技高网...

【技术保护点】
1.一种语音识别结果的处理方法,其特征在于,包括:获取使用多种语音识别方法对同一语音片段分别进行识别得到的作为语音识别结果的多个文本;从所述多个文本中,选取一个文本作为第一文本,并从剩余文本中选取第二文本;将所述第二文本与所述第一文本进行比对,得到所述第一文本中相比所述第二文本的不匹配子串;在所述第一文本中标记所述不匹配子串;展示标记了所述不匹配子串的第一文本。

【技术特征摘要】
1.一种语音识别结果的处理方法,其特征在于,包括:获取使用多种语音识别方法对同一语音片段分别进行识别得到的作为语音识别结果的多个文本;从所述多个文本中,选取一个文本作为第一文本,并从剩余文本中选取第二文本;将所述第二文本与所述第一文本进行比对,得到所述第一文本中相比所述第二文本的不匹配子串;在所述第一文本中标记所述不匹配子串;展示标记了所述不匹配子串的第一文本。2.根据权利要求1所述的方法,其特征在于,所述从所述多个文本中,选取一个文本作为第一文本,包括:选取所述多个文本中最长的文本作为第一文本。3.根据权利要求1所述的方法,其特征在于,所述从所述多个文本中,选取一个文本作为第一文本,包括:从所述多个文本中,选取使用所述多种语音识别方法中的预设置信度最高的方法识别得到的文本作为第一文本。4.根据权利要求1所述的方法,其特征在于,所述从所述多个文本中,选取一个文本作为第一文本,并从剩余文本中选取第二文本,包括:根据所述多个文本中各个文本的属性信息,计算各个文本的优先值,所述属性信息,包括:文本长度、文本对应的语音识别方法的预设置信度;从所述多个文本中,选取优先值最高的文本作为第一文本;从剩余文本中选取优先值最高的文本作为第二文本。5.根据权利要求1所述的方法,其特征在于,所述将所述第二文本与所述第一文本进行比对,得到所述第一文本相比所述第二文本的不匹配子串,包括:将所述第二文本与所述第一文本进行比对,得到所述第一文本与所述第二文本之间的最长公共子序列;利用所述最长公共子序列对所述第一文本进行分割,得到一个或多个子串,将所述一个或多个子串作为所述第一文本相比所述第二文本的不匹配子串。6.根据权利要求1所述的方法,其特征在于,所述在所述第一文本中标记不匹配子串,包括:对于每一个不匹配子串,如果能够利用所述最长公共子序列从所述第二文本中分割出一个子串,且所述子串满足条件:所述子串在所述第二文本中的前后各一个字符与所述不匹配子串在所述第一文本中的前后各一个字符对应一致或均不存在,则将所述不匹配子串定义为第一类不匹配子串;如果不能够利用所述最长公共子序列从所述第二文本中分割出一个满足所述条件的子串,则将所述不匹配子串定义为第二类不匹配子串;利用两种不同的标记方式,在所述第一文本中分别标记出所述第一类不匹配子串和所述第二类不匹配子串。7.根据权利要求6所述的方法,其特征在于,在所述展示标记了所述不匹配子串的第一文本后,还包括:对于每一个所述第一类不匹配子串,将利用所述最长公共子序列从所述第二文本中分割出的满足所述条件的子串,作为所述第一类不匹配子串的候选子串;对于第一类不匹配子串,在接收到第一预设用户指令时,向用户展示所述第一类不匹配子串的候选子串,并在接收到第二预设用户指令时,用所述候选子串替换所述第一类不匹配子串。8.一种语音识别结果的处理装置,其特征在于,包括:采集模块,用于获取使用多种语音识别方法对同一语音片段分别进行识别得到的作为语音识别结果的多个文本;筛选模块:用于从...

【专利技术属性】
技术研发人员:王芮
申请(专利权)人:北京金山云网络技术有限公司北京金山云科技有限公司北京金迅瑞博网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1