一种语音识别结果的处理方法、装置、设备及介质制造方法及图纸

技术编号：19024893 阅读：38 留言：0更新日期：2018-09-26 19:26

本发明专利技术实施例提供了一种语音识别结果的处理方法、装置、设备及介质。方法包括：获取使用多种语音识别方法对同一语音片段分别进行识别得到的作为语音识别结果的多个文本；从所述多个文本中，选取一个文本作为第一文本，并从剩余文本中选取第二文本；将所述第二文本与所述第一文本进行比对，得到所述第一文本中相比所述第二文本的不匹配子串；在所述第一文本中标记所述不匹配子串；展示标记了所述不匹配子串的第一文本。本发明专利技术实施例通过对比多种语音识别方法的识别结果，更加准确、全面地发现并提示用户语音识别结果中潜在识别错误的词句。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别结果的处理方法、装置、设备及介质
本专利技术涉及语音识别
，特别是涉及一种语音识别结果的处理方法、装置、设备及介质。
技术介绍
随着大量的语音识别产品进入市场和服务领域，人们越来越多的享受到语音识别技术带来的便利。与此同时，由于语音识别技术无法保证绝对的准确，给用户使用上带来障碍。因此，如何对语音识别结果进行处理，使得语音识别更加准确，改善用户体验，成为一个亟待解决的问题。现有技术中，一种解决的方法是根据所采用的语音识别模型，计算语音识别结果中各部分文字的置信度，将结果中置信度低于预设阈值的文字标注出来，以提示用户这些文字存在潜在错误。但是现有技术中没有一种声学和语言模型能够准确、全面地发现语音识别结果中的潜在识别错误。
技术实现思路
本专利技术实施例的目的在于提供一种语音识别结果的处理方法、装置、设备及介质，以实现结合多种语音识别方法的处理结果，提示用户语音识别结果中潜在识别错误的词句。具体技术方案如下：本专利技术实施例的第一方面，提供一种语音识别结果的处理方法，所述方法包括：获取使用多种语音识别方法对同一语音片段分别进行识别得到的作为语音识别结果的多个文本；从所述多个文本中，选取一个文本作为第一文本，并从剩余文本中选取第二文本；将所述第二文本与所述第一文本进行比对，得到所述第一文本中相比所述第二文本的不匹配子串；在所述第一文本中标记所述不匹配子串；展示标记了所述不匹配子串的第一文本。结合第一方面，在第一种可能的实现方式中，所述从所述多个文本中，选取一个文本作为第一文本，包括：从所述多个文本中，选取使用所述多种语音识别方法中的预设置信度最高...

【技术保护点】
1.一种语音识别结果的处理方法，其特征在于，包括：获取使用多种语音识别方法对同一语音片段分别进行识别得到的作为语音识别结果的多个文本；从所述多个文本中，选取一个文本作为第一文本，并从剩余文本中选取第二文本；将所述第二文本与所述第一文本进行比对，得到所述第一文本中相比所述第二文本的不匹配子串；在所述第一文本中标记所述不匹配子串；展示标记了所述不匹配子串的第一文本。

【技术特征摘要】
1.一种语音识别结果的处理方法，其特征在于，包括：获取使用多种语音识别方法对同一语音片段分别进行识别得到的作为语音识别结果的多个文本；从所述多个文本中，选取一个文本作为第一文本，并从剩余文本中选取第二文本；将所述第二文本与所述第一文本进行比对，得到所述第一文本中相比所述第二文本的不匹配子串；在所述第一文本中标记所述不匹配子串；展示标记了所述不匹配子串的第一文本。2.根据权利要求1所述的方法，其特征在于，所述从所述多个文本中，选取一个文本作为第一文本，包括：选取所述多个文本中最长的文本作为第一文本。3.根据权利要求1所述的方法，其特征在于，所述从所述多个文本中，选取一个文本作为第一文本，包括：从所述多个文本中，选取使用所述多种语音识别方法中的预设置信度最高的方法识别得到的文本作为第一文本。4.根据权利要求1所述的方法，其特征在于，所述从所述多个文本中，选取一个文本作为第一文本，并从剩余文本中选取第二文本，包括：根据所述多个文本中各个文本的属性信息，计算各个文本的优先值，所述属性信息，包括：文本长度、文本对应的语音识别方法的预设置信度；从所述多个文本中，选取优先值最高的文本作为第一文本；从剩余文本中选取优先值最高的文本作为第二文本。5.根据权利要求1所述的方法，其特征在于，所述将所述第二文本与所述第一文本进行比对，得到所述第一文本相比所述第二文本的不匹配子串，包括：将所述第二文本与所述第一文本进行比对，得到所述第一文本与所述第二文本之间的最长公共子序列；利用所述最长公共子序列对所述第一文本进行分割，得到一个或多个子串，将所述一个或多个子串作为所述第一文本相比所述第二文本的不匹配子串。6.根据权利要求1所述的方法，其特征在于，所述在所述第一文本中标记不匹配子串，包括：对于每一个不匹配子串，如果能够利用所述最长公共子序列从所述第二文本中分割出一个子串，且所述子串满足条件：所述子串在所述第二文本中的前后各一个字符与所述不匹配子串在所述第一文本中的前后各一个字符对应一致或均不存在，则将所述不匹配子串定义为第一类不匹配子串；如果不能够利用所述最长公共子序列从所述第二文本中分割出一个满足所述条件的子串，则将所述不匹配子串定义为第二类不匹配子串；利用两种不同的标记方式，在所述第一文本中分别标记出所述第一类不匹配子串和所述第二类不匹配子串。7.根据权利要求6所述的方法，其特征在于，在所述展示标记了所述不匹配子串的第一文本后，还包括：对于每一个所述第一类不匹配子串，将利用所述最长公共子序列从所述第二文本中分割出的满足所述条件的子串，作为所述第一类不匹配子串的候选子串；对于第一类不匹配子串，在接收到第一预设用户指令时，向用户展示所述第一类不匹配子串的候选子串，并在接收到第二预设用户指令时，用所述候选子串替换所述第一类不匹配子串。8.一种语音识别结果的处理装置，其特征在于，包括：采集模块，用于获取使用多种语音识别方法对同一语音片段分别进行识别得到的作为语音识别结果的多个文本；筛选模块：用于从...

【专利技术属性】
技术研发人员：王芮，
申请(专利权)人：北京金山云网络技术有限公司，北京金山云科技有限公司，北京金迅瑞博网络技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人