一种音频数据识别结果的调整方法及装置制造方法及图纸

技术编号:14452733 阅读:66 留言:0更新日期:2017-01-18 22:32
本发明专利技术公开了一种音频数据识别结果的调整方法及装置。所述方法包括:在接收到第一音频数据的第一识别结果时,获取所述第一识别结果中的指定文字信息;从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据;获取所述指定音频数据的发音,并从已经建立的词频统计模型中获取与所述发音对应的目标候选信息;使用所述目标候选信息替换所述指定文字信息,以对所述第一识别结果进行调整。通过本发明专利技术的技术方案,能够自动地对语音识别结果进行调整,并最终实现提高人工校对音频数据识别结果时,音频数据识别结果的校对效率和准确性。

【技术实现步骤摘要】

本专利技术涉及音频数据识别
,特别涉及一种音频数据识别结果的调整方法及装置
技术介绍
目前,音频数据识别的总体识别率越来越高,但音频数据识别仍然会出现错误,且引擎或语音识别工具自身并无法正确判断语音识别结果是否正确,这影响了音频数据识别结果的正确率。为了确保音频数据识别结果的质量,需要人工校对,但由于人为因素也会出现一些错误,同时也会降低音频数据识别的效率。
技术实现思路
本专利技术提供一种音频数据识别结果的调整方法及装置,用以提高人工校对音频数据识别结果时,音频数据识别结果的校对效率和准确性。本专利技术提供一种音频数据识别结果的调整方法,包括:在接收到第一音频数据的第一识别结果时,获取所述第一识别结果中的指定文字信息;从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据;获取所述指定音频数据的发音,并从已经建立的词频统计模型中获取与所述发音对应的目标候选信息;使用所述目标候选信息替换所述指定文字信息,以对所述第一识别结果进行调整。在一个实施例中,所述方法还包括:当所述目标候选信息为至少两个时,按照至少两个所述目标候选信息中的每个所述目标候选信息的最近使用时间、历史使用频率、历史使用次数之和、历史使用地点中的一种或其组合确定至少两个所述目标候选信息的显示优先级;按照所述显示优先级从高到低的顺序依次将至少两个所述目标候选信息进行排列显示。在一个实施例中,所述方法还包括:当至少两个所述目标候选信息中的任一目标候选信息被选中后,按照所述任一目标候选信息与其他目标候选信息中的每个目标候选信息的关联度,确定后续目标候选信息,以将所述后续目标候选信息提示给用户,其中,所述其他目标候选信息为至少两个所述目标候选信息中除所述任一目标候选信息之外的目标候选信息,且所述后续目标候选信息为所述其他目标候选信息中与所述任一目标候选信息的关联度最高的目标候选信息。在一个实施例中,所述方法还包括:当接收到音频识别任务时,识别接收到的第二音频数据;对所述第二音频数据的第二识别结果进行分词,以得到至少一个词,其中,所述至少一个词包括至少一个独词和至少一个组合词中的一种或其组合;对所述至少一个独词和所述至少一个组合词中的一种或其组合进行词频统计,以得到词频统计结果;根据所述词频统计结果获取所述至少一个词中的高频词,并实时获取与所述高频词相关的关联信息;根据所述高频词、所述相关信息和所述词频统计结果建立所述词频统计模型。本专利技术还提供一种音频数据识别结果的调整装置,包括:第一获取单元,用于在接收到第一音频数据的第一识别结果时,获取所述第一识别结果中的指定文字信息;第一确定单元,用于从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据;第二获取单元,用于获取所述指定音频数据的发音,并从已经建立的词频统计模型中获取与所述发音对应的目标候选信息;调整单元,用于使用所述目标候选信息替换所述指定文字信息,以对所述第一识别结果进行调整。在一个实施例中,所述装置还包括:第二确定单元,用于当所述目标候选信息为至少两个时,按照至少两个所述目标候选信息中的每个所述目标候选信息的最近使用时间、历史使用频率、历史使用次数之和、历史使用地点中的一种或其组合确定至少两个所述目标候选信息的显示优先级;显示单元,用于按照所述显示优先级从高到低的顺序依次将至少两个所述目标候选信息进行排列显示。在一个实施例中,所述装置还包括:第三确定单元,用于当至少两个所述目标候选信息中的任一目标候选信息被选中后,按照所述任一目标候选信息与其他目标候选信息中的每个目标候选信息的关联度,确定后续目标候选信息;提示单元,用于将所述后续目标候选信息提示给用户,其中,所述其他目标候选信息为至少两个所述目标候选信息中除所述任一目标候选信息之外的目标候选信息,且所述后续目标候选信息为所述其他目标候选信息中与所述任一目标候选信息的关联度最高的目标候选信息。在一个实施例中,所述装置还包括:识别单元,用于当接收到音频识别任务时,识别接收到的第二音频数据;分词单元,用于对所述第二音频数据的第二识别结果进行分词,以得到至少一个词,其中,所述至少一个词包括至少一个独词和至少一个组合词中的一种或其组合;统计单元,用于对所述至少一个独词和所述至少一个组合词中的一种或其组合进行词频统计,以得到词频统计结果;第三获取单元,用于根据所述词频统计结果获取所述至少一个词中的高频词,并实时获取与所述高频词相关的关联信息;建立单元,用于根据所述高频词、所述相关信息和所述词频统计结果建立所述词频统计模型。本公开的实施例提供的技术方案可以包括以下有益效果:在人工校对音频数据的识别结果的过程中,校对员首先会获取识别结果中错误文字或可能错误的文字即指定文字信息,然后系统会根据指定文字信息所对应的指定音频数据和该指定音频数据的发音,自动地、智能地从已建立的词频统计模型中获取与该发音对应的目标候选信息,以使用该目标候选信息替换指定文字信息,从而自动地对语音识别结果进行调整,并最终实现提高人工校对音频数据识别结果时,音频数据识别结果的校对效率和准确性。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1是根据一示例性实施例示出的一种音频数据识别结果的调整方法的流程图。图2是根据一示例性实施例示出的另一种音频数据识别结果的调整方法的流程图。图3是根据一示例性实施例示出的一种音频数据识别结果的调整装置的框图。图4是根据一示例性实施例示出的另一种音频数据识别结果的调整装置的框图。图5是根据一示例性实施例示出的又一种音频数据识别结果的调整装置的框图。图6是根据一示例性实施例示出的再一种音频数据识别结果的调整装置的框图。具体实施方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。相关技术中,音频数据识别的总体识别率越来越高,但音频数据识别仍然会出现错误,且引擎或语音识别工具自身并无法正确判断语音识别结果是否正确,这影响了音频数据识别结果的正确率。为了确保音频数据识别结果的质量,需要人工校对,但由于人为因素也会出现一些错误,同时也会降低音频数据识别的效率。为了解决上述技术问题,本公开实施例提供了一种音频数据识别结果的调整方法,该方法适用于音频数据识别结果的调整的程序、系统或装置中,如图1所示,步骤S101,在接收到第一音频数据的第一识别结果时,获取所述第一识别结果中的指定文字信息;其中,指定文字信息是人工校对第一识别结果时,校对员发现的第一识别结果中的错误文字信息或可能错误的文字信息。步骤S102,从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据;其中,确定指定音频数据的具体过程为:根据该指定文字信息在第一识别结果中的起始时间和占用的总时间,利用语音对齐技术,即获取到第一音频数据中与该起始时本文档来自技高网...

【技术保护点】
一种音频数据识别结果的调整方法,其特征在于,包括:在接收到第一音频数据的第一识别结果时,获取所述第一识别结果中的指定文字信息;从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据;获取所述指定音频数据的发音,并从已经建立的词频统计模型中获取与所述发音对应的目标候选信息;使用所述目标候选信息替换所述指定文字信息,以对所述第一识别结果进行调整。

【技术特征摘要】
1.一种音频数据识别结果的调整方法,其特征在于,包括:在接收到第一音频数据的第一识别结果时,获取所述第一识别结果中的指定文字信息;从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据;获取所述指定音频数据的发音,并从已经建立的词频统计模型中获取与所述发音对应的目标候选信息;使用所述目标候选信息替换所述指定文字信息,以对所述第一识别结果进行调整。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述目标候选信息为至少两个时,按照至少两个所述目标候选信息中的每个所述目标候选信息的最近使用时间、历史使用频率、历史使用次数之和、历史使用地点中的一种或其组合确定至少两个所述目标候选信息的显示优先级;按照所述显示优先级从高到低的顺序依次将至少两个所述目标候选信息进行排列显示。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:当至少两个所述目标候选信息中的任一目标候选信息被选中后,按照所述任一目标候选信息与其他目标候选信息中的每个目标候选信息的关联度,确定后续目标候选信息,以将所述后续目标候选信息提示给用户,其中,所述其他目标候选信息为至少两个所述目标候选信息中除所述任一目标候选信息之外的目标候选信息,且所述后续目标候选信息为所述其他目标候选信息中与所述任一目标候选信息的关联度最高的目标候选信息。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:当接收到音频识别任务时,识别接收到的第二音频数据;对所述第二音频数据的第二识别结果进行分词,以得到至少一个词,其中,所述至少一个词包括至少一个独词和至少一个组合词中的一种或其组合;对所述至少一个独词和所述至少一个组合词中的一种或其组合进行词频统计,以得到词频统计结果;根据所述词频统计结果获取所述至少一个词中的高频词,并实时获取与所述高频词相关的关联信息;根据所述高频词、所述相关信息和所述词频统计结果建立所述词频统计模型。5.一种音频数据识别结果的调整装置,其特征在于,包括:第一获取单元,用于在接收到第一音频数据的第一识别...

【专利技术属性】
技术研发人员:刘赵杰
申请(专利权)人:无锡天脉聚源传媒科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1