一种音频数据识别结果的调整方法及装置制造方法及图纸

技术编号：14452733 阅读：66 留言：0更新日期：2017-01-18 22:32

本发明专利技术公开了一种音频数据识别结果的调整方法及装置。所述方法包括：在接收到第一音频数据的第一识别结果时，获取所述第一识别结果中的指定文字信息；从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据；获取所述指定音频数据的发音，并从已经建立的词频统计模型中获取与所述发音对应的目标候选信息；使用所述目标候选信息替换所述指定文字信息，以对所述第一识别结果进行调整。通过本发明专利技术的技术方案，能够自动地对语音识别结果进行调整，并最终实现提高人工校对音频数据识别结果时，音频数据识别结果的校对效率和准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频数据识别
，特别涉及一种音频数据识别结果的调整方法及装置。
技术介绍
目前，音频数据识别的总体识别率越来越高，但音频数据识别仍然会出现错误，且引擎或语音识别工具自身并无法正确判断语音识别结果是否正确，这影响了音频数据识别结果的正确率。为了确保音频数据识别结果的质量，需要人工校对，但由于人为因素也会出现一些错误，同时也会降低音频数据识别的效率。
技术实现思路
本专利技术提供一种音频数据识别结果的调整方法及装置，用以提高人工校对音频数据识别结果时，音频数据识别结果的校对效率和准确性。本专利技术提供一种音频数据识别结果的调整方法，包括：在接收到第一音频数据的第一识别结果时，获取所述第一识别结果中的指定文字信息；从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据；获取所述指定音频数据的发音，并从已经建立的词频统计模型中获取与所述发音对应的目标候选信息；使用所述目标候选信息替换所述指定文字信息，以对所述第一识别结果进行调整。在一个实施例中，所述方法还包括：当所述目标候选信息为至少两个时，按照至少两个所述目标候选信息中的每个所述目标候选信息的最近使用时间、历史使用频率、历史使用次数之和、历史使用地点中的一种或其组合确定至少两个所述目标候选信息的显示优先级；按照所述显示优先级从高到低的顺序依次将至少两个所述目标候选信息进行排列显示。在一个实施例中，所述方法还包括：当至少两个所述目标候选信息中的任一目标候选信息被选中后，按照所述任一目标候选信息与其他目标候选信息中的每个目标候选信息的关联度，确定后续目标候选信息，以将所述后续...

【技术保护点】
一种音频数据识别结果的调整方法，其特征在于，包括：在接收到第一音频数据的第一识别结果时，获取所述第一识别结果中的指定文字信息；从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据；获取所述指定音频数据的发音，并从已经建立的词频统计模型中获取与所述发音对应的目标候选信息；使用所述目标候选信息替换所述指定文字信息，以对所述第一识别结果进行调整。

【技术特征摘要】
1.一种音频数据识别结果的调整方法，其特征在于，包括：在接收到第一音频数据的第一识别结果时，获取所述第一识别结果中的指定文字信息；从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据；获取所述指定音频数据的发音，并从已经建立的词频统计模型中获取与所述发音对应的目标候选信息；使用所述目标候选信息替换所述指定文字信息，以对所述第一识别结果进行调整。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：当所述目标候选信息为至少两个时，按照至少两个所述目标候选信息中的每个所述目标候选信息的最近使用时间、历史使用频率、历史使用次数之和、历史使用地点中的一种或其组合确定至少两个所述目标候选信息的显示优先级；按照所述显示优先级从高到低的顺序依次将至少两个所述目标候选信息进行排列显示。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：当至少两个所述目标候选信息中的任一目标候选信息被选中后，按照所述任一目标候选信息与其他目标候选信息中的每个目标候选信息的关联度，确定后续目标候选信息，以将所述后续目标候选信息提示给用户，其中，所述其他目标候选信息为至少两个所述目标候选信息中除所述任一目标候选信息之外的目标候选信息，且所述后续目标候选信息为所述其他目标候选信息中与所述任一目标候选信息的关联度最高的目标候选信息。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：当接收到音频识别任务时，识别接收到的第二音频数据；对所述第二音频数据的第二识别结果进行分词，以得到至少一个词，其中，所述至少一个词包括至少一个独词和至少一个组合词中的一种或其组合；对所述至少一个独词和所述至少一个组合词中的一种或其组合进行词频统计，以得到词频统计结果；根据所述词频统计结果获取所述至少一个词中的高频词，并实时获取与所述高频词相关的关联信息；根据所述高频词、所述相关信息和所述词频统计结果建立所述词频统计模型。5.一种音频数据识别结果的调整装置，其特征在于，包括：第一获取单元，用于在接收到第一音频数据的第一识别...

【专利技术属性】
技术研发人员：刘赵杰，
申请(专利权)人：无锡天脉聚源传媒科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人