基于人工智能的语音识别结果纠错方法、装置及存储介质制造方法及图纸

技术编号:16969110 阅读:67 留言:0更新日期:2018-01-07 06:17
本发明专利技术公开了基于人工智能的语音识别结果纠错方法、装置及存储介质,其中方法包括:根据各用户对于语音识别结果的历史修改轨迹,确定出被修改过的字或词,作为标注对象,并分别确定出每个标注对象的评分;获取用户输入的语音的语音识别结果,确定出其中评分大于预定阈值的标记对象;将语音识别结果展示给用户,并对确定出的标记对象进行标记;当接收到用户针对任一标记对象的展示指令时,将该标记对象对应的替换候选项展示给用户,供用户从中进行选择,并用选中的替换候选项替换该标记对象。应用本发明专利技术所述方案,能够提高用户的输入效率等。

【技术实现步骤摘要】
基于人工智能的语音识别结果纠错方法、装置及存储介质
本专利技术涉及计算机应用技术,特别涉及基于人工智能的语音识别结果纠错方法、装置及存储介质。
技术介绍
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。随着技术的不断发展,语音识别技术的应用越来越广泛,比如,用户在编辑信息时,可通过语音的方式进行输入,针对用户输入的语音,可通过语音识别技术,得到文本形式的语音识别结果,进而可将文本形式的语音识别结果发送给其它用户等。但是,由于各种原因,语音识别结果中很可能会出现错误,一旦出现错误,用户则需要手动进行修改。表一~表四分别为不同原因所导致的识别错误及对应的修改:表一近音字修改修改前修改后是不是被哪个情人哪去了?是不是被哪个情人拿去了?你这个躺着了么久了好老火啊!你这个烫着了么久了好老火啊!本文档来自技高网...
基于人工智能的语音识别结果纠错方法、装置及存储介质

【技术保护点】
一种基于人工智能的语音识别结果纠错方法,其特征在于,包括:根据各用户对于语音识别结果的历史修改轨迹,确定出被修改过的字或词,作为标注对象,并分别确定出每个标注对象的评分;获取用户输入的语音的语音识别结果,确定出其中评分大于预定阈值的标记对象;将所述语音识别结果展示给所述用户,并对确定出的标记对象进行标记;当接收到所述用户针对任一标记对象的展示指令时,将所述标记对象对应的替换候选项展示给所述用户,供所述用户从中进行选择,并用选中的替换候选项替换所述标记对象。

【技术特征摘要】
1.一种基于人工智能的语音识别结果纠错方法,其特征在于,包括:根据各用户对于语音识别结果的历史修改轨迹,确定出被修改过的字或词,作为标注对象,并分别确定出每个标注对象的评分;获取用户输入的语音的语音识别结果,确定出其中评分大于预定阈值的标记对象;将所述语音识别结果展示给所述用户,并对确定出的标记对象进行标记;当接收到所述用户针对任一标记对象的展示指令时,将所述标记对象对应的替换候选项展示给所述用户,供所述用户从中进行选择,并用选中的替换候选项替换所述标记对象。2.根据权利要求1所述的方法,其特征在于,所述分别确定出每个标注对象的评分包括:针对每个标记对象,至少根据所述标记对象的修改频率对所述标记对象进行评分,修改频率越高,评分越高。3.根据权利要求1所述的方法,其特征在于,所述获取用户输入的语音的语音识别结果,确定出其中评分大于预定阈值的标记对象之前,进一步包括:根据各用户对于语音识别结果的历史修改轨迹,针对每个标记对象,分别确定出用于替换所述标记对象的内容,并选取出替换次数最多的N个内容作为所述标记对象对应的替换候选项,N为正整数。4.根据权利要求1所述的方法,其特征在于,所述将所述标记对象对应的替换候选项展示给所述用户包括:根据所述用户的用户标签,确定所述用户所属的类型;将所述标记对象对应于所述用户所属的类型的替换候选项展示给所述用户。5.根据权利要求4所述的方法,其特征在于,所述获取用户输入的语音的语音识别结果,确定出其中评分大于预定阈值的标记对象之前,进一步包括:针对每个类型,分别进行以下处理:根据属于所述类型的各用户的历史修改轨迹,针对被修改过的每个标记对象,分别确定出用于替换所述标记对象的内容,并选取出替换次数最多的N个内容作为所述标记对象对应于所述类型的替换候选项,N为正整数。6.根据权利要求5所述的方法,其特征在于,所述根据各用户对于语音识别结果的历史修改轨迹,确定出被修改过的字或词,作为标注对象,并分别确定出每个标注对象的评分包括:针对每个类型,分别进行以下处理:根据属于所述类型的各用户的历史修改轨迹,确定出被修改过的字或词,作为标注对象,组成对应于所述类型的标记对象集,并分别确定出其中的每个标记对象的评分;所述获取用户输入的语音的语音识别结果,确定出其中评分大于预定阈值的标记对象包括:获取用户输入的语音的语音识别结果;根据所述用户的用户标签,确定出所述用户所属的类型;确定出所述语音识别结果中评分大于预定阈值且位于所述用户所属的类型对应的标记对象集中的标记对象。7.一种基于人工...

【专利技术属性】
技术研发人员:周承礼姚树杰谢波时培轩
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1