【技术实现步骤摘要】
基于语音识别的文本修正方法、装置、设备及介质
[0001]本专利技术涉及语音识别
,尤其涉及一种基于语音识别的文本修正方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]根据语音信息录入相应的文本是语音识别技术的一种重要应用场景,例如,会议录音转文稿,在聊天软件中,利用语音输入法发表评论或回复信息。
[0003]基于当前语音识别技术框架,在利用语音识别技术录入文字的过程中,即使在较为安静的环境下,仍然会有可能出现识别文字错误的情况。通常语音文本识别错误包括删除错误、插入错误及替代错误。其中,替代错误最为常见,尤其是同音替代错误。例如,“琵琶”与“枇杷”。
[0004]针对语音文本识别错误,常见的解决方法是采用人工重读待修正文本的方式,重新识别人工重读语音信息包含的文本,利用重读识别得到的文本修正待修正文本,这种解决方法,可以解决由于环境嘈杂引起的语音文本识别错误,但是不能有效的解决同音替代错误,例如,待修正文本为“十亿”,需要将“十亿”修正为“诗意”,而根据重读“十亿”的语音信息识别得到的 ...
【技术保护点】
【技术特征摘要】
1.一种基于语音识别的文本修正方法,其特征在于,所述方法包括:接收待识别语音并进行语音识别,得到所述待识别语音包含的文本词汇和每个所述文本词汇对应的多个不同评分的候选词;选取每个所述文本词汇对应的评分最高的候选词组成第一识别结果,显示所述第一识别结果;接收用户基于所述第一识别结果发出的修正指令,根据所述修正指令确定所述第一识别结果中待修正的目标词汇;获取所述目标词汇对应的候选词,对所获取到的每个候选词进行扩展,得到对应的修正词条,显示所述修正词条;接收用户基于所述修正词条发出的修正语音,根据所述修正语音选择对应的修正词条,用所选择的修正词条对应的候选词替换所述目标词汇,得到第二识别结果并进行显示。2.如权利要求1所述的基于语音识别的文本修正方法,其特征在于,所述对所获取到的每个候选词进行扩展,得到对应的修正词条,包括:获取每个所述候选词的评分,根据每个所述候选词的评分的大小对所有所述候选词进行排序,得到候选词序列;逐个生成所述候选词序列中每个所述候选词对应的多种扩展词条,其中,所述扩展词条包括候选词、所述候选词的相邻词及所述扩展词条对应的语言概率值;对每个所述候选词的多个扩展词条进行筛选,得到每个所述候选词的修正词条。3.如权利要求2所述的基于语音识别的文本修正方法,其特征在于,所述候选词的相邻词包括所述候选词的前缀词及所述候选词的后缀词,所述逐个生成所述候选词序列中每个所述候选词对应的多种扩展词条,包括:在预设的语言模型包含的词语表中,查找包含所述候选词的文本组合;在所述文本组合中,将所述候选词左侧的文本标识为所述候选词的前缀词;或将所述候选词右侧的文本标识为所述候选词的后缀词;计算每个所述文本组合在所述词语表中的出现频率作为语言概率值,并将所述语言概率值添加到对应的文本组合中;选取大于预设的概率阈值的语言概率值作为目标语言概率值,将所述目标语言概率值对应的文本组合作为所述候选词的扩展词条。4.如权利要求2所述的基于语音识别的文本修正方法,其特征在于,所述对每个所述候选词的多个扩展词条进行筛选,得到每个所述候选词的修正词条,包括:选取所述候选词序列中第一个候选词对应的语言概率值最大的扩展词条为基准词条,并将所述基准词条作为所述第一个候选词的修正词条;逐个从所述候选词序列中剩余的每个候选词对应的扩展词条中,选取前缀词与所述基准词条的前缀词发音不同,后缀词与所述基准词条的后缀词发音不同,且所述语言概率值相对最大的扩展词条作为剩余的每个所述候选词对应的修正词条。5.如权利要求1所述的基于语音识别...
【专利技术属性】
技术研发人员:黄石磊,程刚,陈诚,吕少岭,廖晨,
申请(专利权)人:深圳市北科瑞声科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。