语音识别的文本纠错方法、装置、设备及可读存储介质制造方法及图纸

技术编号:40948552 阅读:14 留言:0更新日期:2024-04-18 20:22
本发明专利技术涉及语音识别技术领域,公开了一种语音识别的文本纠错方法、装置、设备及可读存储介质。其中,该方法包括:获取识别垂直领域的预设语音信息所得到的文本信息;当文本信息存在待纠错文本信息时,基于预设纠错模型从文本信息中筛选出候选文本,该预设纠错模型基于文本之间的转移概率训练得到;基于候选文本与待纠错文本信息的相似度,从候选文本中确定出待纠错文本信息对应的目标文本。通过实施本发明专利技术,语音识别结果的纠错不受语料信息不足的限制,通过上下文之间的文本转移概率即可确定出目标文本,提高了语音纠错效果。

【技术实现步骤摘要】

本专利技术涉及语音识别,具体涉及一种语音识别的文本纠错方法、装置、设备及可读存储介质


技术介绍

1、语音识别作为一种基本的文本输入功能,最大程度上实现了语音输入,解放了用户的双手,但是现有的语音识别在垂直领域远没有在通用领域的识别效果好,其在垂直领域对往往存在一定的识别错误,这就会影响信息输入,需要进行文本信息纠错。目前对于语音识别结果的纠错方法基本采用深度学习,在大量的垂直领域语料上进行模型训练,再用训练结果去纠错。

2、但是,对于垂直领域而言,能够收集到的语料并不多,这就会导致数据量不足以训练深度学习模型,导致其纠错准确率较低,难以很好的解决语音识别结果的纠错。


技术实现思路

1、有鉴于此,本专利技术实施例提供了一种语音识别的文本纠错方法、装置、设备及可读存储介质,以解决语音识别的纠错准确率较差的问题。

2、根据第一方面,本专利技术实施例提供了一种语音识别的文本纠错方法,包括:获取识别垂直领域的预设语音信息所得到的文本信息;当所述文本信息存在待纠错文本信息时,基于预设纠错模型从所本文档来自技高网...

【技术保护点】

1.一种语音识别的文本纠错方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预设纠错模型从所述文本信息中筛选出候选文本,包括:

3.根据权利要求2所述的方法,其特征在于,所述第二语音与所述第一语音的声母相同,和/或,所述第二语音与所述第一语音的韵母相同;所述将所述第二语音对应的文本确定为所述候选文本,包括:

4.根据权利要求2所述的方法,其特征在于,所述基于预设纠错模型从所述文本信息中筛选出候选文本,还包括:

5.根据权利要求1所述的方法,其特征在于,判断所述文本信息是否存在所述待纠错文本信息,包括:

...

【技术特征摘要】

1.一种语音识别的文本纠错方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预设纠错模型从所述文本信息中筛选出候选文本,包括:

3.根据权利要求2所述的方法,其特征在于,所述第二语音与所述第一语音的声母相同,和/或,所述第二语音与所述第一语音的韵母相同;所述将所述第二语音对应的文本确定为所述候选文本,包括:

4.根据权利要求2所述的方法,其特征在于,所述基于预设纠错模型从所述文本信息中筛选出候选文本,还包括:

5.根据权利要求1所述的方法,其特征在于,判断所述文本信息是否存在所述待纠错文本信息,包括:...

【专利技术属性】
技术研发人员:付红雷田勇梁雄张波
申请(专利权)人:广联达科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1