语音识别的文本纠错方法、装置、设备及可读存储介质制造方法及图纸

技术编号：40948552 阅读：14 留言：0更新日期：2024-04-18 20:22

本发明专利技术涉及语音识别技术领域，公开了一种语音识别的文本纠错方法、装置、设备及可读存储介质。其中，该方法包括：获取识别垂直领域的预设语音信息所得到的文本信息；当文本信息存在待纠错文本信息时，基于预设纠错模型从文本信息中筛选出候选文本，该预设纠错模型基于文本之间的转移概率训练得到；基于候选文本与待纠错文本信息的相似度，从候选文本中确定出待纠错文本信息对应的目标文本。通过实施本发明专利技术，语音识别结果的纠错不受语料信息不足的限制，通过上下文之间的文本转移概率即可确定出目标文本，提高了语音纠错效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别，具体涉及一种语音识别的文本纠错方法、装置、设备及可读存储介质。

技术介绍

1、语音识别作为一种基本的文本输入功能，最大程度上实现了语音输入，解放了用户的双手，但是现有的语音识别在垂直领域远没有在通用领域的识别效果好，其在垂直领域对往往存在一定的识别错误，这就会影响信息输入，需要进行文本信息纠错。目前对于语音识别结果的纠错方法基本采用深度学习，在大量的垂直领域语料上进行模型训练，再用训练结果去纠错。

2、但是，对于垂直领域而言，能够收集到的语料并不多，这就会导致数据量不足以训练深度学习模型，导致其纠错准确率较低，难以很好的解决语音识别结果的纠错。

技术实现思路

1、有鉴于此，本专利技术实施例提供了一种语音识别的文本纠错方法、装置、设备及可读存储介质，以解决语音识别的纠错准确率较差的问题。

2、根据第一方面，本专利技术实施例提供了一种语音识别的文本纠错方法，包括：获取识别垂直领域的预设语音信息所得到的文本信息；当所述文本信息存在待纠错文本信息时，...

【技术保护点】

1.一种语音识别的文本纠错方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于预设纠错模型从所述文本信息中筛选出候选文本，包括：

3.根据权利要求2所述的方法，其特征在于，所述第二语音与所述第一语音的声母相同，和/或，所述第二语音与所述第一语音的韵母相同；所述将所述第二语音对应的文本确定为所述候选文本，包括：

4.根据权利要求2所述的方法，其特征在于，所述基于预设纠错模型从所述文本信息中筛选出候选文本，还包括：

5.根据权利要求1所述的方法，其特征在于，判断所述文本信息是否存在所述待纠错文本信息，包括：

...

【技术特征摘要】

1.一种语音识别的文本纠错方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于预设纠错模型从所述文本信息中筛选出候选文本，包括：

4.根据权利要求2所述的方法，其特征在于，所述基于预设纠错模型从所述文本信息中筛选出候选文本，还包括：

5.根据权利要求1所述的方法，其特征在于，判断所述文本信息是否存在所述待纠错文本信息，包括：...

【专利技术属性】
技术研发人员：付红雷，田勇，梁雄，张波，
申请(专利权)人：广联达科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人