语音识别文本的纠错方法、装置、电子设备及存储介质制造方法及图纸

技术编号：24411025 阅读：27 留言：0更新日期：2020-06-06 09:12

本发明专利技术实施例涉及自然语言处理领域，公开了一种语音识别文本的纠错方法、装置、电子设备及存储介质。本发明专利技术中接收语音信息；识别语音信息对应的至少一个用户意图；根据识别的至少一个用户意图，在云端数据集中选取用户意图的所有数据作为个性化模糊数据集；结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错，通过用户的个性化用户意图在保证纠错准确性的同时减少纠错所需数据量，提高纠错效率。

Error correction method, device, electronic equipment and storage medium of speech recognition text

全部详细技术资料下载

【技术实现步骤摘要】
语音识别文本的纠错方法、装置、电子设备及存储介质
本专利技术实施例涉及自然语言处理领域，特别涉及一种语音识别文本的纠错方法、装置、电子设备及存储介质。
技术介绍
随着人工智能技术的发展，用户可以通过语音控制智能设备的工作。在通过语音控制智能设备时，为了使音箱等智能设备可以更加准确的识别用户的语音，从而更加准确的执行相应的动作，需要对识别到的用户的语音信息转换为文字，并对文字进行纠错。当前的文本纠错通常是利用云端数据集中的数据，通过语言模型检测错别字的位置，通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。在云端数据集中通常需要添加大量的数据，以保证语言模型可以准确的识别出文本中的错别字。专利技术人发现相关技术中至少存在如下问题：云端数据集中的数据的数量过大，会导致通过语言模型纠错时的纠错候选数据过多，从而降低纠错的效率。
技术实现思路
本专利技术实施例的目的在于提供一种语音识别文本的纠错方法、装置、电子设备及存储介质，通过用户的个性化用户意图在保证纠错准确性的同时减少纠错所需数据量，提高纠错效率。为解决上述技术问题，本专利技术的实施例提供了一种语音识别文本的纠错方法，包括：接收语音信息；识别语音信息对应的至少一个用户意图；根据识别的至少一个用户意图，在云端数据集中选取用户意图的所有数据作为个性化模糊数据集；结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错。本专利技术的实施例还提供了一种语音识别文本的纠错装置，包括：接收模块...

【技术保护点】
1.一种语音识别文本的纠错方法，其特征在于，包括：/n接收语音信息；/n识别所述语音信息对应的至少一个用户意图；/n根据所述识别的至少一个用户意图，在云端数据集中选取所述用户意图的所有数据作为个性化模糊数据集；/n结合所述个性化模糊数据集与预先设置的基础模糊数据集对根据所述语音信息所识别的文本进行纠错。/n

【技术特征摘要】
1.一种语音识别文本的纠错方法，其特征在于，包括：
接收语音信息；
识别所述语音信息对应的至少一个用户意图；
根据所述识别的至少一个用户意图，在云端数据集中选取所述用户意图的所有数据作为个性化模糊数据集；
结合所述个性化模糊数据集与预先设置的基础模糊数据集对根据所述语音信息所识别的文本进行纠错。

2.根据权利要求1所述的语音识别文本的纠错方法，其特征在于，所述识别所述语音信息对应的至少一个用户意图，包括：
识别所述语音信息的声纹特征；
根据所述声纹特征确定所述语音信息对应的用户信息；
获取所述用户信息对应的历史语音信息；
根据所述历史语音信息确定用户惯用的至少一个用户意图，并将所述用户惯用的至少一个用户意图作为所述语音信息对应的至少一个用户意图。

3.根据权利要求2所述的语音识别文本的纠错方法，其特征在于，所述根据所述历史语音信息确定用户惯用的至少一个用户意图，包括：
将所述历史语音信息对应的特征输入预先训练的神经网络模型；其中，所述神经网络模型利用各个用户意图的语音信息的特征进行训练，用于识别所述用户对所述各个用户意图的使用率；
所述特征值至少包括以下任一特征或其组合：历史语音信息中的各个用户意图对应的语音交互的总时间，历史语音信息中最近一次的语音信息对应的用户意图，用户的年龄或用户的性别；
根据所述神经网络模型的输出结果确定所述用户惯用的至少一个用户意图。

4.根据权利要求2或3所述的语音识别文本的纠错方法，其特征在于，在所述将所述用户惯用的至少一个用户意图作为所述语音信息对应的至少一个用户意图之前，还包括：
将所述语音信息转换为文本信息，并对所述文本信息进行意图的识别得到文本意图；
所述将所述用户惯用的至少一个用户意图作为所述语音信息对应的至少一个用户意图，包括：
若所述文本意图与所述用户惯用的至少一个用户意图中的任一用户意图相同，将所述用户惯用的至少一个用户意图作为所述语音信息对应的至少一个用户意图；
若所述文本意图与所述用户惯用的至少一个用户意图中的任一用户意图均不相同，将所述用户惯用的至少一个用户意图与所述文本意图共同作为所述语音信息对应的用户意图。

5.根据权利要求4所述的语音识别文本的纠错方法，其特征在于，所述对所述文本信息进行意图的识别得到...

【专利技术属性】
技术研发人员：章翔，孟越涛，张俊杰，罗红，荣玉军，
申请(专利权)人：中移杭州信息技术有限公司，中国移动通信集团有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人