语音识别文本的纠错方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24411025 阅读:27 留言:0更新日期:2020-06-06 09:12
本发明专利技术实施例涉及自然语言处理领域,公开了一种语音识别文本的纠错方法、装置、电子设备及存储介质。本发明专利技术中接收语音信息;识别语音信息对应的至少一个用户意图;根据识别的至少一个用户意图,在云端数据集中选取用户意图的所有数据作为个性化模糊数据集;结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错,通过用户的个性化用户意图在保证纠错准确性的同时减少纠错所需数据量,提高纠错效率。

Error correction method, device, electronic equipment and storage medium of speech recognition text

【技术实现步骤摘要】
语音识别文本的纠错方法、装置、电子设备及存储介质
本专利技术实施例涉及自然语言处理领域,特别涉及一种语音识别文本的纠错方法、装置、电子设备及存储介质。
技术介绍
随着人工智能技术的发展,用户可以通过语音控制智能设备的工作。在通过语音控制智能设备时,为了使音箱等智能设备可以更加准确的识别用户的语音,从而更加准确的执行相应的动作,需要对识别到的用户的语音信息转换为文字,并对文字进行纠错。当前的文本纠错通常是利用云端数据集中的数据,通过语言模型检测错别字的位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。在云端数据集中通常需要添加大量的数据,以保证语言模型可以准确的识别出文本中的错别字。专利技术人发现相关技术中至少存在如下问题:云端数据集中的数据的数量过大,会导致通过语言模型纠错时的纠错候选数据过多,从而降低纠错的效率。
技术实现思路
本专利技术实施例的目的在于提供一种语音识别文本的纠错方法、装置、电子设备及存储介质,通过用户的个性化用户意图在保证纠错准确性的同时减少纠错所需数据量,提高纠错效率。为解决上述技术问题,本专利技术的实施例提供了一种语音识别文本的纠错方法,包括:接收语音信息;识别语音信息对应的至少一个用户意图;根据识别的至少一个用户意图,在云端数据集中选取用户意图的所有数据作为个性化模糊数据集;结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错。本专利技术的实施例还提供了一种语音识别文本的纠错装置,包括:接收模块,识别模块,选取模块,纠错模块;接收模块用于接收语音信息;识别模块用于识别语音信息对应的至少一个用户意图;选取模块用于根据识别的至少一个用户意图,在云端数据集中选取用户意图的所有数据作为个性化模糊数据集;纠错模块用于结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错。本专利技术的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行语音识别文本的纠错方法。本专利技术的实施方式还提供了一种存储介质,存储有计算机程序,计算机程序被处理器执行时上述的语音识别文本的纠错方法。本专利技术实施例相对于现有技术而言,接收语音信息,通过对语音信息的识别确定语音信息中表达的用户意图,比如接收到的语音信息所表达的是听歌的意图或是播报天气的意图,并利用用户意图对云端数据集中的数据进行筛选,筛选出本次纠错过程可能会用到的数据,即将云端数据集中与识别的用户意图具有相同意图的数据提取作为个性化模糊数据集,结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错,从而利用语音信息中包含的用户的个性化用户意图减少了纠错过程中所用到的数据的数量,提高了纠错的效率。另由于设置的基础模糊数据集中包含有同音词,谐音词等基本混淆词语,结合预设的基础模糊数据集可以保证纠错的准确性。另外,识别语音信息对应的至少一个用户意图,包括:识别语音信息的声纹特征;根据声纹特征确定语音信息对应的用户信息;获取用户信息对应的历史语音信息;根据历史语音信息确定用户惯用的至少一个用户意图,并将用户惯用的至少一个用户意图作为语音信息对应的至少一个用户意图。这样做可以通过用户的历史语音信息推测出该用户的惯用的用户意图,从而可以更加准确的确定用户的个性化行为。另外,根据历史语音信息确定用户惯用的至少一个用户意图,包括:将历史语音信息对应的特征输入预先训练的神经网络模型;其中,神经网络模型利用各个用户意图的语音信息的特征进行训练,用于识别用户对各个用户意图的使用率;特征值至少包括以下任一特征或其组合:历史语音信息中的各个用户意图对应的语音交互的总时间,历史语音信息中最近一次的语音信息对应的用户意图,用户的年龄或用户的性别;根据神经网络模型的输出结果确定用户惯用的至少一个用户意图。另外,在将用户惯用的至少一个用户意图作为语音信息对应的至少一个用户意图之前,还包括:将语音信息转换为文本信息,并对文本信息进行意图的识别得到文本意图;将用户惯用的至少一个用户意图作为语音信息对应的至少一个用户意图,包括:若文本意图与用户惯用的至少一个用户意图中的任一用户意图相同,将用户惯用的至少一个用户意图作为语音信息对应的至少一个用户意图;若文本意图与用户惯用的至少一个用户意图中的任一用户意图均不相同,将用户惯用的至少一个用户意图与文本意图共同作为语音信息对应的用户意图。另外,对文本信息进行意图的识别得到文本意图,包括:通过词嵌入方法将文本信息转换为向量矩阵;将向量矩阵输入预先训练的文本分类模型;根据文本分类模型输出的结果得到文本意图。通过当前接收的语音信息识别的文本信息确定文本意图,从而可以使确定的个性化模糊数据集中包含满足当前语音信息的个性化数据,从而使语音识别文本的纠错更加精确。另外,结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错,包括:根据个性化模糊数据集和预先设置的基础模糊数据集对语音信息所识别的文本中出现错误词语的位置进行定位;在个性化模糊数据集和预先设置的基础模糊数据集中选择错误词语的至少一个替换词;通过语言模型分别对至少一个替换词的混淆度得分进行计算;利用混淆度得分小于第一预设阈值的替换词对语音信息所识别的文本进行纠错。另外,对语音信息所识别的文本中出现错误词语的位置进行定位,包括:对语音信息所识别的文本进行划分,划分为不同的词段;根据文本中各个词段之间的相关性,分别计算各个词段为错误词段的概率;将概率大于第二预设阈值的错误词段作为错误词语,并将错误词段处于文本中的位置作为文本中出现错误词语的位置。附图说明一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。图1是根据本专利技术第一实施例中的语音识别文本的纠错方法的流程图;图2是根据本专利技术第二实施例中的语音识别文本的纠错方法的流程图;图3是根据本专利技术第三实施例中的语音识别文本的纠错装置的结构示意图;图4是根据本专利技术第四实施例中的电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的各实施例进行详细的阐述。然而,本领域的普通技术人员可以理解,在本专利技术各实施例中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施例的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本专利技术的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。本专利技术的第一实施例涉及一种语音识别文本的纠错方法,包括:接收语音信息;识别语音信息对应的至少一个用户意图;根据识别的至少一个用户意图,在云端数据集中选取用户意图的所有数据作为个性化模糊数据集;结合个本文档来自技高网...

【技术保护点】
1.一种语音识别文本的纠错方法,其特征在于,包括:/n接收语音信息;/n识别所述语音信息对应的至少一个用户意图;/n根据所述识别的至少一个用户意图,在云端数据集中选取所述用户意图的所有数据作为个性化模糊数据集;/n结合所述个性化模糊数据集与预先设置的基础模糊数据集对根据所述语音信息所识别的文本进行纠错。/n

【技术特征摘要】
1.一种语音识别文本的纠错方法,其特征在于,包括:
接收语音信息;
识别所述语音信息对应的至少一个用户意图;
根据所述识别的至少一个用户意图,在云端数据集中选取所述用户意图的所有数据作为个性化模糊数据集;
结合所述个性化模糊数据集与预先设置的基础模糊数据集对根据所述语音信息所识别的文本进行纠错。


2.根据权利要求1所述的语音识别文本的纠错方法,其特征在于,所述识别所述语音信息对应的至少一个用户意图,包括:
识别所述语音信息的声纹特征;
根据所述声纹特征确定所述语音信息对应的用户信息;
获取所述用户信息对应的历史语音信息;
根据所述历史语音信息确定用户惯用的至少一个用户意图,并将所述用户惯用的至少一个用户意图作为所述语音信息对应的至少一个用户意图。


3.根据权利要求2所述的语音识别文本的纠错方法,其特征在于,所述根据所述历史语音信息确定用户惯用的至少一个用户意图,包括:
将所述历史语音信息对应的特征输入预先训练的神经网络模型;其中,所述神经网络模型利用各个用户意图的语音信息的特征进行训练,用于识别所述用户对所述各个用户意图的使用率;
所述特征值至少包括以下任一特征或其组合:历史语音信息中的各个用户意图对应的语音交互的总时间,历史语音信息中最近一次的语音信息对应的用户意图,用户的年龄或用户的性别;
根据所述神经网络模型的输出结果确定所述用户惯用的至少一个用户意图。


4.根据权利要求2或3所述的语音识别文本的纠错方法,其特征在于,在所述将所述用户惯用的至少一个用户意图作为所述语音信息对应的至少一个用户意图之前,还包括:
将所述语音信息转换为文本信息,并对所述文本信息进行意图的识别得到文本意图;
所述将所述用户惯用的至少一个用户意图作为所述语音信息对应的至少一个用户意图,包括:
若所述文本意图与所述用户惯用的至少一个用户意图中的任一用户意图相同,将所述用户惯用的至少一个用户意图作为所述语音信息对应的至少一个用户意图;
若所述文本意图与所述用户惯用的至少一个用户意图中的任一用户意图均不相同,将所述用户惯用的至少一个用户意图与所述文本意图共同作为所述语音信息对应的用户意图。


5.根据权利要求4所述的语音识别文本的纠错方法,其特征在于,所述对所述文本信息进行意图的识别得到...

【专利技术属性】
技术研发人员:章翔孟越涛张俊杰罗红荣玉军
申请(专利权)人:中移杭州信息技术有限公司中国移动通信集团有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1