一种纠正语音识别中多音字的方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37775491 阅读:18 留言:0更新日期:2023-06-06 13:46
本发明专利技术实施例提供了一种纠正语音识别中多音字的方法、装置、电子设备和存储介质,涉及语音识别领域。所述纠正语音识别中多音字的方法包括:获取自动语音识别得到的第一文本;若所述第一文本中含有错误多音字和辅助关键词,则根据所述第一文本中的辅助关键词判断所述第一文本中的错误多音字是否需要替换,若是,则用与所述错误多音字对应的正确多音字替换所述第一文本中的错误多音字,得到第二文本。应用在车机中,达到纠正语音识别中错误多音字的目的。的目的。的目的。

【技术实现步骤摘要】
一种纠正语音识别中多音字的方法、装置、电子设备和存储介质


[0001]本专利技术涉及语音识别领域,提供一种纠正语音识别中多音字的方法、装置、电子设备和存储介质。

技术介绍

[0002]随着技术的发展,自动语音识别技术(ASR)已经广泛应用到了车机中,使得驾驶员和乘客通过语音即可实现车机的相关功能,而无需在车机面板上进行操作,提高了便利性和行车安全性。
[0003]目前,在车机ASR识别中文内容时,由于中文有很多多音字,不同的多音字用法不同,词性也往往不同,在不同场景里,需要识别出不同的字,然而现有的车机ASR在语音识别时无法分辨。

技术实现思路

[0004]本专利技术实施例提供一种纠正语音识别中多音字的方法、装置、电子设备和存储介质,以对语音识别中的错误多音字进行纠正,解决车机语音识别中无法准确识别多音字的问题。
[0005]为了解决上述问题,第一方面,本专利技术实施例公开了一种纠正语音识别中多音字的方法,包括:
[0006]获取自动语音识别得到的第一文本;
[0007]若所述第一文本中含有错误多音字和辅助关键词,则根据所述第一文本中的辅助关键词判断所述第一文本中的错误多音字是否需要替换,若是,则用与所述错误多音字对应的正确多音字替换所述第一文本中的错误多音字,得到第二文本。
[0008]可选的,每个所述辅助关键词都设置了对应的类,当所述第一文本中的错误多音字属于所述第一文本中的辅助关键词对应的类时,确定所述第一文本中的错误多音字需要替换。
[0009]可选的,所述方法还包括:
[0010]根据所述第一文本中的辅助关键词对应的类,确定所述第一文本中的错误多音字对应的正确多音字。
[0011]可选的,所述错误多音字、所述辅助关键词以及所述错误多音字对应的正确多音字都是预先定制的,保存在配置库中并且可以更新。
[0012]可选的,所述方法还包括配置式,所述配置式为:以等号和大于号为分隔符,等号前面是所述第一文本中的一个错误多音字,所述等号和所述大于号中间是所述辅助判断词,所述大于号后面是所述等号前面的错误多音字对应的正确多音字。
[0013]可选的,所述方法还包括:
[0014]将所述第二文本发送给车机系统,以供所述车机系统执行与所述第二文本对应的
任务以及显示所述第二文本。
[0015]第二方面,本专利技术实施例还包括一种纠正语音识别中多音字的装置,包括:
[0016]数据获取模块,用于获取自动语音识别得到的第一文本;
[0017]数据处理模块,用于对所述第一文本进行处理,包括:若所述第一文本中含有错误多音字和辅助关键词,则根据所述第一文本中的辅助关键词判断所述第一文本中的错误多音字是否需要替换,若是,则用与所述错误多音字对应的正确多音字替换所述第一文本中的错误多音字,得到第二文本。
[0018]可选的,所述错误多音字、所述辅助关键词以及所述错误多音字对应的正确多音字都是预先定制的,保存在配置库中并且可以更新。
[0019]第三方面,本专利技术实施例还公开了一种电子设备,包括:
[0020]至少一个处理器;以及,
[0021]与所述至少一个处理器通信连接的存储器;其中,
[0022]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行以上所述的纠正语音识别中多音字的方法。
[0023]第四方面,本专利技术还公开了一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的纠正语音识别中多音字的测方法。
[0024]本专利技术实施例包括以下优点:
[0025]本专利技术实施例通过获取自动语音识别得到的第一文本,并根据所述第一文本中的辅助关键词判断所述第一文本中的错误多音字是否需要替换,若是,则用与所述错误多音字对应的正确多音字替换所述第一文本中的错误多音字,得到第二文本,即纠正错误多音字之后的文本,实现了车机自动语音识别中对错误多音字的纠正,极大地提高了用户体验。
附图说明
[0026]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]图1是本专利技术的一个实施方式提供的纠正语音识别中多音字的方法流程图一;
[0028]图2是本专利技术的一个实施方式提供的纠正语音识别中多音字的方法流程图二;
[0029]图3是本专利技术的另一个实施方式提供的纠正语音识别中多音字的装置示意图;
[0030]图4是本专利技术的再一个实施方式提供的纠正语音识别中多音字的系统示意图;
[0031]图5是本专利技术的再一个实施方式提供的电子设备示意图。
具体实施方式
[0032]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0033]本专利技术的一个实施方式涉及一种纠正语音识别中多音字的方法,应用在车机中,其流程如图1所示,包括:
[0034]步骤110,获取自动语音识别得到的第一文本。
[0035]在本实施方式中,第一文本是经过车机自动语音识别得到的初始文本,其中可能包含有错误多音字。示例地,当用户说出“我想听杨宗纬的歌”时,经过车机自动语音识别可能识别为“我想听杨宗伟的歌”,此时该文本为第一文本。第一文本仅作为初始文本,不会立即生效,也不会在车机的显示装置上进行显示,而是等待下一步处理。
[0036]步骤120,若第一文本中含有错误多音字和辅助关键词,则根据第一文本中的辅助关键词判断第一文本中的错误多音字是否需要替换,若是,则用与错误多音字对应的正确多音字替换第一文本中的错误多音字,得到第二文本。
[0037]在本实施方式中,当获取第一文本后,立即对第一文本进行处理。首先判断第一文本中是否含有错误多音字和辅助关键词,示例地,第一文本为“我想听杨宗伟的歌”,此时可以检测到“我要听”和“歌”两个辅助关键词,以及错误多音字“杨宗伟”中的“伟”。然后根据检测到的辅助关键词判断第一文本中的错误多音字是否需要替换,示例地,通过“我要听”和“歌”两个辅助关键词可以确定第一文本中的“伟”字不符合当前场景,应当替换为“纬”。最后,根据对错误多音字的判断结果,将第一文本中的“伟”替换为“纬”,得到第二文本,即纠正多音字之后的文本,其内容为“我想听杨宗纬的歌”。此时,第二文本作为处理后的文本,可以用于执行相应的功能,并在车机显示装置中进行显示。
[0038]本专利技术实施方式通过获取车机自动语音识别得到的第一文本,并根本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种纠正语音识别中多音字的方法,应用在车机中,其特征在于,包括:获取自动语音识别得到的第一文本;若所述第一文本中含有错误多音字和辅助关键词,则根据所述第一文本中的辅助关键词判断所述第一文本中的错误多音字是否需要替换,若是,则用与所述错误多音字对应的正确多音字替换所述第一文本中的错误多音字,得到第二文本。2.根据权利要求1所述的方法,其特征在于,每个所述辅助关键词都设置了对应的类,当所述第一文本中的错误多音字属于所述第一文本中的辅助关键词对应的类时,确定所述第一文本中的错误多音字需要替换。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据所述第一文本中的辅助关键词对应的类,确定所述第一文本中的错误多音字对应的正确多音字。4.根据权利要求1所述的方法,其特征在于,所述错误多音字、所述辅助关键词以及所述错误多音字对应的正确多音字都是预先定制的,保存在配置库中并且可以更新。5.根据权利要求1所述的方法,其特征在于,所述方法还包括配置式,所述配置式为:以等号和大于号为分隔符,等号前面是所述第一文本中的一个错误多音字,所述等号和所述大于号中间是所述辅助判断词,所述大于号后面是所述等号前面的错误多音字对应的正确多音字。6.根据权利要求1所述的方...

【专利技术属性】
技术研发人员:徐国祯
申请(专利权)人:博泰车联网南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1