语音识别结果的处理方法、装置、电子设备和存储介质制造方法及图纸

技术编号:29616841 阅读:28 留言:0更新日期:2021-08-10 18:35
本公开提供一种语音识别结果的处理方法、装置、电子设备和存储介质。该方法的一具体实施方式包括:根据目标文本和相应的目标音频,确定目标文本中每个文字对应的至少一个读音,其中,目标文本通过对目标音频进行语音识别得到;根据目标文本中每个文字对应的至少一个读音,确定目标文本中是否存在与预设词语的读音一致的目标内容;在确定目标文本中存在目标内容的情况下,将目标内容修改为预设词语。该实施方式能够提高音字对齐的准确度,进而提高语音识别文本纠错的准确度。

【技术实现步骤摘要】
语音识别结果的处理方法、装置、电子设备和存储介质
本公开的实施例涉及语音识别
,具体涉及语音识别结果的处理方法、装置、电子设备和存储介质。
技术介绍
语音识别技术(AutomaticSpeechRecognition,ASR)是利用超大规模语言模式识别以及自主学习技术,预测对话语境,对各类业务生成的声音信号做集中的分析处理,实现高效的语音转写文字服务。语音识别出的文本通常会存在错误,需要对其进行纠正。例如,对于一些专有名词,如人名及专业术语,识别难度较大,错误率较高,常会映射成一些常用词,需要将其纠正为专有名词。现有技术中的纠错方式存在准确率不高的问题。因此,有必要提出一种新的对语音识别结果进行处理的技术方案。
技术实现思路
本公开的实施例提出了语音识别结果的处理方法、装置、电子设备和存储介质。第一方面,本公开提供了一种语音识别结果的处理方法,包括:根据目标文本和相应的目标音频,确定目标文本中每个文字对应的至少一个读音,其中,目标文本通过对目标音频进行语音识别得到;根据目标文本中每个文字对应的至少一个读音,确定目标文本中是否存在与预设词语的读音一致的目标内容;在确定目标文本中存在目标内容的情况下,将目标内容修改为预设词语。在一些可选的实施方式中,根据目标文本和相应的目标音频,确定目标文本中每个文字对应的至少一个读音,包括:将目标文本和目标音频输入预先训练的第一机器学习模型,得到目标文本中每个文字对应的至少一个读音。在一些可选的实施方式中,在目标文本中存在目标内容的情况下,将目标内容修改为预设词语,包括:根据目标内容、预设词语以及目标内容在目标文本中的相关内容,确定是否需要对目标内容进行修改;在确定需要对目标内容进行修改的情况下,将目标内容修改为预设词语。在一些可选的实施方式中,根据目标内容、预设词语以及目标内容在目标文本中的相关内容,确定是否需要对目标内容进行修改,包括:将目标内容、预设词语以及目标内容在目标文本中的相关内容输入预先训练的第二机器学习模型,得到是否需要对目标内容进行修改的判断结果。在一些可选的实施方式中,根据目标文本中每个文字对应的至少一个读音,确定目标文本中是否存在与预设词语的读音一致的目标内容,包括:确定预设词语的频次等级,其中,频次等级表示预设词语在目标文本中的出现频次或者出现概率的高低;在预设词语的频次等级为第一等级的情况下,根据目标文本中每个文字对应的第一预设数目的读音,确定目标文本中是否存在与预设词语的读音一致的目标内容;在预设词语的频次等级为第二等级的情况下,根据目标文本中每个文字对应的第二预设数目的读音,确定目标文本中是否存在与预设词语的读音一致的目标内容;其中,第一等级高于第二等级,第一预设数目大于第二预设数目。在一些可选的实施方式中,预设词语来自于预设词语集,预设词语集中词语的读音通过字典树方式存储。在一些可选的实施方式中,目标音频为目标会议的音频,预设词语为目标会议对应的热词。第二方面,本公开提供了一种语音识别结果的处理装置,包括:音字对齐单元,用于将目标文本和相应的目标音频输入预先训练的第一机器学习模型,得到目标文本中每个文字对应的至少一个读音,其中,目标文本通过对目标音频进行语音识别得到;匹配单元,用于根据目标文本中每个文字对应的至少一个读音,确定目标文本中是否存在与预设词语的读音一致的目标内容;修改单元,用于在目标文本中存在目标内容的情况下,将目标内容修改为预设词语。在一些可选的实施方式中,音字对齐单元进一步用于:将目标文本和目标音频输入预先训练的第一机器学习模型,得到目标文本中每个文字对应的至少一个读音。在一些可选的实施方式中,修改单元进一步用于:根据目标内容、预设词语以及目标内容在目标文本中的相关内容,确定是否需要对目标内容进行修改;在确定需要对目标内容进行修改的情况下,将目标内容修改为预设词语。在一些可选的实施方式中,修改单元进一步用于:将目标内容、预设词语以及目标内容在目标文本中的相关内容输入预先训练的第二机器学习模型,得到是否需要对目标内容进行修改的判断结果。在一些可选的实施方式中,匹配单元进一步用于:确定预设词语的频次等级,其中,频次等级表示预设词语在目标文本中的出现频次或者出现概率的高低;在预设词语的频次等级为第一等级的情况下,根据目标文本中每个文字对应的第一预设数目的读音,确定目标文本中是否存在与预设词语的读音一致的目标内容;在预设词语的频次等级为第二等级的情况下,根据目标文本中每个文字对应的第二预设数目的读音,确定目标文本中是否存在与预设词语的读音一致的目标内容;其中,第一等级高于第二等级,第一预设数目大于第二预设数目。在一些可选的实施方式中,预设词语来自于预设词语集,预设词语集中词语的读音通过字典树方式存储。在一些可选的实施方式中,目标音频为目标会议的音频,预设词语为目标会议对应的热词。第三方面,本公开提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现如本公开第一方面任一实施方式描述的方法。第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,计算机程序被一个或多个处理器执行时实现如本公开第一方面任一实施方式描述的方法。本公开的实施例提供的语音识别结果的处理方法、装置、电子设备和存储介质,根据目标文本和相应的目标音频确定目标文本中文字对应的读音,能够更准确地获得目标文本中文字的读音,在此基础上结合预设词语进行纠错,能够提高语音识别文本纠错的准确度。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显。附图仅用于示出具体实施方式的目的,而并不认为是对本专利技术的限制。在附图中:图1是根据本公开的语音识别结果处理系统的一个实施例的系统架构图;图2是根据本公开的语音识别结果处理方法的一个实施例的流程图;图3是根据本公开的读音匹配步骤的一个实施例的分解流程图;图4是根据本公开的语音识别结果处理装置的一个实施例的结构示意图;图5是适于用来实现本公开的实施例的电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。图1示出了可以应用本公开的语音识别结果处理方本文档来自技高网...

【技术保护点】
1.一种语音识别结果的处理方法,包括:/n根据目标文本和相应的目标音频,确定所述目标文本中每个文字对应的至少一个读音,其中,所述目标文本通过对所述目标音频进行语音识别得到;/n根据所述目标文本中每个文字对应的至少一个读音,确定所述目标文本中是否存在与预设词语的读音一致的目标内容;/n在确定所述目标文本中存在所述目标内容的情况下,将所述目标内容修改为所述预设词语。/n

【技术特征摘要】
1.一种语音识别结果的处理方法,包括:
根据目标文本和相应的目标音频,确定所述目标文本中每个文字对应的至少一个读音,其中,所述目标文本通过对所述目标音频进行语音识别得到;
根据所述目标文本中每个文字对应的至少一个读音,确定所述目标文本中是否存在与预设词语的读音一致的目标内容;
在确定所述目标文本中存在所述目标内容的情况下,将所述目标内容修改为所述预设词语。


2.根据权利要求1所述的方法,其中,所述根据目标文本和相应的目标音频,确定所述目标文本中每个文字对应的至少一个读音,包括:
将所述目标文本和所述目标音频输入预先训练的第一机器学习模型,得到所述目标文本中每个文字对应的至少一个读音。


3.根据权利要求1所述的方法,其中,所述在所述目标文本中存在所述目标内容的情况下,将所述目标内容修改为所述预设词语,包括:
根据所述目标内容、所述预设词语以及所述目标内容在所述目标文本中的相关内容,确定是否需要对所述目标内容进行修改;
在确定需要对所述目标内容进行修改的情况下,将所述目标内容修改为所述预设词语。


4.根据权利要求3所述的方法,其中,所述根据所述目标内容、所述预设词语以及所述目标内容在所述目标文本中的相关内容,确定是否需要对所述目标内容进行修改,包括:
将所述目标内容、所述预设词语以及所述目标内容在所述目标文本中的相关内容输入预先训练的第二机器学习模型,得到是否需要对所述目标内容进行修改的判断结果。


5.根据权利要求1所述的方法,其中,所述根据所述目标文本中每个文字对应的至少一个读音,确定所述目标文本中是否存在与预设词语的读音一致的目标内容,包括:
确定所述预设词语的频次等级,其中,所述频次等级表示所述预设词语在所述目标文本中的出现...

【专利技术属性】
技术研发人员:王乾坤杜春赛姚佳立徐文铭杨晶生
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1