语音的处理方法和装置制造方法及图纸

技术编号:27099090 阅读:15 留言:0更新日期:2021-01-25 18:40
本申请公开了一种语音的处理方法,包括:获取原始语音数据;对原始语音数据进行预识别,以获得预识别文本;通过领域场景分类器模型对预识别文本进行处理,以获得预识别文本所属的领域场景信息;通过与领域场景信息对应的领域场景语言模型对预识别结果进行二次识别,以获得最终识别文本;对最终识别文本进行正确性修正和领域场景信息标注,以获得修正后文本;根据领域场景信息,将修正后文本加入到相应的领域场景语言模型的文本数据库中;对领域场景语言模型进行更新;将修正后文本加入到领域场景分类器模型的训练数据库中;对领域场景分类器模型进行迭代训练。能够使得语音识别模型与具体的应用领域场景更有效的匹配,提高语音识别的准确性。音识别的准确性。音识别的准确性。

【技术实现步骤摘要】
语音的处理方法和装置


[0001]本申请属于语音识别
,具体涉及一种语音的处理方法和装置。

技术介绍

[0002]现有技术中,语音识别系统主要包含声学模型和语言模型两部分,声学模型负责将语音信号加窗分帧、提取特征,之后转化为每帧对应的音素状态得分;语言模型主要负责对可能存在的多种音素序列,找到与音素状态序列最匹配的文本序列。通常情况下,选用不同的语言模型最终得到的语音识别文本是有差异的。
[0003]但是在实现本申请过程中,专利技术人发现,目前至少存在以下问题:一般来说,现有技术会选取构建一个通用的语言模型,由于不同领域场景的语言模型在话题、词频和风格上有着较大的差异,通用的语言模型与实际应用需求之间的匹配度往往不高,导致不能有效的降低语音识别系统的识别错误率。

技术实现思路

[0004]本申请实施例的目的是提供语音的处理方法和装置,能够解决目前的由于不同领域场景的语言模型在话题、词频和风格上有着较大的差异,通用的语言模型与实际应用需求之间的匹配度往往不高,导致不能有效的降低语音识别系统的识别错误率的技术问题。
[0005]为了解决上述技术问题,本申请是这样实现的:第一方面,本申请实施例提供了一种语音的处理方法,包括:获取原始语音数据;对所述原始语音数据进行预识别,以获得预识别文本;通过领域场景分类器模型对所述预识别文本进行处理,以获得所述预识别文本所属的领域场景信息;通过与所述领域场景信息对应的领域场景语言模型对所述预识别结果进行二次识别,以获得最终识别文本;对所述最终识别文本进行正确性修正和领域场景信息标注,以获得修正后文本;根据所述领域场景信息,将所述修正后文本加入到相应的所述领域场景语言模型的文本数据库中;对所述领域场景语言模型进行更新;将所述修正后文本加入到领域场景分类器模型的训练数据库中;对所述领域场景分类器模型进行迭代训练。
[0006]进一步地,所述对所述领域场景语言模型进行更新,具体为:定时对所述领域场景语言模型进行更新,或者,在加入到所述文本数据库中的文本数量大于第一预设值的情况下,对所述领域场景语言模型进行更新。
[0007]进一步地,所述对所述领域场景分类器模型进行迭代训练,具体为:
定时对所述领域场景分类器模型进行迭代训练,或者,在加入到所述训练数据库中的文本数量大于第二预设值的情况下,对所述领域场景分类器模型进行迭代训练。
[0008]进一步地,所述对所述领域场景分类器模型进行迭代训练,具体为:在bert预训练模型上利用所述修正后文本与所述领域场景信息对所述领域场景分类器模型进行微调。
[0009]进一步地,所述领域场景分类器模型由对textcnn模型或者fasttext模型进行训练生成;所述领域场景语言模型由对N-gram模型或者神经网络进行训练生成。
[0010]第二方面,本申请实施例提供了一种语音的处理装置,其特征在于,包括:获取模块,用于获取原始语音数据;预识别模块,用于对所述原始语音数据进行预识别,以获得预识别文本;分类模块,用于通过领域场景分类器模型对所述预识别文本进行处理,以获得所述预识别文本所属的领域场景信息;二次识别模块,用于通过与所述领域场景信息对应的领域场景语言模型对所述预识别结果进行二次识别,以获得最终识别文本;修正模块,用于对所述最终识别文本进行正确性修正和领域场景信息标注,以获得修正后文本;第一加入模块,用于根据所述领域场景信息,将所述修正后文本加入到相应的所述领域场景语言模型的文本数据库中;更新模块,用于对所述领域场景语言模型进行更新;第二加入模块,用于将所述修正后文本加入到领域场景分类器模型的训练数据库中;迭代模块,用于对所述领域场景分类器模型进行迭代训练。
[0011]进一步地,所述更新模块具体用于定时对所述领域场景语言模型进行更新,或者,在加入到所述文本数据库中的文本数量大于第一预设值的情况下,对所述领域场景语言模型进行更新。
[0012]进一步地,所述迭代模块,具体用于定时对所述领域场景分类器模型进行迭代训练,或者,在加入到所述训练数据库中的文本数量大于第二预设值的情况下,对所述领域场景分类器模型进行迭代训练。
[0013]进一步地,所述迭代模块,具体用于在bert预训练模型上利用所述修正后文本与所述领域场景信息对所述领域场景分类器模型进行微调。
[0014]进一步地,所述领域场景分类器模型由对textcnn模型或者fasttext模型进行训练生成;所述领域场景语言模型由对N-gram模型或者神经网络进行训练生成。
[0015]在本申请实施例中,通过对领域场景语言模型的自动更新和对领域场景分类器模型的自动迭代训练,能够使得语音识别模型与具体的应用领域场景更有效的匹配,从而进一步提高语音识别的准确性。
附图说明
[0016]图1是本申请实施例提供的一种语音的处理方法的流程示意图;图2是本申请实施例提供的另一种语音的处理方法的流程示意图;
图3是本申请实施例提供的一种语音的处理装置的结构示意图。
[0017]附图标记说明:201-原始语音数据、202-全领域语言模型、203-预识别文本、204-领域场景分类器模型、205-领域场景信息、206-领域场景语言模型、207-最终识别文本、208-标注平台、209-修正后文本、30-装置、301-获取模块、302-预识别模块、303-分类模块、304-二次识别模块、305-修正模块、306-第一加入模块、307-更新模块、308-第二加入模块、309-迭代模块。
[0018]本专利技术目的的实现、功能特点及优点将结合实施例、参照附图做进一步说明。
[0019]具体实施方式
[0020]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域场景普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0021]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。
[0022]下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的语音处理方法进行详细地说明。
[0023]实施例一参照图1,示出了本申请实施例提供的一种语音的处理方法的流程示意图,参照图2,示出了本申请实施例提供的另一种语音的处理方法的流程示意图,语音的处理方法包括:S101:获取原始语音数据201。
[0024]具体地,可以通过用户的上传获取原始语音数据201,也可以通过现场采集的方式的获取原始语音数据201,本申请实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音的处理方法,其特征在于,包括:获取原始语音数据;对所述原始语音数据进行预识别,以获得预识别文本;通过领域场景分类器模型对所述预识别文本进行处理,以获得所述预识别文本所属的领域场景信息;通过与所述领域场景信息对应的领域场景语言模型对所述预识别结果进行二次识别,以获得最终识别文本;对所述最终识别文本进行正确性修正和领域场景信息标注,以获得修正后文本;根据所述领域场景信息,将所述修正后文本加入到相应的所述领域场景语言模型的文本数据库中;对所述领域场景语言模型进行更新;将所述修正后文本加入到领域场景分类器模型的训练数据库中;对所述领域场景分类器模型进行迭代训练。2.根据权利要求1所述的方法,其特征在于,所述对所述领域场景语言模型进行更新,具体为:定时对所述领域场景语言模型进行更新,或者,在加入到所述文本数据库中的文本数量大于第一预设值的情况下,对所述领域场景语言模型进行更新。3.根据权利要求1所述的方法,其特征在于,所述对所述领域场景分类器模型进行迭代训练,具体为:定时对所述领域场景分类器模型进行迭代训练,或者,在加入到所述训练数据库中的文本数量大于第二预设值的情况下,对所述领域场景分类器模型进行迭代训练。4.根据权利要求1所述的方法,其特征在于,所述对所述领域场景分类器模型进行迭代训练,具体为:在bert预训练模型上利用所述修正后文本与所述领域场景信息对所述领域场景分类器模型进行微调。5.根据权利要求1所述的方法,其特征在于,所述领域场景分类器模型由对textcnn模型或者fasttext模型进行训练生成;所述领域场景语言模型由对N-gram模型或者神经网络进行训练生成。6.一种语音的处理装置,其特征在于,包括:获...

【专利技术属性】
技术研发人员:张晴晴何淑琳贾艳明张雪璐
申请(专利权)人:北京爱数智慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利