一种语音识别系统及方法技术方案

技术编号:17996766 阅读:57 留言:0更新日期:2018-05-19 13:43
本发明专利技术涉及一种语音识别系统及方法。该系统包括:语音采集模块、口音甄别模块、语音校正模块以及语音转换模块;语音采集模块,用于采集语音信息;口音甄别模块,用于根据语音信息识别语音信息语音发出者的口音所属的地域,并将识别结果输入至语音校正模块;语音校正模块,用于根据语音发出者的口音所属的地域对语音信息进行校正,并将校正后的结果输入至语音转换模块;语音转换模块,用于将校正后的语音信息转换为文字信息并输出。通过上述方法,可以实现语音转换文字之前,事先将地域方言语音转换为普通话语音后,再将语音转换为文字,大大提升了语音转换的准确率。

【技术实现步骤摘要】
一种语音识别系统及方法
本专利技术涉及语音识别领域,尤其涉及一种语音识别系统及方法。
技术介绍
语音识别技术应用越来越广泛,但是现在的语音识别库基本都是基于普通话的语音而言,将语音转换为文字,准确率比较高。但是,现实生活中,大部分人的普通话都不标准,或多或少都携带一些地方语音。现有的语音识别系统将“方言”转换为文字的准确的较低,很多时候可能转换为令人哭笑不得的文字,甚至会给客户造成众多不便。
技术实现思路
为解决上述技术问题,本专利技术提供了一种语音识别系统及方法。第一方面,本专利技术提供了一种语音识别系统,该系统包括语音采集模块、口音甄别模块、语音校正模块以及语音转换模块;语音采集模块,用于采集语音信息;口音甄别模块,用于根据语音信息识别语音信息语音发出者的口音所属的地域,并将识别结果输入至语音校正模块;语音校正模块,用于根据语音发出者的口音所属的地域对语音信息进行校正,并将校正后的结果输入至语音转换模块;语音转换模块,用于将校正后的语音信息转换为文字信息并输出。本专利技术的有益效果是:语音采集模块采集到语音后,首先通过口音甄别模块甄别语音信息发出者的口音所属地域,然后根据该口音所属地域,采用与该地域的口音相应的校正方式对用户的口音进行校正,将其校正为普通话。最后将转换后的普通话语音转化为文字,语音转换为文字的正确率大大提高,提升用户体验度。进一步,该系统还包括:处理模块,用于将语音采集模块采集的语音信息,与语音转换模块将校正后的语音信息进行转换后所获取的文字信息进行匹配并存储采用上述进一步的方案的有益技术效果在于,将采集的语音和转换后的文字信息进行匹配并存储后,如果后续采集到同样的语音后,无需经过语音甄别和校正等后续步骤,直接读取与该语音匹配的文字信息并输出。节省工作流程,提升工作效率。进一步,口音甄别模块包括:特征提取单元和匹配单元;特征提取单元,用于提取语音信息中的语音特征;匹配单元,用于根据语音特征在预设地域语音库中查找与语音特征匹配的语音所属地域信息。采用上述进一步的技术方案的有益技术效果在于,事先提取语音信息中的语音特征,然后将语音特征和预设的地域语音库中的语音特征进行匹配,可以准确的确定语音信息发出者的口音所属的地域。进一步的,语音校正模块包括第一语音编码模块、语音解码模块以及第二语音编码模块;第一语音编码模块,用于根据语音信息发出者的口音所属地域确定第一语音编码格式;根据第一语音编码格式编码语音信息,生成第一数据帧;语音解码模块,用于对第一数据帧进行解码,产生性语音采样序列;第二语音编码模块,用于获取与普通话对应的第二语音编码格式;根据第二语音编码格式,将线性语音采样序列转换成普通话语音。采用上述进一步的技术方案的有益技术效果在于,事先将语音按照语音信息发出者的口音所属地域对应的语音编码格式对语音信息进行编码,生成第一数据帧,然后对第一数据帧进行解码,产生线性语音采样序列。并采样与普通话对应的语音编码格式将线性语音采样序列转换成普通话语音。进一步的,语音特征具体包括:语调、语速、声调中一个或多个。第二方面,本专利技术提供了一种语音识别方法,该方法包括:采集语音信息;根据语音信息识别语音信息语音发出者的口音所属的地域;根据语音发出者的口音所属的地域对语音信息进行校正;将校正后的语音信息转换为文字信息并输出。本专利技术的有益效果是采集到语音后,首先甄别语音信息发出者的口音所属地域,然后根据该口音所属地域,采用与该地域的口音相应的校正方式对用户的口音进行校正,将其校正为普通话。最后将转换后的普通话语音转化为文字,语音转换为文字的正确率大大提高,提升用户体验度。进一步的,将校正后的语音信息转换为文字信息并输出之后,方法还包括:将采集的语音信息,与语音转换模块将校正后的语音信息进行转换后所获取的文字信息进行匹配并存储。采用上述进一步的方案的有益技术效果在于,将采集的语音和转换后的文字信息进行匹配并存储后,如果后续采集到同样的语音后,无需经过语音甄别和校正等后续步骤,直接读取与该语音匹配的文字信息并输出。节省工作流程,提升工作效率。进一步的,根据语音信息识别语音信息语音发出者的口音所属的地域,具体包括:提取语音信息中的语音特征;根据语音特征在预设地域语音库中查找与语音特征匹配的语音所属地域信息。采用上述进一步的技术方案的有益技术效果在于,事先提取语音信息中的语音特征,然后将语音特征和预设的地域语音库中的语音特征进行匹配,可以准确的确定语音信息发出者的口音所属的地域。进一步的,根据语音发出者的口音所属的地域对语音信息进行校正,具体包括:根据语音信息发出者的口音所属地域确定第一语音编码格式;根据第一语音编码格式编码语音信息,生成第一数据帧;对第一数据帧进行解码,产生线性语音采样序列;获取与普通话对应的第二语音编码格式;根据第二语音编码格式,将线性语音采样序列转换成普通话语音。采用上述进一步的技术方案的有益技术效果在于,事先将语音按照语音信息发出者的口音所属地域对应的语音编码格式对语音信息进行编码,生成第一数据帧,然后对第一数据帧进行解码,产生线性语音采样序列。并采样与普通话对应的语音编码格式将线性语音采样序列转换成普通话语音。进一步的,语音特征具体包括:语调、语速、声调中一个或多个。附图说明图1为本专利技术实施例提供的一种语音识别系统结构示意图;图2为口音甄别模块的一种结构示意图;图3为语音校正模块的一种结构示意图;图4为本专利技术实施例提供的一种语音识别方法流程示意图;图5为根据语音信息识别语音信息语音发出者的口音所属的地域方法流程示意图;图6为对语音信息进行校正的方法流程示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透切理解本专利技术。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。本专利技术实施例提供了一种语音识别系统结构示意图。具体如图1所示,该系统包括:语音采集模块10、口音甄别模块20、语音校正模块30以及语音转换模块40。语音采集模块10,用于采集语音信息。语音采集模块10可以为带有录音功能的装置,将采集到的语音输出至口音甄别模块20。口音甄别模块20,用于根据语音信息识别语音信息语音发出者的口音所属的地域,并将识别结果输入至语音校正模块30。一般而言,不同地域的人多少都会携带一些当地的口音。即使该语音发出者说的就是普通话,也会携带口音。那么,如果直接将这样的普通话转换为文字的话,很容易出现问题,导致语音转换正确率降低。更甚的是,很多地方方言更是难以理解,语音识别系统根本无法转换为文字,或者转换的文字必定是语句不同的。因此,实现采用口音甄别模块20甄别该语音发出者的口音所属地域,然后将识别结果输入至语音校正模块30。在一个可选的实施例中,为进一步详细说明口音甄别模块的具体实现功能。下面将列举一种口音甄别模块20的组成结构,具体如图2所示,口音甄别模块20可以包括特征提取单元201和匹配单元202。其中,语音特征提取单元201用于提取语音信息中的语音特征。匹配单元202,用于根据语音特征在预设地域语音库中查找与语音特征匹配的语音本文档来自技高网...
一种语音识别系统及方法

【技术保护点】
一种语音识别系统,其特征在于,所述系统包括:语音采集模块、口音甄别模块、语音校正模块以及语音转换模块;所述语音采集模块,用于采集语音信息;所述口音甄别模块,用于根据所述语音信息识别所述语音信息语音发出者的口音所属的地域,并将识别结果输入至语音校正模块;所述语音校正模块,用于根据所述语音发出者的口音所属的地域对所述语音信息进行校正,并将校正后的结果输入至所述语音转换模块;所述语音转换模块,用于将所述校正后的语音信息转换为文字信息并输出。

【技术特征摘要】
1.一种语音识别系统,其特征在于,所述系统包括:语音采集模块、口音甄别模块、语音校正模块以及语音转换模块;所述语音采集模块,用于采集语音信息;所述口音甄别模块,用于根据所述语音信息识别所述语音信息语音发出者的口音所属的地域,并将识别结果输入至语音校正模块;所述语音校正模块,用于根据所述语音发出者的口音所属的地域对所述语音信息进行校正,并将校正后的结果输入至所述语音转换模块;所述语音转换模块,用于将所述校正后的语音信息转换为文字信息并输出。2.根据权利要求1所述的系统,其特征在于,所述系统还包括:处理模块,用于将所述语音采集模块采集的语音信息,与所述语音转换模块将所述校正后的语音信息进行转换后所获取的文字信息进行匹配并存储。3.根据权利要求1或2所述的系统,其特征在于,所述口音甄别模块包括:特征提取单元和匹配单元;所述特征提取单元,用于提取所述语音信息中的语音特征;所述匹配单元,用于根据所述语音特征在预设地域语音库中查找与所述语音特征匹配的语音所属地域信息。4.根据权利要求3所述的系统,其特征在于,所述语音校正模块包括第一语音编码模块、语音解码模块以及第二语音编码模块;所述第一语音编码模块,用于根据所述语音信息发出者的口音所属地域确定第一语音编码格式;根据所述第一语音编码格式编码所述语音信息,生成第一数据帧;所述语音解码模块,用于对所述第一数据帧进行解码,产生性语音采样序列;所述第二语音编码模块,用于获取与普通话对应的第二语音编码格式;根据所述第二语音编码...

【专利技术属性】
技术研发人员:吴砚峰
申请(专利权)人:广西职业技术学院
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1