语音识别处理方法及系统技术方案

技术编号:29048424 阅读:20 留言:0更新日期:2021-06-26 06:07
本发明专利技术公开了一种语音识别处理方法及系统,其包括:基于本国的标准语音库对发言人的语音数据进行匹配,若发言人的语音数据与所述本国的标准语音库之间的匹配度值小于第一预设阈值,则判断所述发言人是否具有特定标签;若判断出所述发言人具有特定标签,则根据所述特定标签所对应的语音库对所述发言人的语音数据进行再次匹配,其中,所述特定标签所对应的语音库为本国某地方言的语音库或某个外国标准语音库。在本发明专利技术中,当发言人的某个语音不能够被标准语音库成功匹配时,会根据发言人的特定标签找到对应的方言语音库或外国语音库,根据特定标签对应的语音库对发言人的语音再次识别,提高了语音识别准确率。提高了语音识别准确率。提高了语音识别准确率。

【技术实现步骤摘要】
语音识别处理方法及系统


[0001]本专利技术是关于语音识别
,特别是关于一种语音识别处理方法及系统。

技术介绍

[0002]随着互联网技术的发展,视频会议应用日益广泛。
[0003]专利技术人在实现本专利技术的过程中发现,目前在视频会议中存在以下问题:在开会过程中,会遇到来自不同地区的人参会,大家在发言过程中由于习惯问题普通话可能会夹杂着少量方言或外语,使得其他与会人员不能完全领会其意思,但不能因少数人听不懂就打断发言人一是不礼貌,二是由于个人不能占据大家共同时间,三是中间打断会影响会议的连贯性,这样所造成的结果是影响部分人的参会效果。另外由于在线上会议大家不能完全很好地察觉到其他人的反应,所以发言人可能并没有意识到自己发音、普通话不标准带给其他人的影响。
[0004]公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

技术实现思路

[0005]本专利技术的目的在于提供一种语音识别处理方法及系统,当发言人的某个语音不能够被标准语音库成功匹配时,会根据发言人的特定标签找到对应的方言语音库或外国语音库,根据特定标签对应的语音库对发言人的语音再次识别,提高了语音识别准确率。
[0006]为实现上述目的,本专利技术提供了一种语音识别处理方法,其包括:基于本国的标准语音库对发言人的语音数据进行匹配,若发言人的语音数据与所述本国的标准语音库之间的匹配度值小于第一预设阈值,则判断所述发言人是否具有特定标签;若判断出所述发言人具有特定标签,则根据所述特定标签所对应的语音库对所述发言人的语音数据进行再次匹配,其中,所述特定标签所对应的语音库为本国某地方言的语音库或某个外国标准语音库。
[0007]在本专利技术的一实施方式中,所述语音识别处理方法还包括:若所述发言人的语音数据与所述特定标签所对应的语音库之间的匹配度值大于所述发言人的语音数据与所述本国的标准语音库之间的匹配度值,则根据所述特定标签所对应的语音库与本国的文字库之间的映射关系将所述发言人的语音数据转换为本国文字进行输出。
[0008]在本专利技术的一实施方式中,所述语音识别处理方法还包括:若判断出所述发言人不具有特定标签,则依次根据预存的各个特定标签所对应的语音库对所述发言人的语音数据进行匹配从而得到多个匹配度值,若其中最大的匹配度值大于所述发言人的语音数据与所述本国的标准语音库之间的匹配度值,则获取与所述最大的匹配度值相关的特定标签所对应的语音库,其中,所述各个特定标签所对应的语音库包括本国各地方言的语音库以及预存的各个外国标准语音库;根据与所述最大的匹配度值相关的特定标签所对应的语音库与所述本国的文字库之间的映射关系将所述发言人的语音数据转换为本国文字进行输出。
[0009]在本专利技术的一实施方式中,所述语音识别处理方法还包括:在获取与所述最大的匹配度值相关的特定标签所对应的语音库之后,记录所述发言人与所述最大的匹配值相关的特定标签之间发生一次关联事件;当所述发言人与某个特定标签之间发生关联事件的次数大于第二预设阈值,则为所述发言人赋予所述某个特定标签。
[0010]在本专利技术的一实施方式中,所述语音识别处理方法还包括:基于本国的标准语音库对发言人的语音数据进行匹配,若发言人的语音数据与所述本国的标准语音库之间的匹配度值不小于第一预设阈值,则判断所述发言人是否具有特定标签;若判断出所述发言人不具有特定标签,则根据所述本国的标准语音库与本国的文字库之间的映射关系将所述发言人的语音数据转换为本国文字进行输出。
[0011]在本专利技术的一实施方式中,所述语音识别处理方法还包括:基于本国的标准语音库对发言人的语音数据进行匹配,若发言人的语音数据与所述本国的标准语音库之间的匹配度值不小于第一预设阈值,则判断所述发言人是否具有特定标签;若判断出所述发言人具有特定标签,则判断所述本国的标准语音库中与所述发言人的语音数据相匹配的语音数据是否具有标识,若不具有标识,则根据所述本国的标准语音库与所述本国的文字库之间的映射关系将所述发言人的语音数据转换为本国文字进行输出,若具有标识,则判断所述特定标签所对应的语音库中是否具有相同的所述标识,若具有相同的所述标识,则根据所述特定标签所对应的语音库与本国的文字库之间的映射关系将所述发言人的语音数据转换为本国文字进行输出,若不具有相同的所述标识,则根据所述本国的标准语音库与所述本国的文字库之间的映射关系将所述发言人的语音数据转换为本国文字进行输出。
[0012]在本专利技术的一实施方式中,所述语音识别处理方法还包括:在语音识别之前,将本国各地方言的语音库与所述本国的标准语音库分别进行比对;若本国某地方言的语音库中存在与所述本国的标准语音库中相同的语音数据,则根据所述本国某地方言的语音库与所述本国的文字库之间的映射关系获取所述相同的语音数据的第一含义,并且根据所述本国的标准语音库与所述本国的文字库之间的映射关系获取所述相同的语音数据的第二含义;若所述第一含义与所述第二含义相同,则将所述本国某地方言的语音库中的所述相同的语音数据赋予标识,且将所述本国的标准语音库中的所述相同的语音数据赋予相同的所述标识。
[0013]基于同样的专利技术构思,本专利技术还提供了一种语音识别处理系统,其包括:标准语音库识别模块、判断模块、特定标签语音库识别模块。标准语音库识别模块用于基于本国的标准语音库对发言人的语音数据进行匹配。判断模块与所述标准语音库识别模块相耦合,用于判断所述发言人的语音数据与所述本国的标准语音库之间的匹配度值是否小于第一预设阈值,并且判断所述发言人是否具有特定标签。特定标签语音库识别模块与所述判断模块相耦合,用于若所述判断模块判断出所述发言人的语音数据与所述本国的标准语音库之间的匹配度值小于第一预设阈值,且判断出所述发言人具有特定标签,则根据所述特定标签所对应的语音库对所述发言人的语音数据进行再次匹配,其中,所述特定标签所对应的语音库为本国某地方言的语音库或某个外国标准语音库。
[0014]基于同样的专利技术构思,本专利技术还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上述任一项所述语音识别处理方法的步骤。
[0015]基于同样的专利技术构思,本专利技术还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如上述任一项所述语音识别处理方法的步骤。
[0016]与现有技术相比,根据本专利技术的语音识别处理方法及系统,当发言人的语音不能够被标准语音库成功匹配时,会根据发言人的特定标签找到对应的方言语音库或外国语音库,根据特定标签对应的语音库对发言人的语音再次识别,提高了语音识别准确率。优选地,一实施方式中在对发言人语音识别过程中,根据发言人的语音匹配情况,自动赋予发言人特定标签。优选地,一实施方式中为方言语音库与标准语音库中的发音相同含义不同的语音数据进行特殊标识,在进行语音识别时,还会结合标识来判断本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别处理方法,其特征在于,包括:基于本国的标准语音库对发言人的语音数据进行匹配,若发言人的语音数据与所述本国的标准语音库之间的匹配度值小于第一预设阈值,则判断所述发言人是否具有特定标签;若判断出所述发言人具有特定标签,则根据所述特定标签所对应的语音库对所述发言人的语音数据进行再次匹配,其中,所述特定标签所对应的语音库为本国某地方言的语音库或某个外国标准语音库。2.如权利要求1所述的语音识别处理方法,其特征在于,所述语音识别处理方法还包括:若所述发言人的语音数据与所述特定标签所对应的语音库之间的匹配度值大于所述发言人的语音数据与所述本国的标准语音库之间的匹配度值,则根据所述特定标签所对应的语音库与本国的文字库之间的映射关系将所述发言人的语音数据转换为本国文字进行输出。3.如权利要求1所述的语音识别处理方法,其特征在于,所述语音识别处理方法还包括:若判断出所述发言人不具有特定标签,则依次根据预存的各个特定标签所对应的语音库对所述发言人的语音数据进行匹配从而得到多个匹配度值,若其中最大的匹配度值大于所述发言人的语音数据与所述本国的标准语音库之间的匹配度值,则获取与所述最大的匹配度值相关的特定标签所对应的语音库,其中,所述各个特定标签所对应的语音库包括本国各地方言的语音库以及预存的各个外国标准语音库;根据与所述最大的匹配度值相关的特定标签所对应的语音库与所述本国的文字库之间的映射关系将所述发言人的语音数据转换为本国文字进行输出。4.如权利要求3所述的语音识别处理方法,其特征在于,所述语音识别处理方法还包括:在获取与所述最大的匹配度值相关的特定标签所对应的语音库之后,记录所述发言人与所述最大的匹配值相关的特定标签之间发生一次关联事件;当所述发言人与某个特定标签之间发生关联事件的次数大于第二预设阈值,则为所述发言人赋予所述某个特定标签。5.如权利要求1所述的语音识别处理方法,其特征在于,所述语音识别处理方法还包括:基于本国的标准语音库对发言人的语音数据进行匹配,若发言人的语音数据与所述本国的标准语音库之间的匹配度值不小于第一预设阈值,则判断所述发言人是否具有特定标签;若判断出所述发言人不具有特定标签,则根据所述本国的标准语音库与本国的文字库之间的映射关系将所述发言人的语音数据转换为本国文字进行输出。6.如权利要求1所述的语音识别处理方法,其特征在于,所述语音识别处理方法还包括:基于本国的标准语音库对发言人的语音数据进行匹配,若发言人的语音数据与所述本国的标准语音库之间的匹配度值不小于第一...

【专利技术属性】
技术研发人员:李璐冯文澜
申请(专利权)人:随锐科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1