一种音素评分的确定方法及系统技术方案

技术编号:23606734 阅读:42 留言:0更新日期:2020-03-28 07:20
本发明专利技术提供了一种音素评分的确定方法及系统,该方法为:获取待识别音频和待识别音频对应的标定文本;对待识别音频进行语音识别,获取识别音素和识别音素对应的第一GOP评分;确定第一GOP评分是否大于等于识别音素对应的阈值评分,每一音素对应设置有一个阈值评分;若第一GOP评分小于阈值评分,判断识别音素是否为目标音素的竞争音素;基于判断结果,输出最终GOP评分。本方案中,预先为每一音素设置对应的阈值评分,比较识别音素对应的第一GOP评分和阈值评分,若第一GOP评分小于阈值评分,判断识别音素是否为目标音素的竞争音素。根据判断结果确定最终GOP评分,提高音素评分的准确性。

A method and system for determining phoneme score

【技术实现步骤摘要】
一种音素评分的确定方法及系统
本专利技术涉及语音评测
,具体涉及一种音素评分的确定方法及系统。
技术介绍
随着社会的发展,目前越来越多人在学习多门语言。在学习语言时,人们通常借助语言学习软件辅助学习,例如通过语言学习软件为自己的发音打分,并根据打分结果纠正发音。目前的语言学习软件在为用户的发音进行打分时,通常是利用Goodnessofpronunciation(GOP)进行评分。具体评分方式为:预先为所有音素都设置同一个阈值,用户在使用语言学习软件时,利用GOP算法计算目标音素的GOP评分,比较GOP评分和阈值确定用户是否发音准确。但是由于很多用户的发音不标准且无序,同时不同的音素对应不同的隐马尔科夫模型(HMMs)分数。为所有音素都设置同一个阈值,无法准确判断用户的发音是否标准,音素评分准确性较低。
技术实现思路
有鉴于此,本专利技术实施例提供一种音素评分的确定方法及系统,以解决现有音素评分方式存在的音素评分准确性较低等问题。为实现上述目的,本专利技术实施例提供如下技术方案:本专利技术实施例第一方面公开一种音素评分的确定方法,所述方法包括:获取待识别音频和所述待识别音频对应的标定文本,所述标定文本至少包含目标音素;对所述待识别音频进行语音识别,获取识别音素和所述识别音素对应的第一GOP评分;确定所述第一GOP评分是否大于等于所述识别音素对应的阈值评分,每一音素对应设置有一个阈值评分;若所述第一GOP评分小于所述阈值评分,判断所述识别音素是否为所述目标音素的竞争音素;基于判断结果,输出最终GOP评分。优选的,所述基于所述判断结果,输出最终GOP评分,包括:若判断结果为所述识别音素不是所述目标音素的竞争音素,确定所述第一GOP评分为最终GOP评分;若所述判断结果为所述识别音素是所述目标音素的竞争音素,确定所述目标音素对应的预设第二GOP评分为最终GOP评分。优选的,为每一音素设置阈值评分的过程,包括:针对每一音素,获取所述音素对应的多个历史GOP评分;计算所述音素的多个历史GOP评分的平均值和方差;根据所述平均值和所述方差,确定所述音素的阈值评分。优选的,所述判断所述识别音素是否为所述目标音素的竞争音素,包括:基于所述识别音素和所述目标音素查找竞争音素表,判断所述识别音素是否为所述目标音素的竞争音素,所述竞争音素表为预先基于音素的发音相似度构建,所述竞争音素表至少包含所述目标音素和对应的竞争音素。优选的,还包括:若所述第一GOP评分大于等于所述阈值评分,确定所述第一GOP评分为最终GOP评分。本专利技术实施例第二方面公开一种音素评分的确定系统,所述系统包括:获取单元,用于获取待识别音频和所述待识别音频对应的标定文本,所述标定文本至少包含目标音素;识别单元,用于对所述待识别音频进行语音识别,获取识别音素和所述识别音素对应的第一GOP评分;确定单元,用于确定所述第一GOP评分是否大于等于所述识别音素对应的阈值评分,每一音素对应设置有一个阈值评分,若所述第一GOP评分小于所述阈值评分,执行判断单元;所述判断单元,用于判断所述识别音素是否为所述目标音素的竞争音素;输出单元,用于基于判断结果,输出最终GOP评分。优选的,所述输出单元具体用于:若判断结果为所述识别音素不是所述目标音素的竞争音素,确定所述第一GOP评分为最终GOP评分,若所述判断结果为所述识别音素是所述目标音素的竞争音素,确定所述目标音素对应的预设第二GOP评分为最终GOP评分。优选的,所述判断单元具体用于:基于所述识别音素和所述目标音素查找竞争音素表,判断所述识别音素是否为所述目标音素的竞争音素,所述竞争音素表为预先基于音素的发音相似度构建,所述竞争音素表至少包含所述目标音素和对应的竞争音素。本专利技术实施例第三方面公开一种电子设备,所述电子设备用于运行程序,其中,所述程序运行时执行如本专利技术实施例第一方面公开的音素评分的确定方法。本专利技术实施例第四方面公开一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如本专利技术实施例第一方面公开的音素评分的确定方法。基于上述本专利技术实施例提供的一种音素评分的确定方法及系统,该方法为:获取待识别音频和待识别音频对应的标定文本;对待识别音频进行语音识别,获取识别音素和识别音素对应的第一GOP评分;确定第一GOP评分是否大于等于识别音素对应的阈值评分,每一音素对应设置有一个阈值评分;若第一GOP评分小于阈值评分,判断识别音素是否为目标音素的竞争音素;基于判断结果,输出最终GOP评分。本方案中,预先为每一音素设置对应的阈值评分,对待识别音频进行语音识别得到识别音素和第一GOP评分。若第一GOP评分小于识别音素对应的阈值评分,判断识别音素是否为目标音素的竞争音素,基于判断结果输出最终GOP评分。通过比较第一GOP评分和识别音素对应的阈值评分,以及判断识别音素是否为目标音素的竞争音素,从而确定最终GOP评分,提高音素评分的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种音素评分的确定方法的流程图;图2为本专利技术实施例提供的设置阈值评分的流程图;图3为本专利技术实施例提供的另一种音素评分的确定方法的流程图;图4为本专利技术实施例提供的一种音素评分的确定系统的结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。由
技术介绍
可知,目前的音素评分方式为:预先为所有音素都设置同一个阈值,利用GOP算法计算目标音素的GOP评分,比较GOP评分和阈值确定用户是否发音准确。但是,由于很多用户的发音不标准且无序,同时不同的音素对应不同的HMMs分数。为所有音素都设置同一个阈值,无法准确判断用户的发音是否标准,音素评分准确性较低。因此,本专利技术实施例提供一种音素评分的确定方法及系统,预先为每一音素设置对本文档来自技高网
...

【技术保护点】
1.一种音素评分的确定方法,其特征在于,所述方法包括:/n获取待识别音频和所述待识别音频对应的标定文本,所述标定文本至少包含目标音素;/n对所述待识别音频进行语音识别,获取识别音素和所述识别音素对应的第一GOP评分;/n确定所述第一GOP评分是否大于等于所述识别音素对应的阈值评分,每一音素对应设置有一个阈值评分;/n若所述第一GOP评分小于所述阈值评分,判断所述识别音素是否为所述目标音素的竞争音素;/n基于判断结果,输出最终GOP评分。/n

【技术特征摘要】
1.一种音素评分的确定方法,其特征在于,所述方法包括:
获取待识别音频和所述待识别音频对应的标定文本,所述标定文本至少包含目标音素;
对所述待识别音频进行语音识别,获取识别音素和所述识别音素对应的第一GOP评分;
确定所述第一GOP评分是否大于等于所述识别音素对应的阈值评分,每一音素对应设置有一个阈值评分;
若所述第一GOP评分小于所述阈值评分,判断所述识别音素是否为所述目标音素的竞争音素;
基于判断结果,输出最终GOP评分。


2.根据权利要求1所述的方法,其特征在于,所述基于所述判断结果,输出最终GOP评分,包括:
若判断结果为所述识别音素不是所述目标音素的竞争音素,确定所述第一GOP评分为最终GOP评分;
若所述判断结果为所述识别音素是所述目标音素的竞争音素,确定所述目标音素对应的预设第二GOP评分为最终GOP评分。


3.根据权利要求1所述的方法,其特征在于,为每一音素设置阈值评分的过程,包括:
针对每一音素,获取所述音素对应的多个历史GOP评分;
计算所述音素的多个历史GOP评分的平均值和方差;
根据所述平均值和所述方差,确定所述音素的阈值评分。


4.根据权利要求1所述的方法,其特征在于,所述判断所述识别音素是否为所述目标音素的竞争音素,包括:
基于所述识别音素和所述目标音素查找竞争音素表,判断所述识别音素是否为所述目标音素的竞争音素,所述竞争音素表为预先基于音素的发音相似度构建,所述竞争音素表至少包含所述目标音素和对应的竞争音素。


5.根据权利要求1所述的方法,其特征在于,还包括:
若所述第一GOP评分大于等于所述阈值评分,...

【专利技术属性】
技术研发人员:邱威
申请(专利权)人:广州三人行壹佰教育科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1