一种语音评测方法、装置、设备及存储介质制造方法及图纸

技术编号:36811228 阅读:16 留言:0更新日期:2023-03-09 00:45
本发明专利技术公开了一种语音评测方法、装置、设备及存储介质。该方法包括:获取待评测语音信息和目标单词;根据所述待评测语音信息确定所述目标单词对应的目标时间段;基于基频提取算法,提取所述目标时间段内的基频数据;根据所述基频数据进行语音评测,得到语音测评结果,通过本发明专利技术的技术方案,能够对音调进行测评。能够对音调进行测评。能够对音调进行测评。

【技术实现步骤摘要】
一种语音评测方法、装置、设备及存储介质
[0001]本申请是申请日为2021年03月22日、申请号为202110301596.9、专利技术名称为“一种语音评测方法、装置、设备及存储介质”的专利技术专利申请的分案申请。


[0002]本专利技术实施例涉及语音评测
,尤其涉及一种语音评测方法、装置、设备及存储介质。

技术介绍

[0003]当下的经济发展和文化交流,对个人的外语能力要求越来越高。如何快速高效地获取外语技能,是语言教育迫切需要解决的问题。
[0004]日益发达的计算机技术,特别是人工智能技术,是实现高效语言学习的重要途径。例如,计算机辅助语言学习技术,可以快速地对学习者的口语进行测评,并指出具体的错误,学习者可以据此有针对性地练习和提高。
[0005]目前的语音测评技术大多基于GOP(Goodness Of Pronunciation)算法。给定待测评语音和相应的文本(可表示成音素串),计算每个音素的后验概率,并根据上述每一后验概率,进行音素级别的语音测评。比如某个音素的后验概率超过一定阈值,则认为学习者对该音素的发音较好,否者判断为发音有误。
[0006]这类算法聚焦的是音素级别的评分,基于此可以得到词级别到句子级别的评分,但这类分数对学习者口语的评估是片面的,它只反映了口语的一个基本要素,即发音准确性,并不能够对音调读法进行测评。

技术实现思路

[0007]本专利技术实施例提供一种语音评测方法、装置、设备及存储介质,以实现能够对音调进行测评。
[0008]第一方面,本专利技术实施例提供了一种语音评测方法,包括:
[0009]获取待评测语音信息和目标单词;
[0010]根据所述待评测语音信息确定所述目标单词对应的目标时间段;
[0011]基于基频提取算法,提取所述目标时间段内的基频数据;
[0012]根据所述基频数据进行语音评测,得到语音测评结果。
[0013]进一步的,获取目标单词包括:
[0014]获取参考文本信息,其中,所述参考文本信息携带音调标记;
[0015]根据所述参考文本信息确定所述音调标记对应的目标单词;
[0016]进一步的,根据所述待评测语音信息确定所述目标单词对应的目标时间段,包括:
[0017]对所述待评测语音信息进行识别,得到所述待评测语音信息对应的每个单词对应的时间段;
[0018]获取所述目标单词对应的目标时间段。
[0019]进一步的,根据所述基频数据进行语音评测,得到语音测评结果,包括:
[0020]根据所述基频数据进行基频斜率分析,得到语音测评结果。
[0021]进一步的,根据所述基频数据进行基频斜率分析,得到语音测评结果包括:
[0022]获取离散的基频数据;
[0023]对离散的基频数据进行二次拟合,得到目标二次函数;
[0024]若所述目标二次函数单调递增,则确定所述目标单词读音为升调,若所述音调标记为升调,则音频测评结果为通过,若所述音调标记为降调,则所述语音测评结果为未通过;
[0025]若所述目标二次函数单调递减,则确定所述目标单词读音为降调,若所述音调标记为升调,则音频测评结果为未通过,若所述音调标记为降调,则所述语音测评结果为通过。
[0026]进一步的,根据所述基频数据进行基频斜率分析,得到语音测评结果包括:
[0027]获取离散的基频数据;
[0028]对离散的基频数据进行二次拟合,得到目标二次函数;
[0029]对所述目标二次函数求导,得到目标导函数;
[0030]若在目标时间段内所述目标导函数的值均大于零,则确定所述目标单词读音为升调,若所述音调标记为升调,则音频测评结果为通过,若所述音调标记为降调,则所述语音测评结果为未通过;
[0031]若在目标时间段内所述目标导函数的值均小于零,则确定所述目标单词读音为降调,若所述音调标记为升调,则音频测评结果为未通过,若所述音调标记为降调,则所述语音测评结果为通过;
[0032]若在目标时间段内所述目标导函数的值存在零值,则获取升调和/或降调的占比,根据所述升调和/或降调的占比确定所述目标单词读音的音调,根据所述目标单词读音的音调和所述音频标记确定语音测评结果。
[0033]第二方面,本专利技术实施例还提供了一种语音评测装置,该装置包括:
[0034]获取模块,用于获取待评测语音信息和目标单词;
[0035]确定模块,用于根据所述待评测语音信息确定所述目标单词对应的目标时间段;
[0036]提取模块,用于基于基频提取算法,提取所述目标时间段内的基频数据;
[0037]测评模块,用于根据所述基频数据进行语音评测,得到语音测评结果。
[0038]进一步的,所述获取模块具体用于:
[0039]获取参考文本信息,其中,所述参考文本信息携带音调标记;
[0040]根据所述参考文本信息确定所述音调标记对应的目标单词。
[0041]第三方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本专利技术实施例中任一所述的语音评测方法。
[0042]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例中任一所述的语音评测方法。
[0043]本专利技术实施例通过获取待评测语音信息和目标单词;根据所述待评测语音信息确定所述目标单词对应的目标时间段;基于基频提取算法,提取所述目标时间段内的基频数
据;根据所述基频数据进行语音评测,得到语音测评结果,以实现能够对音调进行测评。
附图说明
[0044]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0045]图1是本专利技术实施例一中的一种语音评测方法的流程图;
[0046]图2是本专利技术实施例二中的一种语音评测装置的结构示意图;
[0047]图3是本专利技术实施例三中的一种计算机设备的结构示意图。
具体实施方式
[0048]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0049]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0050]实施例一...

【技术保护点】

【技术特征摘要】
1.一种语音评测方法,其特征在于,包括:获取待评测语音信息和目标单词;根据所述待评测语音信息确定所述目标单词对应的目标时间段;基于基频提取算法,提取所述目标时间段内的基频数据;根据所述基频数据进行语音评测,得到语音测评结果;根据所述基频数据进行语音评测,得到语音测评结果,包括:根据所述基频数据进行基频斜率分析,得到语音测评结果;根据所述基频数据进行基频斜率分析,得到语音测评结果包括:获取离散的基频数据;对离散的基频数据进行二次拟合,得到目标二次函数;对所述目标二次函数求导,得到目标导函数;若在目标时间段内所述目标导函数的值均大于零,则确定所述目标单词读音为升调,若所述音调标记为升调,则音频测评结果为通过,若所述音调标记为降调,则所述语音测评结果为未通过;若在目标时间段内所述目标导函数的值均小于零,则确定所述目标单词读音为降调,若所述音调标记为升调,则音频测评结果为未通过,若所述音调标记为降调,则所述语音测评结果为通过;若在目标时间段内所述目标导函数的值存在零值,则获取升调和/或降调的占比,根据所述升调和/或降调的占比确定所述目标单词读音的音调,根据所述目标单词读音的音调和所述音频标记确定语音测评结果。2.根据权利要求1所述的方法,其特征在于,获取目标单词包括:获取参考文本信息,其中,所述参考文本信息携带音调标记;根据所述参考文本信息确定所述音调标记对应的目标单词。3.根据权利要求2所述的方法,其特征在于,根据所述待评测语音信息确定所述目标单词对应的目标时间段,包括:对所述待评测语音信息进行识别,得到所述待评测语音信息对应的每个单词对应的时间段;获取所述目标单词对应的目标时间段。4.一种语音评测装置,其特征在于,包括:获取模块,用于获取待评测语音信息和目标...

【专利技术属性】
技术研发人员:徐燃
申请(专利权)人:北京如布科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1