【技术实现步骤摘要】
发音识别方法、装置、存储介质及电子设备
[0001]本申请实施例涉及计算机
,尤其涉及发音识别方法、装置、存储介质及电子设备。
技术介绍
[0002]目前的相关技术中,可以通过软件的方式自动为发音者进行发音评测,发音评测可以自动识别出该发音者发出的音频中各个音素所对应的发音是否存在错误,并将识别结果向发音者反馈,但是,目前的发音评测的准确度并不高,也就是说,发音识别结果并不准确。
技术实现思路
[0003]为了解决上述至少一个技术问题,本申请实施例提供发音识别方法、装置、存储介质及电子设备。
[0004]一方面,本申请实施例提供了一种发音识别方法,所述方法包括:
[0005]获取目标音频;
[0006]对所述目标音频进行音素特征提取,得到所述目标音频中各音素分别对应的音素特征;
[0007]对各音素特征进行联合识别,得到各音素分别对应的单音素错读识别结果以及所述各音素分别对应的音变识别结果,其中,所述联合识别表征将单音素判错识别和音素音变识别进行联合执行的识别方法; />[0008]针对本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种发音识别方法,其特征在于,所述方法包括:获取目标音频;对所述目标音频进行音素特征提取,得到所述目标音频中各音素分别对应的音素特征;对各音素特征进行联合识别,得到各音素分别对应的单音素错读识别结果以及所述各音素分别对应的音变识别结果,其中,所述联合识别表征将单音素判错识别和音素音变识别进行联合执行的识别方法;针对每一音素,根据所述音素对应的单音素错读识别结果和所述音素对应的音变识别结果,得到所述音素的发音识别结果,所述发音识别结果表征所述音素在所述目标音频中是否被误读。2.根据权利要求1所述的方法,其特征在于,所述根据所述音素对应的单音素错读识别结果和所述音素对应的音变识别结果,得到所述音素的发音识别结果,包括:在所述音变识别结果表征未出现音变,并且,所述单音素错读识别结果表征未出现单音素错读的情况下,所述发音识别结果表征未被误读;在所述音变识别结果表征未出现音变,并且,所述单音素错读识别结果表征出现单音素错读的情况下,所述发音识别结果表征被误读;在所述音变识别结果表征出现音变的情况下,所述发音识别结果表征未被误读。3.根据权利要求1或2所述的方法,其特征在于,所述方法通过联合识别模型实施,所述联合识别模型包括音素特征提取模型和联合识别网络,所述联合识别模型的训练方法包括:获取多个样本音频,每一所述样本音频中的每个音素具备对应的音素类别标签、单音素错读标签以及音变标签;将所述样本音频输入所述音素特征提取模型,得到所述样本音频中各音素分别对应的样本音素特征;将各所述样本音素特征输入所述联合识别网络,得到音素分类预测结果、单音素错读预测结果以及音变预测结果;根据所述音素类别标签、所述单音素错读标签、所述音变标签、所述音素分类预测结果、所述单音素错读预测结果以及所述音变预测结果,确定模型损失;根据所述模型损失调整所述联合识别网络中的参数,直至训练完毕。4.根据权利要求3所述的方法,其特征在于,所述根据所述音素类别标签、所述单音素错读标签、所述音变标签、所述音素分类预测结果、所述单音素错读预测结果以及所述音变预测结果,确定模型损失,包括:根据所述音素类别标签和所述音素分类预测结果之间的差异,得到音素分类损失;根据所述单音素错读标签和所述单音素错读预测结果的差异,得到单音素错读损失;根据所述音变标签和所述音变预测结果之间的差异,得到音素音变损失;融合所述音素分类损失、所述单音素错读损失和所述音素音变损失,得到所述模型损失。5.根据权利要求4所述的方法,其特征在于,所述音素特征提取模型包括声学特征模型和对齐模型,所述将所述样本音频输入所述音素特征提取模型,得到所述样本音频中各音
素分别对应的样本音素特征,包括...
【专利技术属性】
技术研发人员:林炳怀,王丽园,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。