具备多读音纠错功能的语言学习系统技术方案

技术编号:38194080 阅读:52 留言:0更新日期:2023-07-20 21:13
本发明专利技术提供一种具备多读音纠错功能的语言学习系统,以运行在一数据处理服务器上的一音频质量检测系统,侦测用户朗读一文本的一音频的多读音,以提示用户进行纠正。以提示用户进行纠正。以提示用户进行纠正。

【技术实现步骤摘要】
具备多读音纠错功能的语言学习系统


[0001]本专利技术关于语言学习系统,特别有关于口说的音频质量检测(Goodness of pronunciation,简称GOP)。

技术介绍

[0002]随着计算机的技术发展,语言学习系统功能越来越强大。使用者可准备各种文本进行口说训练。系统可对用户录音的完整度、流畅度、准确度

等进行评分反馈,帮助用户提升口语。此功能称为音频质量检测(GOP)。
[0003]如何提升音频质量检测(GOP)的可信度,还帮助用户改善口说,为本
一项重大课题。

技术实现思路

[0004]本专利技术提出一种具备多读音纠错功能的语言学习系统,包括运行在一数据处理服务器上的一音频质量检测(GOP)系统,侦测用户朗读文本的一音频的多读音,以提示用户进行纠正。运行在该数据处理服务器上的一数据预处理系统可包括一标注系统、以及一音频预处理系统,用以根据该文本、以及该音频,分别产生标注、以及一音频数据。该音频质量检测(GOP)系统是基于该标注、以及该音频数据,判别该音频相对该文本是否有多读音。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种具备多读音纠错功能的语言学习系统,其特征在于,包括:运行在数据处理服务器上的音频质量检测系统,侦测用户朗读文本的音频的多读音,以提示用户进行纠正。2.根据权利要求1的具备多读音纠错功能的语言学习系统,还包括:运行在该数据处理服务器上的数据预处理系统,该数据预处理系统包括标注系统、以及音频预处理系统,用以根据该文本、以及该音频,分别产生标注、以及音频数据;该音频质量检测系统基于该标注、以及该音频数据,判别该音频相对该文本是否有多读音。3.根据权利要求2的具备多读音纠错功能的语言学习系统,其中,该音频质量检测系统运行:强制对齐系统,令该音频数据强制对齐包括文本音素序列的该标注,产生强制对齐结果,显示该音频各帧对应该文本音素序列中的哪些音素,且属所对应音素的哪个状态;无效帧判别系统,自该强制对齐结果,判别该音频数据中,无法对齐该文本音素序列的无效帧,是否对应多读音。4.根据权利要求3的具备多读音纠错功能的语言学习系统,其中:在该音频数据中无法对齐该文本音素序列的一连串无效帧的帧数超过多读音判别阈值时,该无效帧判别系统判别该一连串无效帧对应多读音。5.根据权利要求4的具备多读音纠错功能的语言学习系统,其中:在该一连串无效帧的帧数不超过该多读音判别阈值时,该无效帧判别系统判别该一连串无效帧为静音。6.根据权利要求4的具备多读音纠错功能的语言学习系统,其中:该多读音判别阈值取决于该音频的采样率。7.根据权利要求4的具备多读音纠错功能的语言学习系统,其中,该音频质量检测系统还运行:语音活动检测系统,以深度学习的循环神经网络为该音频数据过滤噪音。8.根据权利要求7的具备多读音纠错功能的语言学习系统,其中:该多读音判别阈值取决于该语音活动检测系统的演算法。9.根据权利要求4的具备多读音纠错功能的语言学习系统,其中:该多读音判别阈值为15。10.根据权利要求3的具备多读音纠错功能的语言学习系统,其中:该音频数据中无法对齐该文本音素序列的无效帧,在该强制对齐结果中,以特定数字表示。11.根据权利要求10的具备多读音纠错功能的语言学习系统,其中:该强...

【专利技术属性】
技术研发人员:郭晶晶刘恕
申请(专利权)人:威盛电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1