【技术实现步骤摘要】
音段切分检测方法及系统、口语评测方法及系统
本专利技术涉及语音信号处理
,尤其涉及一种音段切分检测方法及系统、以及一种口语评测方法及系统。
技术介绍
口语评测可以实现对发音人的口语水平进行评估,并根据评估结果指导发音人进行学习。评测的基本原理源于对标准发音和实际发音之间的差别度量,音段切分是口语评测技术中的一种主流方法,具体流程是:根据朗读文本构建解码网络,对语音的声学特征基于解码网络和声学模型进行强制对齐,解码得到音段切分结果。如图1所示,是传统口语评测方法的流程图,包括以下步骤:第一步:输入语音评测文本,并根据所述文本构建语法网络;第二步:输入评测语音,并提取所述评测语音的声学特征;第三步:利用声学模型,在所述语法网络上对所述声学特征进行强制对齐,得到各音段切分边界;第四步:依次对所述音段切分边界内的每个音素计算后验概率;第五步:根据各音段切分边界和其对应的音素后验概率,得到评分特征;第六步:基于所述评分特征的映射模型,计算得到评测结果。上述传统口语评测方法在实际的口语评测过程中,很有可能出现下述情况:用户不按照文本顺序朗读、用户朗读与文本无关的内容、或 ...
【技术保护点】
一种音段切分检测方法,其特征在于,包括:获取对朗读语音进行音段切分得到的切分结果;对所述朗读语音进行语音识别,得到识别结果;根据所述朗读语音对应的朗读文本分别计算切分结果的识别率及识别结果的识别率;如果所述切分结果的识别率高于所述识别结果的识别率,则确定所述切分结果正常;否则确定所述切分结果异常。
【技术特征摘要】
1.一种音段切分检测方法,其特征在于,包括:获取对朗读语音进行音段切分得到的切分结果;对所述朗读语音进行语音识别,得到识别结果;根据所述朗读语音对应的朗读文本分别计算切分结果的识别率及识别结果的识别率;如果所述切分结果的识别率高于所述识别结果的识别率,则确定所述切分结果正常;否则确定所述切分结果异常。2.根据权利要求1所述的方法,其特征在于,根据所述朗读语音对应的朗读文本计算切分结果的识别率包括:利用动态规划算法对所述朗读文本的单词序列和所述切分结果的单词序列进行顺序匹配;计算所述切分结果中顺序正确的单词的比例,并将所述切分结果中顺序正确的单词的比例作为所述切分结果的识别率;根据所述朗读语音对应的朗读文本计算识别结果的识别率包括:利用动态规划算法对所述朗读文本的单词序列和所述识别结果的单词序列进行顺序匹配;计算所述识别结果中顺序正确的单词的比例,并将所述识别结果中顺序正确的单词的比例作为所述识别结果的识别率。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:在对所述朗读语音进行语音识别之前,计算所述朗读语音的语音质量参数;如果所述语音质量参数大于预设的质量参数门限,则执行对所述朗读语音进行语音识别的步骤;否则确定所述切分结果异常。4.根据权利要求3所述的方法,其特征在于,所述语音质量参数包括:信噪比、和/或截幅率。5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:在对所述朗读语音进行语音识别之前,依次对所述切分结果中各音段的每个音素,计算其音素后验概率;基于各音段对应的音素后验概率,计算所述切分结果的置信度;如果所述置信度大于预设的置信度阈值,则执行对所述朗读语音进行语音识别的步骤;否则确定所述切分结果异常。6.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:在对所述朗读语音进行语音识别之前,计算所述朗读语音的语音质量参数;如果所述语音质量参数大于预设的质量参数门限,则依次对所述切分结果中各音段的每个音素,计算其音素后验概率;否则确定所述切分结果异常;基于各音段对应的音素后验概率,计算所述切分结果的置信度;如果所述置信度大于预设的置信度阈值,则执行对所述朗读语音进行语音识别的步骤;否则确定所述切分结果异常。7.一种口语评测方法,其特征在于,包括:获取朗读语音及所述朗读语音对应的朗读文本;对所述朗读语音进行音段切分,得到切分结果;基于权利要求1至4任一项所述的方法对所述切分结果进行音段切分检测;如果切分异常,则进行异常报警;否则,依次对所述切分结果中各音段的每个音素,计算各音段的音素后验概率;根据所述切分结果及所述音素后验概率获取评分特征;基于所述评分特征的映射模型计算得到所述朗读语音的评测得分。8.根据权利要求7所述的方法,其特征在于,所述对所述朗读语音进行音段切分,得到切分结果包括:根据所述朗读文本的内容构建语法网络;提取所述朗读语音的声学特征;利用声学模型,在所述语法网络上对所述声学特征进行强制对齐,得到各音段的切分边界。9.根据权利要求7或8所述的方法,其特征在于,所述方法还包括:在根据所述音素后验概率获取音段评分特征之前,基于各音段的音素后验概率,计算所述切分结果的置信度;如果所述置信度大于预设的置信度阈值,则执行根据所述音段对应的音素后验概率获取音段评分特征的步骤;否则进行异常报警。10.一种音段切分检测系统,其特征在于,包括:切分结果获取模块,用于获取对朗读语音进行音段切分得到的切分结果;语音识别模块,用于对所述朗读语音进行语音识别,得到识别结果;识别率计算模块,用于根据所述朗读语音对应的朗读文本分别计算切分结果的识别率及识别结果的识别率;第一判断模块,用于判断所述切分结果的识别率是否高于所述识别结果的识别率;如果是,则触发检测结果输出模块输出切分结果正常指示;否则触发所述检测结果输出模块输出切分结...
【专利技术属性】
技术研发人员:宋铁,赵乾,潘颂声,何春江,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。