【技术实现步骤摘要】
一种基于特征融合的英语口语自动评分方法
本专利技术涉及音频处理领域,尤其涉及一种基于特征融合的英语口语自动评分方法。
技术介绍
当前计算机辅助评估系统已经逐渐成为研究的热点之一。尤其在大规模考试中,它已经开始逐渐取代老师,这将成为教育界的一场重大变革。随着语音识别技术的发展,语音评估系统也逐渐发展起来。它主要通过计算机给人的发音进行评测,这样的系统不仅评分准确,而且可以大大提高效率,节约人力。针对口语考试题型的评分大体分为两类:一类是从语音的角度评分,一类是从文本的角度评分。纯粹基于语音的评分主要涉及到发音、频率和韵律等声学层面的特征。如果一个评分系统仅仅从语音的角度评分,而不考虑所表达内容的语法结构,那么这个自动评分系统仍旧不是一个完整的理想系统。
技术实现思路
为了克服上述现有技术中的不足,本专利技术的目的在于,提供一种评测效率且降低了对人力工作的依赖程度的基于特征融合的英语口语自动评分方法,方法包括:S1:输入语音信号和文本;S2:对输入的语音信号提取特征参数;S3:利用模式对比的方式对标准语音和待评语音的特征参数进行比较;S4:利用文本对齐方式对朗读文本和待评语音识别文本进行特征比较;S5:评分机制根据特征相似度对语音作出评价。优选地,所述步骤S1包括如下步骤:S1.1输入标准语音信号;S1.2输入标准朗读文本;S1.3输入英语缩略词及完整形式对照.优选地,所述步骤S2还包括如下步骤:S2.1提取梅尔倒谱参数特征;S2.2提取基频变化轨迹特征;优选地,所述步骤S2.1还包括如下步骤:S2.11将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅里叶变换 ...
【技术保护点】
一种基于特征融合的英语口语自动评分方法,其特征在于,方法包括:S1:输入语音信号和文本;S2:对输入的语音信号提取特征参数;S3:利用模式对比的方式对标准语音和待评语音的特征参数进行比较;S4:利用文本对齐方式对朗读文本和待评语音识别文本进行特征比较;S5:评分机制根据特征相似度对语音作出评价。
【技术特征摘要】
1.一种基于特征融合的英语口语自动评分方法,其特征在于,方法包括:S1:输入语音信号和文本;S2:对输入的语音信号提取特征参数;S3:利用模式对比的方式对标准语音和待评语音的特征参数进行比较;S4:利用文本对齐方式对朗读文本和待评语音识别文本进行特征比较;S5:评分机制根据特征相似度对语音作出评价。2.根据权利要求1所述的基于特征融合的英语口语自动评分方法,其特征在于,所述步骤S1包括如下步骤:S1.1输入标准语音信号;S1.2输入标准朗读文本;S1.3输入英语缩略词及完整形式对照。3.根据权利要求1所述的基于特征融合的英语口语自动评分方法,其特征在于,所述步骤S2还包括如下步骤:S2.1提取梅尔倒谱参数特征;S2.2提取基频变化轨迹特征。4.根据权利要求3所述的基于特征融合的英语口语自动评分方法,其特征在于,所述步骤S2.1还包括如下步骤:S2.11将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅里叶变换并得到其频谱;S2.12求出频谱平方,即能量谱,并用M个Mel带通滤波器进行滤波;由于每一个频带中分量的作用在人耳中是叠加的;因此将每个滤波器频带内的能量进行叠加,这时第k个滤波器输出功率谱x'(k);S2.13将每个滤波器的输出取对数,得到相应频带的对数功率谱;并进行反离散余弦变换,得到L个MFCC系数,一般L取12~16个左右;MFCC系数为:S2.14将这种直接得到的MFCC特征作为静态特征,再将这种静态特征做一阶和二阶差分,得到相应的动态特征。5.根据权利要求1所述的基于特征融合的英语口语自动评分方法,其特征在于,所述步骤S3还包括如下步骤:利用梅尔倒谱参数特征比较方式以及基音变化轨迹特征比较方式对标准语音和待评语音的特征参数进行比较。6.根据权利要求5所述的基于特征融合的英语口语自动评分方法,其特征在于,所述利用梅尔倒谱参数特征比较方式包括:(1)假设参考标准语音的MFCC特征向量为M1=[m1(1),m1(2),…,m1(T)],(T为参考语音的长度);(2)待评价语音的MFCC特征向量为M2=[m2(1),m2(2),…,m2(S)],(S为待评价语音的长度);(3)使用改进的DTW算法,得到一条误差最小的对齐路径和对应的DTW距离;(4)该距离是待评价的输入语音与参考标准语音的MFCC特征参数的比较结果,反映了两段语音在内容上的发音差别。7.根据权利要求5所述的基于特征融合的英语口语自动评分方法,其特征在于,所述利用基音变化轨迹特征比较方式包括:(1)假设参考标准语音的基音特征向量为P1=[p1(1),p1(2),…,p1(R)],其一阶差分向量为P△1=[p△1(1),p△1(2),…,p△1(R)](R为参考语音的长度),P△1(n)=|p1(n)-p1(n-1)|,n=1,2,…,R,p1(0)=0;(2)待评价的输入语音的基音特征向量为P2=[p2(1),p2(2),…,p2(T)],其一阶差分向量为P△2=[p△2(1),p△2(2),…,p△2(T)](T为待评价语音的长度),P△2(n)=|p2(n)-p2(n-1)|,n=1,2,…,T,p2(0)=0;(3)基于上节得到的DTW最佳对齐路径,在对齐的位置进行基音特征比较;(4)求取基音的差距dp,与其变化量的差距△dp,来获得输入语音与参考标准语音的基音的相似度,即:dp=|p1(n)-p2(m)|(2)△dp=|△p1(n)-△p2(m)|(...
【专利技术属性】
技术研发人员:马磊,陈义学,陈霞,
申请(专利权)人:山东山大鸥玛软件股份有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。