一种基于特征融合的英语口语自动评分方法技术

技术编号：15642576 阅读：117 留言：0更新日期：2017-06-16 16:04

本发明专利技术提供一种基于特征融合的英语口语自动评分方法，针对大规模英语口语考试朗读题型，采用多特征融合的方法进行评分。以连续语音信号及语音识别文本作为研究对象，从语音和文本两个不同角度对口语考试朗读题型进行分析。一方面，通过分析输入语音,提取语音特征并与参考标准进行匹配比较；另一方面通过文本对齐方法比较语音识别文本与朗读文本，由评分机制根据相似程度大小给出评价得分。实验证明该方法的算法复杂度较低,评分结果符合人的主观感觉。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于特征融合的英语口语自动评分方法
本专利技术涉及音频处理领域，尤其涉及一种基于特征融合的英语口语自动评分方法。
技术介绍
当前计算机辅助评估系统已经逐渐成为研究的热点之一。尤其在大规模考试中，它已经开始逐渐取代老师，这将成为教育界的一场重大变革。随着语音识别技术的发展，语音评估系统也逐渐发展起来。它主要通过计算机给人的发音进行评测，这样的系统不仅评分准确，而且可以大大提高效率，节约人力。针对口语考试题型的评分大体分为两类：一类是从语音的角度评分，一类是从文本的角度评分。纯粹基于语音的评分主要涉及到发音、频率和韵律等声学层面的特征。如果一个评分系统仅仅从语音的角度评分，而不考虑所表达内容的语法结构，那么这个自动评分系统仍旧不是一个完整的理想系统。
技术实现思路
为了克服上述现有技术中的不足，本专利技术的目的在于，提供一种评测效率且降低了对人力工作的依赖程度的基于特征融合的英语口语自动评分方法，方法包括：S1：输入语音信号和文本；S2：对输入的语音信号提取特征参数；S3：利用模式对比的方式对标准语音和待评语音的特征参数进行比较；S4：利用文本对齐方式对朗读文本和待评语音识别文本进行特征比较；S5：评分机制根据特征相似度对语音作出评价。优选地，所述步骤S1包括如下步骤：S1.1输入标准语音信号；S1.2输入标准朗读文本；S1.3输入英语缩略词及完整形式对照.优选地，所述步骤S2还包括如下步骤：S2.1提取梅尔倒谱参数特征；S2.2提取基频变化轨迹特征；优选地，所述步骤S2.1还包括如下步骤：S2.11将信号进行分帧，预加重和加汉明窗处理，然后进行短时傅里叶变换...
一种基于特征融合的英语口语自动评分方法

【技术保护点】
一种基于特征融合的英语口语自动评分方法，其特征在于，方法包括：S1：输入语音信号和文本；S2：对输入的语音信号提取特征参数；S3：利用模式对比的方式对标准语音和待评语音的特征参数进行比较；S4：利用文本对齐方式对朗读文本和待评语音识别文本进行特征比较；S5：评分机制根据特征相似度对语音作出评价。

【技术特征摘要】
1.一种基于特征融合的英语口语自动评分方法，其特征在于，方法包括：S1：输入语音信号和文本；S2：对输入的语音信号提取特征参数；S3：利用模式对比的方式对标准语音和待评语音的特征参数进行比较；S4：利用文本对齐方式对朗读文本和待评语音识别文本进行特征比较；S5：评分机制根据特征相似度对语音作出评价。2.根据权利要求1所述的基于特征融合的英语口语自动评分方法，其特征在于，所述步骤S1包括如下步骤：S1.1输入标准语音信号；S1.2输入标准朗读文本；S1.3输入英语缩略词及完整形式对照。3.根据权利要求1所述的基于特征融合的英语口语自动评分方法，其特征在于，所述步骤S2还包括如下步骤：S2.1提取梅尔倒谱参数特征；S2.2提取基频变化轨迹特征。4.根据权利要求3所述的基于特征融合的英语口语自动评分方法，其特征在于，所述步骤S2.1还包括如下步骤：S2.11将信号进行分帧，预加重和加汉明窗处理，然后进行短时傅里叶变换并得到其频谱；S2.12求出频谱平方，即能量谱，并用M个Mel带通滤波器进行滤波；由于每一个频带中分量的作用在人耳中是叠加的；因此将每个滤波器频带内的能量进行叠加，这时第k个滤波器输出功率谱x'(k)；S2.13将每个滤波器的输出取对数，得到相应频带的对数功率谱；并进行反离散余弦变换，得到L个MFCC系数，一般L取12～16个左右；MFCC系数为：S2.14将这种直接得到的MFCC特征作为静态特征，再将这种静态特征做一阶和二阶差分，得到相应的动态特征。5.根据权利要求1所述的基于特征融合的英语口语自动评分方法，其特征在于，所述步骤S3还包括如下步骤：利用梅尔倒谱参数特征比较方式以及基音变化轨迹特征比较方式对标准语音和待评语音的特征参数进行比较。6.根据权利要求5所述的基于特征融合的英语口语自动评分方法，其特征在于，所述利用梅尔倒谱参数特征比较方式包括：(1)假设参考标准语音的MFCC特征向量为M1＝[m1(1),m1(2),…,m1(T)],(T为参考语音的长度)；(2)待评价语音的MFCC特征向量为M2＝[m2(1),m2(2),…,m2(S)],(S为待评价语音的长度)；(3)使用改进的DTW算法，得到一条误差最小的对齐路径和对应的DTW距离；(4)该距离是待评价的输入语音与参考标准语音的MFCC特征参数的比较结果，反映了两段语音在内容上的发音差别。7.根据权利要求5所述的基于特征融合的英语口语自动评分方法，其特征在于，所述利用基音变化轨迹特征比较方式包括：(1)假设参考标准语音的基音特征向量为P1＝[p1(1)，p1(2)，…，p1(R)]，其一阶差分向量为P△1＝[p△1(1),p△1(2),…,p△1(R)](R为参考语音的长度)，P△1(n)＝|p1(n)-p1(n-1)|,n＝1,2,…,R,p1(0)＝0；(2)待评价的输入语音的基音特征向量为P2＝[p2(1),p2(2),…,p2(T)]，其一阶差分向量为P△2＝[p△2(1),p△2(2),…,p△2(T)](T为待评价语音的长度)，P△2(n)＝|p2(n)-p2(n-1)|,n＝1,2,…,T,p2(0)＝0；(3)基于上节得到的DTW最佳对齐路径，在对齐的位置进行基音特征比较；(4)求取基音的差距dp，与其变化量的差距△dp，来获得输入语音与参考标准语音的基音的相似度，即：dp＝|p1(n)-p2(m)|(2)△dp＝|△p1(n)-△p2(m)|(...

【专利技术属性】
技术研发人员：马磊，陈义学，陈霞，
申请(专利权)人：山东山大鸥玛软件股份有限公司，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人