一种远程汉语教学中的说话人确认系统技术方案

技术编号:3044524 阅读:173 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种远程汉语教学中的说话人确认系统,包括用户注册、用户登录和汉语发音学习三大阶段,其中用户登录阶段又分为身份确认模块和用户判断模块,而汉语发音学习阶段则分为说话人确认模块和用户确认后处理模块。我们运用高斯混合模型-全局背景模型(GMM-UBM)处理方法将用户输入的语音在说话人确认模块中进行分析处理,确认出登陆的是否为正式注册用户。通过记录正式注册用户的相关学习信息,实现了一种以人为本,根据特定人特定的学习习惯和学习历史记录分配相应教学内容的教学方法。

【技术实现步骤摘要】

本专利技术涉及一种远程汉语教学身份确认系统,特别是设计一种远程汉语教学中的说话人确认系统,属于网络汉语教学及说话人确认

技术介绍
随着经济全球化的发展和中国经济的持续快速增长,世界各国对汉语学习的需求也在迅速增长,这种需求已经从学术和教学领域走到民间及政府层面,带动了一股学习汉语的热潮。据不完全统计,目前世界上学习汉语的人数已超过3000万人,有100个国家的2500余所大学和越来越多的中小学开设了汉语课程,中国汉语水平考试的考点遍布五大洲。搭建一个汉文化交流的平台,繁荣和发展世界汉语教学,推动汉语文化的广泛传播,让汉语更快地走向世界,正在成为越来越多炎黄子孙为之不懈奋斗的方向。 现有的用户身份确认主要方法有基于所有,如各种证件,不需要密码就能使用,易丢失、伪造,识别可靠性较低;基于所知,如静态口令,用户登录系统或使用某项功能时,需输入自己的用户名与口令,系统即进行身份识别,它方便、简洁,但易泄密、易破译。基于这种身份识别系统的远程汉语教学网站中对存储于计算机中用户的敏感信息保护不力,致使有些用户盗用他人的帐号进行学习,从而破坏了数据库中该用户的历史信息,为用户在前次学习的基础上进行下一次的学习带来了很大的麻烦,无法真正意义上实现以人为本循序渐进地学习,如何有效地防止他人盗用并根据特定人的特定学习习惯分配相应的学习内容,从而使用户在远程实现高效的汉语学习,成为目前研究学者广泛关注的课题。
技术实现思路
为了克服现有技术的不足,基于远程汉语教学这一特殊教学领域的相关特点。本专利技术提供一种远程汉语教学中的说话人确认系统。该系统有效地运用说话人确认的相应技术,实现了在用户进行汉语发音练习的同时,进行说话人确认的相关处理,确认是否与用户登录用的帐号相吻合,如果两者一致就记录该用户本次学习的信息,为该用户的下次学习提供方便,反之就不进行记录。 本专利技术的目的是通过下述技术方案实现的。 为了实现基于说话人确认的远程汉语教学身份确认系统,我们将整个系统分为用户注册、用户登录和汉语发音学习三大阶段,其中用户注册阶段为用户选择是否运用说话人确认机制进行身份确认,如果选择“是”则为该用户建立说话人的语料库,反之则不建立语料库在用户以后登陆时也不进行说话人确认工作;用户登录阶段又分为身份确认模块和用户判断模块;汉语发音学习阶段则分为说话人确认模块和用户确认后处理模块。 用户登录阶段是当一个用户进入系统时输入了系统数据库中存储的一个用户名和密码,系统就认定他为注册用户可以登陆系统进行汉语发音学习否则为非注册用户禁止进入系统。 汉语发音学习阶段的说话人确认模块处理过程主要包括两个阶段,即训练和确认。训练阶段即根据用户建立的语料库进行训练提取特征参数,系统据此建立每个使用者的模板和模型参数。确认阶段是由待识人说的语音经特征提取后与系统训练时产生的模板或模型参数进行比较。在说话人的确认中,取与测试音匹配距离最小的说话人模型所对应的说话人的模型的匹配是否小于一定阈值作出判断。 一、特征提取 1.Mel频率倒谱系数(MFCC)的计算过程 根据上面的评价结果,我们选取Mel频率倒谱系数及其相应变化形式作为系统的特征参数。首先,介绍一下倒谱的定义信号频谱模的自然对数的逆傅立叶变换。设语音信号为s(n),则其倒谱为 Mel倒谱在此基础上进行调整,着眼于人耳的听觉特性,利用人耳对声音的感知是非线性的,从人耳的角度来考虑,具有很强的抗噪性。 Mel-滤波器的设计体现了人耳滤波器的非线性感知,感知频率与实际频率的关系如下 Mel(f)=2595(1+f/700)其中,0≤f≤F(2) F为实际频率上限,这里取8KHz,滤波器的设计也体现了这种关系。 在一般的计算方法中,三角滤波器组所包含的滤波器的个数及每个滤波器的中心频率是固定不变的,这种方法没有考虑到不同说话人之间的语音特征,所以本专利技术在设计时,滤波器的个数是随着基频的变化而改变的,设p为滤波器的个数,f为基频,F为频率上限,则 p=5·Mel(F)/Mel(f) (3) 然后计算短时信号的能量谱 X(k)=|DFT(sw(n))|(4) 接着计算经过滤波器组后的相关系数m1,m2,....mn,则 其中Hi(k)表示第i个Mel三角滤波器,且i=1,2,...p,最终通过离散余弦变换得到MFCC滤波器系数为 其中i=1,2,...n,n是MFCC系数的阶数。将每一帧的系数相加后取均值 就可以得到最终的MFCC系数,其中M是帧的个数。 用这种算法得到的系数,虽然识别的精度非常高,但同样存在运行时间过长的缺点,主要是因为对每帧信号计算短时能量谱的运算量极大,例如,每帧128样本点,X(k)的计算要得到K=0...F(F为实际频率上限)的各点的值,这样每帧的运行时间是0.5秒,而要得到完整的语音样本(包含孤立词和语速、停顿等)至少需要200帧,即运算1分钟左右,这在实时监控中是不被允许的。 因此,必须改进算法,在这里可以采取跳跃的取点的方法,每隔10Hz计算一个X(k),即k=0,10,20...F; 然后令X(k+9)=X(k+8)=X(k+7)=...=X(k)(8) 这样做虽然会使识别率稍有下降,但仍然优于其他两种方法,大大提高了识别效率,同时也满足实时监控的要求。 2.MFCC系数的变换 为了增强对不同信道的鲁棒性,减少噪声影响,我们考虑映射原始MFCC特征到一个理想分布。首先,通过累积分布函数(CDF)匹配,它可以将给定的特征序列转换到某个CDF中以满足一个理想分布N(0,1)。这是一种将从原始特征X转换到变换特征 的非线性变换 我们取19维MFCC系数、19维MFCC系数的一阶差分作为全部特征序列。每个分量作为单独特征流处理。CDF由一个变化窗函数形成,它的值设为N。只有窗的中心是满足这个CDF的。给定发音窗中的特征按升序排列。设中心帧的范围为γ∈[1,N]。相应的CDF值为Φ=(r-1/2)/N,变换值 满足f(z)为标准归一化分布的概率密度函数 可以通过标准CDF表查得。 特征空间先由线性变换进行转换,然后用归一化分布进行全局CDF处理。由上面的特征转换方法可以得到一些变化的高斯结构。用短时窗进行特征变换处理,补偿信道和麦克风影响。具体处理过程如下 设原始特征集为X,D为特征维数。经过线性变换AD×D使特征转换为Y=AX。Y由概率分布的组合高斯分布描述 K为组合高斯分量数,D为特征维数,Ik,d是第k个组合高斯分布分量第d维的高斯数。ρk为第k个组合高斯分布分量先验值。πk,d,i为d维第k个组合高斯分布分量的第i个高斯的先验值。φ为单变量高斯分布的概率密度函数 均值μk,d,i,方差σk,d,i2,参数集为θ={A,ρk,πk,d,i,μk,d,i,σk,d,i}。 我们有yd=adx,ad为矩阵A第d行,X的概率分布为 EM算法用来重估参数集θ,基于x和θ的最大似然值,5次EM迭代即可(算法具体步骤将在下面具体介绍)。对比一般高斯无迭代过程,这是一种仅用全局转移矩阵A,基于与说话人无关的本文档来自技高网...

【技术保护点】
一种远程汉语教学中的说话人确认系统,其特征在于:该系统包含用户注册、用户登录和汉语发音学习三大阶段,其中:    (1)用户注册阶段为用户选择是否运用说话人确认机制进行身份确认,如果选择“是”则为该用户建立他个人的语料库,反之则不建立语料库在用户以后登陆时也不进行说话人确认工作;    (2)用户登录阶段又分为身份确认模块和用户判断模块,用户进入系统首页,即进入了用户登录阶段,在身份确认模块输入用户名和密码,通过用户判断模块进行处理用户名和密码一致则为注册用户,允许登陆系统,反之非注册用户拒绝登陆系统;    (3)汉语发音学习阶段则分为说话人确认模块和用户确认后处理模块;确认模块处理过程包括训练和确认两个阶段,训练过程是根据用户建立的语料库进行训练提取特征参数,系统据此确定模型参数;确认过程是由待识人说的语音经特征提取后与系统在训练时通过EM算法重估高斯混合模型(GMM)、全局背景模型(UBM)的模型参数,并进行比较,进而得到确认结果;若为正式注册用户就记录他的学习过程供下次使用,若为非正式注册用户就不记录相关学习信息。

【技术特征摘要】
1.一种远程汉语教学中的说话人确认系统,其特征在于该系统包含用户注册、用户登录和汉语发音学习三大阶段,其中(1)用户注册阶段为用户选择是否运用说话人确认机制进行身份确认,如果选择“是”则为该用户建立他个人的语料库,反之则不建立语料库在用户以后登陆时也不进行说话人确认工作;(2)用户登录阶段又分为身份确认模块和用户判断模块,用户进入系统首页,即进入了用户登录阶段,在身份确认模块输入用户名和密码,通过用户判断模块进行处理用户名和密码一致则为注册用户,允许登陆系统,反之非注册用户拒绝登陆系统;(3)汉语发音学习阶段则分为说话人确认模块和用户确认后处理模块;确认模块处理过程包括训练和确认两个阶段,训练过程是根据用户建立的语料库进行训练提取特征参数,系统据此确定模型参数;确认过程是由待识人说的语音经特征提取后与系统在训练时通过EM算法重估高斯混合模型(GMM)、全局背景模型(UBM)的模型参数,并进行比较,进而得到确认结果;若为正式注册用户就记录他的学习过程供下次使用,若为非正式注册用户就不记录相关学习信息...

【专利技术属性】
技术研发人员:苗振江明悦王琛
申请(专利权)人:北京交通大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利