当前位置: 首页 > 专利查询>霍桂馨专利>正文

一种便携式汉语声调学习机的语音处理方法技术

技术编号:3852487 阅读:182 留言:0更新日期:2012-04-11 18:40
该学习机除有播音员(称为标准的)读音可供复读外,也马上显示刚复读音的声调曲线。把复读的和标准的二条声调曲线一起显示,又有文字提示定量的差别;使你马上就能知道改进的方向和效果,以帮助提高学习效率。该语音处理方法,由三部分构成:信号的预处理,包括对使用者语音特点的界定和数据处理前的其它准备。按选带分析方法对信号作分析及处理结果显示。该语音处理方法,是为短促声音信号而设计的。在更变处理流程和设定参数后,它能以相当高的精度(可达到0.1音分或更高精度)用于钢琴的调律和判断节拍,音程,以及所产生的拍音频率等参数。当然,它也能用于其他乐器的音高及节拍等的分析或测量。

【技术实现步骤摘要】

本专利技术是汉语声调学习机的核心技术。涉及语音分析的
特别是 能供各种人群学习汉语声调使用,都能准确提取每次发音的基频频率值并给出 声调曲线,这一技术特点,也属于语音学这个

技术介绍
汉语是一种声调语言。这也是区别于印欧语系的突出特点之一。声调也是 人们学习汉语时遇到的一个大难点。要想征服它,只有反复的发音练习这一条 路,没有别的捷径。任何民族的任何人都是靠无数次的反复模仿大人的语音, 才学会说话的,谁都逃脱不了这一学习规律,人们为此所化学习的时间又都是 漫长的。但是,成年人没有幼儿的那种时间和条件学习语言,学习效率是他们 的主要矛盾。从目前人们学习汉语声调的方式看,自己多重复练习固然是一方 面,解决学习条件又是主要问题。大多是在跟着复读完了标准声调之后,自己 并不能知道这次复读的效果,到底是向标准声调靠近了,还是仍有很大差距 到 底存在什么问题,有那个地方更须要改进。这都直接影响到学习效果。而这些 问题,学习者自己本身不但无法知道,即使有老师在身边,教师也只能凭刚才 的听觉印象,笼统说下,不能明确的,具体的提出指导意见,甚至有时用语言 也很难说清楚该如何改进才能达到满意的效果。只有茫茫然的反复练习。现代技术的发展,为我们以往只凭感觉学习的老传统提供了发展和完善的 可能性。汉语声调学习机正是为人们提供了一个新的学习的方式,它能每次给 出你刚复读的声调曲线,并和标准的比较,使你一目了然的看到自己的进步和不足。它能随时在你身旁,绝对是个耐心无比的指导老师。你可以试探着各种 方法来使自己的声调曲线向标准靠近,使你能尽快掌握汉语的声调,提高学习 效率。当然,就像通过描汉字的红模子来学习写汉语字一样,这种技术只是为人 们提供了一个学习汉语声调的红模子。当然,也像对红模子的字体书写标准必 然会有比较高的要求一样,这种学习机对声调曲线的准确度也同样有严格要求。有研究表明,人们对1000hz的声音,能分辨出2hz的频率差别,这就为我们设计学习机中声调频率的提取精度提供了一个具体的参照标准。这也就告诉人们, 要构成一个声调学习机,它对声调中时间及基频频率的提取精度应该达到百分 之一以上的量级。回忆语音分析处理技术的发展历程,可以说,1952年,,Bdl实验室搞出的 语音控制英文打字机,是语音处理技术的成功的第一步。此后,相継发展了短 时变换,小波变换,矢量计算,自相关计算等各种语音处理技术,这期间,直 接结合在汉语应用上的,大概始于微软公司的台湾人李幵复,他搞成了一种汉 语声调判断的技术。其后,在美国的世界民族语言研究院搞出了汉语声调提取 器;也有美国和日本的公司各自推出了汉语声调的产品。而且这些产品都相继 销到了中国。但从国内引进单位所发表的文章,或是博士论文,或是著作来看, 都是围绕着声调提取或声调判断方面从事研究和写文章。既便是没有引进国外 产品的单位,大多也是围绕在声调的判断这个方面写文章(参见文献1)。产生 这种现象的原因之一,我们认为是由于受技术,特别是受国外产品的限制。从 它的说明书,操作手册等分析可看出,它们的频率提取误差应在几个赫兹(Hz) 的量级,频率的提取误差大,这就必然使声调曲线误差也加大,这对发音频率 比较低,调域又比较窄的声调描述就更显不妥。用这种技术制造汉语声调学习机就会对某些人不适用。这种频率提取技术精度不高的原因之一,是受到不确 定原理的限制,这点已被有些用户所认同(参见文献2)。我们认为,能判断声 调和准确地描述声调,对语音处理技术的要求标准是不同的,对数据处理的精 度要求自然也是不一样的。这说明,要搞成一个可供各种人群使用的汉语声调 学习机,照搬国外产品是不成的,必须在处理技术上有所突破和创新。
技术实现思路
本专利技术的目的,在于克服目前"汉语声调提取器"等各产品存在的缺欠, 提供一种可以突破不确定原理限制,能准确提取出时间和基频的语音处理技术。 本专利技术所提出的处理技术,有以下几个方面1) 不要求必须在线处理数据,但是,要保证能在, 一个可接受的, 时间差后,"马上"显示语音数据处理结果,也可称"立刻"显现声调 曲线。2) 记录下语音信号后,首先经过预处理环节,其目的在于A、 对记录语音信号"掐头""去尾",以去掉非稳定的语音信号;B、 初步分析,以确定使用者声音频率的范围;C、 通过自我复制,加大原始语音的数据量,以提高基频的提取精度。3) 用特定的数据处理流程和特定的数字式泸波器类型分析数据。4) 把基频频率随时间的变化值转换成声调曲线的对应值。5) 用不同色彩(或曲线形式)同时显示复读的和标准的二条声调曲 线,并用文字提示主要差别。具体实施例方式本专利技术依据虽然是用声调曲线比较的方法来指导练习,但我们处理时 是以折线形式来代替曲线的,这种处理方法在工程上是通用的,在实际中也完全 能满足使用要求。所以说明时,是以如何提取和制作出声调折线为目标来讲解 实施方法的。下面结合附图说明图1说明本专利技术的具体实施方式。它分为预处理,数据的运算, 结果的显示,三个大环节。现逐个环节说明实施方式。 1、 预处理(a) 掐头去尾把采集的语音信号,以时间为横轴,以声音幅度为纵轴,画出记录的语音波形图。若整个记录时间长度为T,则把语音开始和终了 的各百分之五的时间长度波形去掉,把剩下的语音记录(90%T)作为数 据处理的依据,只从这里提取声调信息。(b) 语音特点粗估因使用者发音频率不同,要对其语音频率范围有个粗 估。先将正式记录的语音信号通过带通滤波器(30-400hz),再用频谱分析(FFT)确定其所含频率成分,取其峰值突出的最低和最高频率值作为参 照点,考虑可能的误差,记下此二频率值的中心频率数值,供后面处理 步骤中选参数用。(c) 把正式语音记录长度,等分成十等份(份数可以变,但必须和标准音 声调曲线所分的份数一样),然后各段自我复制。复制方法为以开始点的幅值和斜率为参照点,从该段数据终点时间往 前推,即找到前面某时刻的幅值与斜率和参照点相同的点(或基本相同 的点),把二点重合,形成一个闭合的曲线(数据列)。如此重复。而重 复次数,或达到的数据长度大小,则以对测试结果所希望精度为依据。2、 数据的运算将经预处理环节的数据列再依次经过图2所示选带付里叶分析(ZOOM-FFT) 数据流程处理。首先让数据系列进入乘法器去和刚才记下的中心频率值的指数函数相乘,(实际操作中,经常是和正弦函数cos27Tf(rKAt,余弦函数sin 2TTf(rK,At,分别相乘再相加,式中f(T代表中心频率,K代表序号,At代表采样 时间间隔),这便得到一个新的复值序列,它使原频谱的坐标产生平移。再让其 经过数字低通滤波器,去掉选带外的频率成分,再以新的采样频率重新对经滤 波后的数据列采样(此新的采样频率与细化倍数有关,是原来采样频率的1/M, 此处M代表原有分析带宽与新的分析带宽之比,常称细化倍数)。把新采样得到 的数据列送去作付里叶分析(FFT)。则频谱图中幅值最大的频率分量为所求该 时段基频频率值。此时在负频率区所出现的复数结果都是有效的,因为这个计 算过程中所出现的负频率成分,实际上是低于中心频率的原始频率。 值得强调有三点, 一是此时的低通带宽虽然都是分析带宽的一半,但由于 使用者不同本文档来自技高网
...

【技术保护点】
一种便携式汉语声调学习机的语音信号处理方法,其特征在于 据有一般学习机的声调复读功能外,还同时能显示刚复读的和标准的二条声调曲线,既有形象化的表示差别,又有用文字方式提示二者之间的具体差别。

【技术特征摘要】

【专利技术属性】
技术研发人员:霍桂馨
申请(专利权)人:霍桂馨
类型:发明
国别省市:11[]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利