一种离散点的语音基音识别装置及计算机存储介质制造方法及图纸

技术编号:29258464 阅读:22 留言:0更新日期:2021-07-13 17:31
本发明专利技术提供了一种离散点的语音基音识别装置,包括语音接收模块、去噪模块、基音粗算模块、基音精算模块和基音提取模块,所述语音接收模块接收外部的语音并转换成离散点信号,所述去噪模块对所述离散点信号进行去噪处理,所述基音粗算模块用于对离散点进行计算处理得到一个基音的频率范围,所述基音精算模块在所述频率范围内进行计算处理得到基音的频率值,所述基音提取模块根据所述频率值从语音中提取出基音。本发明专利技术先通过所述基音粗算模块对基音的频率范围进行缩小限定,再通过所述基音精算模块计算出准确的基音频率值,大大地减小了计算的复杂程度,提高识别效率。

【技术实现步骤摘要】
一种离散点的语音基音识别装置及计算机存储介质
本专利技术涉及语音识别
,尤其涉及一种离散点的语音基音识别装置。
技术介绍
基音是指发浊音时声带振动的周期,基音周期的估计称为基音检测,其目的是提取出与声带振动频率一致或尽可能相吻合的基音周期变化的轨迹曲线,是语音信号处理中最重要的特征参数之一,在旋律辨识、声调辨识、语音合成和语音编码等研究领域起着非常关键的作用。基音检测算法用于检测基音信号的方法。由于语音信号可视为一个动态非平稳随机过程,语音波形和声带振动的频率变化范围大且十分复杂。现在已经开发出了很多基音识别系统,经过我们大量的检索与参考,发现现有的识别系统有如公开号为KR100538987B1,KR1019970050104A和KR100538985B1所公开的系统,包括以下步骤:语音信号的采集输入、语音信号预处理、语音信号组合特征参数提取:即提取基音周期、LPCC、ΔLPCC、能量、能量的一阶差分、GFCC特征参数共同组合成多维特征向量、采用离散二进制粒子群优化算法对多维特征参数进行筛选、引入通用背景模型UBM训练得到说话人的声音模型、最后利用GMM-UBM模型对测试语音进行识别。但该系统计算量大,过程较复杂,效率较低,不能快速地识别出基音。
技术实现思路
本专利技术的目的在于,针对所存在的不足,提出了一种离散点的语音基音识别装置,为了克服现有技术的不足,本专利技术采用如下技术方案:一种离散点的语音基音识别装置,包括语音接收模块、去噪模块、基音粗算模块、基音精算模块和基音提取模块,所述语音接收模块接收外部的语音并转换成离散点信号,所述去噪模块对所述离散点信号进行去噪处理,所述基音粗算模块用于对离散点进行计算处理得到一个基音的频率范围,所述基音精算模块在所述频率范围内进行计算处理得到基音的频率值,所述基音提取模块根据所述频率值从语音中提取出基音;进一步的,所述语音接收模块内设有语音接收电路和模数转换单元,所述语音接收电路将语音振动转换成连续的电信号,所述模数转换单元将连续的电信号转换成离散的数字信号S(m);进一步的,所述去噪模块利用如下去噪公式进行去噪处理:其中,k0为去噪点;进一步的,所述去噪点k0通过去噪指数公式P(k)来确定:对于任意自然数k,P(k0)满足P(k0)<P(k);进一步的,所述基音粗算模块从数字信号中以所述去噪点为长度提取出若干分析帧,所述分析帧与分析窗函数计算得到若干分析窗数列:第i分析窗数列:其中,分析窗函数为:进一步的,将所述分析窗数列重新组合后获取峰值和谷值,相邻峰值与谷值之间的距离的最大值Lmax和最小值Lmin对应的时间为基音周期范围[Δtmin,Δtmax];进一步的,所述基音精算模块对处于区间[Lmin,Lmax]内的每个整数值j计算得到基音指数Qj,Qj中最小值对应的周期T为基音周期,对应的频率f为基音频率,进一步的,所述基音精算模块对数字信号进行傅里叶变换得到频谱系数X(k),根据所述频谱系数X(k)计算得到能量函数E(k),所述基音指数Qj为:其中,j为傅里叶变换时的点数;一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括一种离散点的语音基音识别装置程序,所述离散点的语音基音识别装置程序被处理器执行时,实现一种离散点的语音基音识别装置的步骤。本专利技术所取得的有益效果是:本专利技术通过去噪模块先去除原始信号中的噪音,未后续的基音识别排除了干扰,保证了语音的纯度,提高了基音识别的准确性,利用基音粗算模块快速地缩小基音频率所处的范围,是提高效率的关键,基音精算模块在所求的的范围内进行高精度计算,最终准确地确认基音频率,整个过程大大地减少了计算量。附图说明从以下结合附图的描述可以进一步理解本专利技术。图中的部件不一定按比例绘制,而是将重点放在示出实施例的原理上。在不同的视图中,相同的附图标记指定对应的部分。图1为整体结构框架示意图。图2为基音频率计算流程示意图。图3为二分法寻找去噪点示意图。图4为分析窗数列示意图。图5为本专利技术计算量效果对比示意图。具体实施方式为了使得本专利技术的目的.技术方案及优点更加清楚明白,以下结合其实施例,对本专利技术进行进一步详细说明;应当理解,此处所描述的具体实施例仅用于解释本专利技术,并不用于限定本专利技术。对于本领域技术人员而言,在查阅以下详细描述之后,本实施例的其它系统.方法和/或特征将变得显而易见。旨在所有此类附加的系统.方法.特征和优点都包括在本说明书内.包括在本专利技术的范围内,并且受所附权利要求书的保护。在以下详细描述描述了所公开的实施例的另外的特征,并且这些特征根据以下将详细描述将是显而易见的。本专利技术实施例的附图中相同或相似的标号对应相同或相似的部件;在本专利技术的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或组件必须具有特定的方位,以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。实施例一。一种离散点的语音基音识别装置,包括语音接收模块、去噪模块、基音粗算模块、基音精算模块和基音提取模块,所述语音接收模块接收外部的语音并转换成离散点信号,所述去噪模块对所述离散点信号进行去噪处理,所述基音粗算模块用于对离散点进行计算处理得到一个基音的频率范围,所述基音精算模块在所述频率范围内进行计算处理得到基音的频率值,所述基音提取模块根据所述频率值从语音中提取出基音;所述语音接收模块内设有语音接收电路和模数转换单元,所述语音接收电路将语音振动转换成连续的电信号,所述模数转换单元将连续的电信号转换成离散的数字信号S(m);所述去噪模块利用如下去噪公式进行去噪处理:其中,k0为去噪点;所述去噪点k0通过去噪指数公式P(k)来确定:对于任意自然数k,P(k0)满足P(k0)<P(k);所述基音粗算模块从数字信号中以所述去噪点为长度提取出若干分析帧,所述分析帧与分析窗函数计算得到若干分析窗数列:第i分析窗数列:其中,分析窗函数为:将所述分析窗数列重新组合后获取峰值和谷值,相邻峰值与谷值之间的距离的最大值Lmax和最小值Lmin对应的时间为基音周期范围[Δtmin,Δtmax];所述基音精算模块对处于区间[Lmin,Lmax]内的每个整数值j计算得到基音指数Qj,Qj中最小值对应的周期T为基音周期,对应的频率f为基音频率,所述基音精算模块对数字信号进行傅里叶变换得到频谱系数X(k),根据所述频谱系数X(k)计算得到能量函数E(k),所述基音指数Qj为:其中,j为本文档来自技高网...

【技术保护点】
1.一种离散点的语音基音识别装置,包括语音接收模块、去噪模块、基音粗算模块、基音精算模块和基音提取模块,所述语音接收模块接收外部的语音并转换成离散点信号,所述去噪模块对所述离散点信号进行去噪处理,所述基音粗算模块用于对离散点进行计算处理得到一个基音的频率范围,所述基音精算模块在所述频率范围内进行计算处理得到基音的频率值,所述基音提取模块根据所述频率值从语音中提取出基音。/n

【技术特征摘要】
1.一种离散点的语音基音识别装置,包括语音接收模块、去噪模块、基音粗算模块、基音精算模块和基音提取模块,所述语音接收模块接收外部的语音并转换成离散点信号,所述去噪模块对所述离散点信号进行去噪处理,所述基音粗算模块用于对离散点进行计算处理得到一个基音的频率范围,所述基音精算模块在所述频率范围内进行计算处理得到基音的频率值,所述基音提取模块根据所述频率值从语音中提取出基音。


2.如权利要求1所述的一种离散点的语音基音识别装置,所述语音接收模块内设有语音接收电路和模数转换单元,所述语音接收电路将语音振动转换成连续的电信号,所述模数转换单元将连续的电信号转换成离散的数字信号S(m)。


3.如上述权利要求之一所述的一种离散点的语音基音识别装置,所述去噪模块利用如下去噪公式进行去噪处理:

其中,k0为去噪点。


4.如上述权利要求之一所述的一种离散点的语音基音识别装置,所述去噪点k0通过去噪指数公式P(k)来确定:



对于任意自然数k,P(k0)满足P(k0)<P(k)。


5.如上述权利要求之一所述的一种离散点的语音基音识别装置,所述基音粗算模块从数字信号中以所述去噪点为长...

【专利技术属性】
技术研发人员:陈夏盛林荔珊
申请(专利权)人:深圳市品索科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1