一种基于梅尔频谱一阶导数的语音信号特征学习方法技术

技术编号:19347838 阅读:42 留言:0更新日期:2018-11-07 15:59
本发明专利技术提出了一种基于梅尔频谱一阶导数的语音信号特征学习方法,该方法包括,以数据驱动为基础,输入疾病语音样本和健康语音样本,对所有的样本进行分针,提取梅尔频谱对时间的一阶导数,利用交叉验证方法分别对疾病样本和健康样本划分其训练集和测试集,采用聚类算法为健康嗓音与病态嗓音分别训练字典,分别对两类的训练集和测试集中每一样本的DMS进行线性编码并采用最小值池化方法进行池化从而获得最终特征。该有监督方法充分利用标签信息,所学习到的特征具有更好的鉴别力。

A speech signal feature learning method based on first derivative of Mel spectrum

The invention proposes a speech signal feature learning method based on the first derivative of Meier spectrum. The method includes: input disease speech samples and healthy speech samples based on data drive, minute all samples, extract the first derivative of Meier spectrum to time, and use cross-validation method to separate diseases. Disease samples and healthy samples are divided into training set and test set. Clustering algorithm is used to train dictionaries for healthy voice and sick voice respectively. Linear coding is performed for each sample of training set and test set, and minimum pooling method is used to pool the final features. The supervised method makes full use of label information and has better discriminating characteristics.

【技术实现步骤摘要】
一种基于梅尔频谱一阶导数的语音信号特征学习方法
本专利技术涉及人工智能语音识别领域,尤其涉及基于梅尔频谱一阶导数的语音信号特征学习方法。
技术介绍
通过声音来诊断疾病的方法,近年来因为其有简单、方便、快捷且无需损伤受诊人机体和无需侵入式检查的的优势受到了广泛关注。研究表明语音信号中包括丰富的生物医学信息,比如可以从说话语音变得很轻,并最终发展为单调,无起伏的声音,判断个人可能患有帕金森症。当个体有甲状腺疾病时,会导致激素分泌失调,甚至会导致声带瘫痪或麻痹,从而会使声音变得低沉,有时甚至会像耳语。通过对语音中携带的生物信息特征进行提取与分析,可以有效的分析个人隐藏的疾病。中医中也有通过病人的声音和呼吸、嗳气和咳嗽等生理现象来诊断疾病的方法。但是这种诊断依赖于医师个人的感官和长期行医过程中积累的宝贵经验,而这种经验是不可复制的。同时,人对声音的理解和接收存在心理和生理的双重影响,不同人的个体差异、不同人的年龄差异和长时间诊病带来的疲累等因素,都使得以人为诊断主体的声音诊断,带有不可忽视的主观色彩。随着计算机技术和电子科技的发展,可以实现对语音信号的数字化和标准化采集,同时利用信号处理技术本文档来自技高网...

【技术保护点】
1.一种基于梅尔频谱一阶导数的语音信号特征学习方法,其特征在于,该方法包括如下步骤:步骤一、输入疾病类语音样本和健康类语音样本;步骤二、对所有的样本进行分帧,语音端点检测,提取梅尔频谱对时间的一阶导数DMS,并对每个样本用矩阵Ai表示;步骤三、利用交叉验证方法分别对疾病类样本和健康类样本划分其训练集和测试集;步骤四、将疾病类训练集索引对应的所有DMS矩阵Ai按列堆积为矩阵P,并对该矩阵进行球面Kmeans聚类,聚类中心组成的字典记为Dp ,将健康类训练集索引对应的所有DMS矩阵Ai按列堆积为矩阵H,并对该矩阵进行球面Kmeans聚类,聚类中心组成的字典记为Dh;步骤五、分别对两类的训练集和测试...

【技术特征摘要】
1.一种基于梅尔频谱一阶导数的语音信号特征学习方法,其特征在于,该方法包括如下步骤:步骤一、输入疾病类语音样本和健康类语音样本;步骤二、对所有的样本进行分帧,语音端点检测,提取梅尔频谱对时间的一阶导数DMS,并对每个样本用矩阵Ai表示;步骤三、利用交叉验证方法分别对疾病类样本和健康类样本划分其训练集和测试集;步骤四、将疾病类训练集索引对应的所有DMS矩阵Ai按列堆积为矩阵P,并对该矩阵进行球面Kmeans聚类,聚类中心组成的字典记为Dp,将健康类训练集索引对应的所有DMS矩阵Ai按列堆积为矩阵H,并对该矩阵进行球面Kmeans聚类,聚类中心组成的字典记为Dh;步骤五、分别对两类的训练集和测试集中每一样本的DMS进行线性编码并采用最小值池化方法进行池化,并将疾病类的训练集和测试...

【专利技术属性】
技术研发人员:朱成华卢光明武克斌张大鹏钟德才
申请(专利权)人:浙江中点人工智能科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1