一种提取病理语音MFCC特征用于人工智能分析的标准化采样方法技术

技术编号:25443383 阅读:151 留言:0更新日期:2020-08-28 22:30
本发明专利技术公开了一种提取病理语音MFCC特征用于人工智能分析的标准化采样方法,包括下述步骤:采集语音数据,按《汉语普通话语音评估系统词表》的顺序进行82的汉语普通话音节的语音数据采集;对采集的语音数据进行剪辑处理,完成82个音节的剪辑工作,然后分类归档;对剪辑后的82个音节进行信号提取,通过指定预加重、分帧、加窗、快速傅里叶变换、三角带通滤波器以及扩展分帧处理,提取每个音节的MFCC特征;将处理后的数据构成MFCC语音库。本发明专利技术通过标准化流程方法,提取每个音节特定MFCC特征,构建一种数字化、标准化、结构化的语音特征数据库,可以服务于病理语音特征大数据和人工智能分析的各项应用,提高了病理语音研究与应用的客观性和效率。

【技术实现步骤摘要】
一种提取病理语音MFCC特征用于人工智能分析的标准化采样方法
本专利技术属于智能识别的
,具体涉及一种提取病理语音MFCC特征用于人工智能分析的标准化采样方法。
技术介绍
目前国内语言障碍人数逐年增加,其中构音障碍导致的沟通交流障碍严重影响患者重返社会。虽然我国构音障碍患者数量重多,但是2016年林强和卢建亮的调查研究发现目前的评估方法并不能满足治疗师对精准言语康复的需求。国内康复科和言语康复机构应用较多的仍然是以主观听觉评价和(或)需要主观判断的量表为主要评估手段,缺乏客观性和效率。此外,我国言语治疗师数量严重不足、大多数非本专业毕业,诊断评估能力偏弱。近年来,基于人工智能技术的快速发展,如人工神经网络(ArtificialNeuralNetwork,ANN)和深度学习(DeepLearning,DL)在正常语音分析与识别、语言教育、智能语音导医等方面的应用研究取得了一些成果。国务院《新一代人工智能发展规划》中涉及医疗方面提出应加快人工智能创新应用,研究声学参数在构音障碍的特征性与规律性,并基于人工神经网络诊断和分类各种本文档来自技高网...

【技术保护点】
1.一种提取病理语音MFCC特征用于人工智能分析的标准化采样方法,其特征在于,包括下述步骤:/n采集语音数据,按《汉语普通话语音评估系统词表》的顺序进行82的汉语普通话音节的语音数据采集;/n对采集的语音数据进行剪辑处理,完成82个音节的剪辑工作,然后分类归档,其中单元音28个,复合元音23个,辅音21个,序列语音10个;/n对剪辑后的82个音节进行信号提取,通过指定预加重、分帧、加窗、快速傅里叶变换、三角带通滤波器以及扩展分帧处理,提取每个音节的MFCC特征;/n将处理后的数据构成结构化语音库,MFCC语音库的标准化数据具体为:/n82个音节样本的每一个音节数据经预处理后的语音样本共有4种M...

【技术特征摘要】
1.一种提取病理语音MFCC特征用于人工智能分析的标准化采样方法,其特征在于,包括下述步骤:
采集语音数据,按《汉语普通话语音评估系统词表》的顺序进行82的汉语普通话音节的语音数据采集;
对采集的语音数据进行剪辑处理,完成82个音节的剪辑工作,然后分类归档,其中单元音28个,复合元音23个,辅音21个,序列语音10个;
对剪辑后的82个音节进行信号提取,通过指定预加重、分帧、加窗、快速傅里叶变换、三角带通滤波器以及扩展分帧处理,提取每个音节的MFCC特征;
将处理后的数据构成结构化语音库,MFCC语音库的标准化数据具体为:
82个音节样本的每一个音节数据经预处理后的语音样本共有4种MFCC特征分别存在于A、B、C、D四组,分别是13帧、19帧、13+3帧、19+3帧的标准化MFCC数据;
结构化数据库:将A、B、C、D四组数据入库元音与声调子库,并分列标记为元音与声调子库A组、元音与声调子库B组、元音与声调子库C组和元音与声调子库D组。


2.根据权利要求1所述提取病理语音MFCC特征用于人工智能分析的标准化采样方法,其特征在于,所述《汉语普通话语音评估系统词表》包括3个分表4个主要部分,即单元音声调部分、序列语言部分、复合元音部分和辅音部分;
所述单元音与声调部分,由同一或对等音位的声母与单韵母的1-4声调组成的24个单音节汉语普通话词,包括:八,拔,把,爸,逼,鼻,笔,必,都,读,赌,杜,哥,隔,葛,个,波,脖,跛,簸,淤,鱼,雨和玉;
序列语言部分,由声母和韵母组成数字1-10的汉语普通话词,包括:1,2,3,4,5,6,7,8,9和10;
复合元音部分,由同一或对等音位的声母与复韵母1声调组成的23个单音节汉语普通话词,包括:掰,虾,包,瓜,丢,龟,杯,憋,标,边,班,宾,奔,帮,冰,崩,锅,光,关,沟,乖,靴和兄;
辅音部分,由21种声母与单韵母a或i的1声调组成的21个单音节汉语普通话词,包括:八,趴,搭,他,嘎,咖,机,七,知,吃,资,疵,发,哈,西,师,思,日,妈,那和拉。


3.根据权利要求1所述提取病理语音MFCC特征用于人工智能分析的标准化采样方法,其特征在于,在进行语音数据采集时,受试者口唇距录音机为9cm-11cm,语速自然平稳、音量适中,将词表重复录2次;
所述预加重具体为:
将处理后的语音信号通过下式的高通滤波器进行处理:
H(Z)=1-μz-1
上式中μ的值为0.9-1.0。


4.根据权利要求1所述提取病理语音MFCC特征...

【专利技术属性】
技术研发人员:牟志伟江晨银柯慧明潘正祥温晓宇陈亮朱凌燕
申请(专利权)人:广州科慧健远医疗科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1